06.206.513 S Korpuslinguistik: Referenz- und Parallelkorpora des Polnischen und anderer Slavinen

Veranstaltungsdetails

Lehrende/r: Prof. Dr. Marek Lazinski; Dr. Andreas Meger

Veranstaltungsart: Seminar

Anzeige im Stundenplan: 06.206.513

Credits: 6,0

Unterrichtssprache: Deutsch

Min. | Max. Teilnehmerzahl: - | -

Voraussetzungen / Organisatorisches:
ACHTUNG!
Das Seminar richtet sich an M.A.-Studierende mit A-, B- oder C-Sprache POLNISCH und an B.A.-Studierende mit B-/C-/D- bzw. F1-/F2-/F3-Sprache POLNISCH (ab dem 4. Semester!).


Es findet ab dem 14.06.2013 jeweils freitags als Blockseminar statt.

Voraussetzung für die Vergabe der ECTS-Punkte ist die regelmäßige und aktive Teilnahme sowie Abgabe einer kommentierten Probedatei und/oder einer Seminararbeit.

Weitere organisatorische Einzelheiten werden zu Beginn der Veranstaltung mitgeteilt.

Inhalt:

Schwerpunktthema dieser Veranstaltung für Studierende im fortgeschrittenen Studium ist der Entwurf eines polnisch-deutschen Parallelkorpus. Zuerst werden die Grundbegriffe und Methoden der Korpuslinguistik mit den Beispielen aus dem Nationalkorpus des Polnischen und verschiedenen slavischen Parallelkorpora vorgestellt. Die Teilnehmer werden dabei praxisnah mit den Problemen der Erstellung eines solchen Korpus konfrontiert, wobei allgemein zugängliche Programme zur Textverarbeitung und Textrecherche eingesetzt werden.

Seminarplan:

14.06. A) Grundzüge der Korpuslinguistik: Eine Forschungsrichtung oder nur ein Werkzeug zur Beispiellieferung? B) Wörter und Zahlen. Von der Bibel, Stylometrie und Frequenzwörterbüchern zu Korpora. Korpussuche im Polnischen Nationalkorpus (Narodowy Korpus Języka Polskiego).

28.06. Englischsprachige Korpora: British National Corpus, Bank of English, Corpus of Contemporary American English. Deutschsprachige Korpora: DeReKO und DWDS. Anwendungen der Korpusanalyse.

05.07. A) Das Polnische Nationalkorpus (Narodowy Korpus Języka Polskiego) und seine Vorgänger. Das Frequenzwärterbuch des Polnischen. Schlüsselwörter, polnische Wörter des Tages und Wörter des Jahres. B) Slavische Korpora. Das Tschechische Nationalkorpus und das Russische Nationalkorpus. Polnische Korpora. Parallelkorpora: Interkorp, ParaSOL, Das Polnisch-Russische Parallelkorpus.

12.07. Grundvoraussetzungen für ein Korpus: Größe und Struktur. Text-Tagging und Desambiguierung. TAKIPI-Tagger für das Polnische. Programme zur Zusammenstellung und zum Durchsuchen eines Korpus: Smyrna, AntConc, Text Stat, ParaConc.

19.07. Zusammenstellung eines provisorischen deutsch-polnischen Korpus.

Empfohlene Literatur:
(vorläufige Auswahl; im Semesterapparat / Bibliothek)


  • Lemnitzer, L. / Zinsmeister, H. (2010): Korpuslinguistik. Eine Einführung. Tübingen. 2. Aufl.
  • Lüdeling, A. / Kytö, M. (Hgg.) (2008): Corpus linguistics. An international handbook. Berlin. Bd. 1-2.
  • Przepiórkowski, A. u.a. (ed.) (2010): Narodowy Korpus Języka Polskiego. Warszawa. (unter: www.nkjp.pl).
  • Prace Filologiczne LXIII, 2012. (Band zu den Parallelkorpora der Slavinen).
  • Łaziński, M. (2012): „Wyraz kobieta w kolokacjach korpusowych. Konotacje dawniejsze i współczesne”. In: Karwatowska, M., Szpyra-Kozłowska, J. (Red.):  Oblicza płci. Język – kultura – edukacja. Lublin. S. 73-85.
  • Wynne, M.: Developing Linguistic Corpora. A Guide to Good Practice. (unter: http:icar.univ-lyon2.frecole_thematiquecontacidocumentsBaude/wynne.pdf).


Vorgestellte oder besprochene Korpora:

  • http://corpora.ids-mannheim.de (Deutsch)
  • http://www.hnk.ffzg.hr/default.htm (Kroatisch)
  • http://wortschatz.uni-leipzig.de/wort-des-tages (Wörter des Tages - Deutsch)
  • http://www.dwds.de (Deutsch)
  • http://www.fidaplus.net/ (Slowenisch)
  • http://korpus.juls.savba.sk/ (Slowakisch)
  • http://www.korpus.cz; http://www.korpus.cz/interkorp (Tschechisch, parallel)
  • http://www.mimuw.edu.pl/polszczyzna/pl196x/  (Polnisch der 1960er Jahre)
  • http://www.mova.info/corpus.aspx  (Ukrainisch)
  • http://www.nkjp.pl  (Polnisch)
  • http://parasol.unibe.ch/ (Slavisch parallel)
  • http://www.pol-ros.polon.uw.edu.pl  (Polnisch-Russisch)
  • http://www.ruscorpora.ru/  (Russisch)


Benutzte Programme zur Korpuserstellung und –durchsuchung:

  • http://www.antlab.sci.waseda.ac.jp/antconc_index.html (einfacher Konkordanzer für beliebige Sprachen; frei zugänglich)
  • http://smyrna.danieljanus.pl   (polnischer Konkordanzer Smyrna mit der Desambiguierung der polnischen Flexion; frei zugänglich)
  • http://neon.niederlandistik.fu-berlin.de/textstat/  (einfacher Konkordanzer für beliebige Sprachen; frei zugänglich)
  • http://www.athel.com/para.html   (Paraconc - Konkordanzer für Parallelkorpora)

Termine
Datum Von Bis Raum Lehrende/r
1 Fr, 14. Jun. 2013 11:20 14:30 N.311 Hörsaal Prof. Dr. Marek Lazinski; Dr. Andreas Meger
2 Fr, 21. Jun. 2013 11:20 14:30 N.311 Hörsaal Prof. Dr. Marek Lazinski; Dr. Andreas Meger
3 Fr, 28. Jun. 2013 11:20 14:30 N.311 Hörsaal Prof. Dr. Marek Lazinski; Dr. Andreas Meger
4 Fr, 5. Jul. 2013 11:20 14:30 N.311 Hörsaal Prof. Dr. Marek Lazinski; Dr. Andreas Meger
5 Fr, 12. Jul. 2013 11:20 14:30 N.311 Hörsaal Prof. Dr. Marek Lazinski; Dr. Andreas Meger
6 Fr, 19. Jul. 2013 11:20 14:30 N.311 Hörsaal Prof. Dr. Marek Lazinski; Dr. Andreas Meger
Übersicht der Kurstermine
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
Lehrende/r
Dr. Andreas Meger
Prof. Dr. Marek Lazinski