Lehrende/r: Dr. Reinhard Rapp
Veranstaltungsart: Übung
Anzeige im Stundenplan: 06.FUE.0591
Credits: 3,0
Unterrichtssprache: Deutsch
Min. | Max. Teilnehmerzahl: - | 15
Prioritätsschema: Senatsrichtlinie zzgl. Bevorzugung höherer Fachsemester Zulassung gemäß Richtlinie über den Zugang zu teilnahmebeschränkten Lehrveranstaltungen vom 07. März 2007. Nähere Informationen hierzu entnehmen Sie bitte www.info.jogustine.uni-mainz.de/senatsrichtlinieÜber die Senatsrichtlinie hinaus werden bei der Platzvergabe für diese Veranstaltung Studierende höherer Fachsemester bevorzugt berücksichtigt.
Inhalt: Seit moderne Computersysteme die Verarbeitung sehr großer Mengen maschinenlesbarer Texte ermöglichen, hat die Korpuslinguistik auch im Übersetzungsbereich einen großen Aufschwung genommen. Da sie den realen Gebrauch von Sprache repräsentieren, sind (insbesondere mehrsprachige) Korpora sehr hilfreich für die lexikographische Arbeit bei der Erstellung von Wörterbüchern wie auch für die Erarbeitung fachspezifischer Terminologie und für die Bestimmung von Übersetzungsäquivalenten. Im Bereich der maschinellen Übersetzung werden große Mengen mehrsprachiger Texte dazu verwendet, selbst lernende Übersetzungssysteme zu trainieren. Diese analysieren inner- und zwischensprachliche Regelmäßigkeiten und reproduzieren die gefundenen Muster beim Übersetzen. In der Lehrveranstaltung werden einige bekannte Korpora (z.B. Europarl und British National Corpus) vorgestellt und gängige (oftmals Web-basierte) Analysewerkzeuge am Computer erprobt. Weiterhin werden übliche Verfahren der Korpusverarbeitung in Theorie und Praxis behandelt: Dazu gehören die morphologische Analyse, das Syntax-Parsing, die semantische Annotierung und das sogenannte Alignment, also die automatische Zuordnung von Übersetzungssegmenten bei mehrsprachigen Korpora. Diese Verfahren bilden die Grundlage für moderne Anwendungen wie z.B. Diktiersysteme, maschinelle Übersetzung, Sprachverstehen, Sprachproduktion, Frage-Antwort-Systeme usw.