Tübinger russische Korpora

  Hauptseite des SFB
  TUSNELDA
  Projekt B1
English   Russkij

Russische Korpora in Tübingen

Im Rahmen des Teilprojekts B1 des SFB 441 bieten wir die Möglichkeit, mehrere russische Textkorpora online zu durchsuchen. Zur Auswahl stehen eine einfache Suche, sowie eine komplexe Suche, die zusätzliche Korpora und erweiterte Suchmöglichkeiten bietet. Falls Sie über weitere elektronisch gespeicherte Texte verfügen sollten, so würden wir uns sehr freuen,wenn Sie uns diese Texte zur Verfügung stellen könnten, um sie ebenfalls online (nur für wissenschaftliche Zwecke) zugänglich zu machen.

Kodierung

Für Eingabe und Ausgabe können Sie zwischen drei Kodierungen der russischen Texte wählen: unserer lateinischen Transliteration (siehe Transliterationstabelle) und zwei kyrillischen Kodierungen (KOI 8 und Windows). Wenn eine kyrillische Kodierung gewählt wurde, kann die Suchanfrage jedoch auch in lateinischer Transliteration eingegeben werden.

Einfache Suche

Für die einfache Suche stehen das Uppsala-Korpus moderner russischer Texte und ein von Projekt B1 laufend erweitetes Korpus von Interviewtexten zu Verfügung.
Kodierung:

Komplexe Suche

Für die komplexe Suche stehen neben dem Uppsala- und dem Interviewkorpus zahlreiche weitere Korpora zur Verfügung. Diese Korpora gehören drei Kategorien an:
  • Zeitgenössische Texte (überwiegend Publizistik). Hierzu zählt auch das Uppsalakorpus, aus dem hier die literarischen und publizistischen Texte auch getrennt durchsucht werden können.
  • Literatur des 20. Jahrhunderts
  • Literatur des 19. Jahrhunderts
Die komplexe Suche verwendet das Suchprogramm CQP, das am Institut für maschinelle Sprachverarbeitung der Universität Stuttgart entwickelt wurde (weitere Informationen zu CQP).
Kodierung:

Getaggte (morphologisch annotierte) Korpora

Mehrere Korpora sind mit morphologischen Annotationen (Tags) verfügbar. Das Tagging wurde mit einem stochastischen Tagger durchgeführt (TnT, von Thorsten Brants). Die Tags können angezeigt werden, und es kann sowohl nach Tags als auch nach Wortformen gesucht werden.
Kodierung:

Das Uppsala-Korpus

Das Uppsala-Korpus moderner russischer Texte wurde am Slavischen Institut der Universität Uppsala unter Leitung von Prof. Lennart Lönngren erstellt. Wir danken herzlich für die Erlaubnis, das Korpus verwenden und hiermit online abfragbar machen zu dürfen. Die Rechte am Korpus liegen beim Autor. Die Daten des Korpus dürfen nur für wissenschaftliche Zwecke verwendet werden; eine kommerzielle Verwendung ist nicht erlaubt. Eine kurze Beschreibung des Korpus findet sich hier. Auf der Basis des Korpus wurde ein Frequenzwörterbuch (Lönngren, Lennart (ed.), 1993. Chastotnyj slovar' sovremennogo russkogo jazyka. Uppsala) erstellt. 

Interviewtexte

Das sich in kontinuierlichem Aufbau befindende Korpus russischer Interviewtexte wird von Mitarbeitern des Teilprojekts B1 (Anja Gattnar, Sebastian Bücking und Jennifer Haberhauer) zusammengestellt und annotiert. Die Interviews sind den folgenden russischen Zeitschriften, die frei auf dem Internet zugänglich sind, entnommen: Argumenty i Fakty, Argumenty i Fakty Vladivostok, Art Petersburg, Birzha Truda, Echo Moskvy, Inostranec, Interbiznes, Kievskie Novosti, Literaturnaja Gazeta, Mir Deneg, Muzykal´naja gazeta, Na Dne, Natali, Novaja Gazeta, Novosti Peterburga, Ogonek, Otdyxaj, Psixologicheskaja Gazeta, Pjat´ uglov, Ptchela, Segodnja, Strannik, Vasha Gazeta, Vedomosti, Vestnik. Das Korpus umfasst  Interviews der genannten Zeitschriften ab dem Jahrgang 1996. Sie sind den Themenbereichen Politik und Gesellschaft, Wirtschaft, Musik, Literatur, Jugend und Sport zuzuordnen. 
Verfasserin: Anja Gattnar. Modifiziert von Michael Betsch; Stand 27. Mai 2004.