Datenformate linguistischer Ressourcen

  Hauptseite des SFB
  SFB Korpora
English

TUSNELDA-XML

XML-Format zur Repräsentation von Baumbanken, Satzsammlungen und Lexika. Entwickelt im Projekt C1. Siehe TUSNELDA Dokumentation.

NEGRA Export

Spaltenbasiertes Textformat zur Repräsentation von Baumbanken. Ursprünglich im NEGRA Projekt des SFB 378 (Universität des Saarlandes) entwickelt.

Export-XML

XML Version von NEGRA Export, entwickelt im Projekt A1. Zusätzliche Informationen und Werkzeuge zur Konversion von NEGRA Export in Export-XML und umgekehrt sind hier verfügbar. Eine Erweiterung von Export-XML, Anaphora-XML, unterstüzt die Repräsentation referentieller Relationen zwischen den Knoten in einer Baumbank.

DEREKO-XML

XML-Repräsentation, die an der Universität Tübingen als Teil des DEREKO Projekts entwickelt wurde. Das Format ist ähnlich aufgebaut wie Export-XML, aber mit besonderem Augenmerk auf die Minimierung von Speicherplatz entworfen und daher besonders gut für sehr große Korpora geeignet. Darüberhinaus unterstützt das Format die ambige annotation von Wortarten und morphplogischer Analysen.


Zuletzt aktualisiert am 11.03.2009