Die TEI von ihren Grundlagen bis zur aktuellen Bedeutung – Wie passen die TEI und heutige Anforderungen an die Untersuchung von Sprache zusammen?
Die Text Encoding Initiative, 1987 ins Leben gerufen, ist der erste große Versuch, einen konsistenten Satz an Richtlinien zur Annotation von Sprachdaten zu entwickeln. Zu Beginn des Projektes haben dessen GründerInnen eine Reihe von Prinzipien erarbeitet, die der weiteren Entwicklung der TEI zugrunde liegen sollten und die noch heute, 30 Jahre später, Gültigkeit für das Design von Annotationsschemata besitzen.
In meinem Vortrag werde ich die Ursprünge und Leitgedanken bei der Entwicklung der TEI und deren zugrundeliegende Prinzipien beschreiben. Darüber hinaus werde ich fragen, wie die TEI nicht nur die Annotation geisteswissenschaftlicher Daten beeinflusst hat, sondern auch die Annotation linguistischer Detailphänomene, die relevant sind für das maschinelle Lernen im Bereich der Automatischen Sprachverarbeitung. Ebenfalls diskutiere ich die Rolle von Annotationen in dem Bereich von Deep Learning und Big Data, der vielfach dazu verleitet zu denken, manuelle oder semi-manuelle Annotation sei nicht länger notwendig oder zumindest deutlich seltener relevant für komplexe sprachliche Untersuchungen. Abschließend werde ich meine Gedanken über die heutige Stellung der TEI mit Ihnen teilen, auf die Bedeutung von Annotationsprojekten für aktuelle Sprachanalysen eingehen und Vorschläge für zukünftige Entwicklungsmöglichkeiten unterbreiten.