Digitale Annotation und Analyse literarischer Texte mit CATMA 6.0
Ziele des Workshops
Der Workshop bietet Studierenden der Literaturwissenschaft eine Einführung in CATMA 6.0 (Computer Assistet Text Markup and Analysis; www.catma.de), ein open-source-Tool, entwickelt und gehostet an der Universität Hamburg seit 2008. CATMA wird derzeit von über 60 Forschungsprojekten weltweit genutzt. Die neue Version 6.0 ist ein Teil des DFG-Projektes forTEXT (www.fortext.net) und bietet eine einzigartige Kombination dreier Komponenten:
-
CATMA unterstützt kollaborative Annotation und Analyse – ein Text oder ein Textkorpus kann individuell oder auch von einer Gruppe Studierender oder Forscher gemeinsam erforscht werden.
-
CATMA unterstützt eine explorative, non-deterministische Praxis der Textannotation – ein diskursiver, diskursorientierter Ansatz zur Textannotation, der auf Forschungspraktiken hermeneutischer Disziplinen basiert, bildet das grundlegende konzeptionelle Modell.
-
CATMA integriert Textannotation und -analyse in einer webbasierten Arbeitsumgebung – wodurch es möglich wird, die Identifikation textueller Phänomene mit ihrer Erforschung iterativ und nahtlos zu kombinieren.
Was CATMA von anderen digitalen Annotationsmethoden unterscheidet, ist sein ‘undogmatischer’ Ansatz: Das System schreibt weder vordefinierte Annotationsschemata oder -regeln vor, noch zwingt es die Nutzer*innen starre ja/nein-, richtig/falsch-Taxonomien auf Texte anzuwenden (auch wenn es präskriptivere Schemata ebenfalls ermöglicht). Mit anderen Worten lädt CATMAs Logik Nutzer*innen ein, die Vielfältigkeit und Facettenreichheit textlicher Phänomene in Bezug auf ihre individuellen Bedürfnisse zu explorieren: Sie können eigene individuelle Tagsets erzeugen, erweitern und kontinuierlich modifizieren. Wenn also eine Textpassage mehr als eine Interpretation zulässt, gibt es nichts, dass multiple oder sogar widersprüchliche Annotationen verhindert.
Trotz seiner Flexibilität erzeugt CATMA keine ideosynkratischen Annotationen: Sämtliche Markup-Daten können im TEI/XML-Format exportiert und in anderen Texten weiterverwendet werden. Weil CATMA ein sehr intuitives Tool ist, bietet es sich vor allem für Geisteswissenschaftler*innen mit wenig technischem Vorwissen an: Das GUI erlaubt einen schnellen Start und CATMAs Query Builder (eine dialogbasierte Schritt-für-Schritt-Vorrichtung) hilft, komplexe Informationen aus Texten zu filtern, ohne dass man eine Query-Language erlernen muss. Zudem werden CATMAs leicht nutzbare Distant-Reading-Funktionen kontinuierlich weiterentwickelt – die aktuelle Version 6.0 bietet beispielsweise eine Anzahl automatischer Annotationsroutinen, darunter die Identifikation grundlegender narrativer Eigenschaften.
In unserem Workshop werden wir die grundlegenden Annotations- und Analysefunktionalitäten von CATMA vorstellen und zeigen, wie diese mit dem automatischen Erzeugen von Annotationen kombiniert werden können.
In Woche 1 werden die Teilnehmer*innen in einem hands-on-Ansatz Schritt für Schritt durch den gesamten Ablauf der CATMA-basierten Texterforschung geführt, wobei sie an ihren eigenen Texten/Projekten arbeiten können:
-
Vom Textupload zur grundlegenden Texterforschung,
-
dann zur Annotation und Spezifikation von Annotationskategorien,
-
von dort zu kombinierten Abfragen von Textdaten und Annotationen
-
und schließlich zur visuellen Darstellung der Analyseergebnisse.
Teilnehmer*innen werden das Tool praktisch erproben können: Sie werden ihre eigenen Texte annotieren, ihre eigenen Tagsets erstellen, Tags definieren und Annotationsguidelines erstellen. Wir möchten außerdem gerne zu einer kritischen Diskussion von CATMAs Designkomponenten sowie genereller Bedarfe, die aus den jeweiligen Interessensfeldern an Textanalysetools gestellt werden, einladen.
In Woche 2 werden wir die Arbeit in CATMA mit anderen Methoden und Tools für die digitale Textanalyse (wie NER, (S)NA und SA [1]) in zwei Schritten kombinieren. Beginnen werden wir mit der visuellen Erforschung und Verfeinerung der Annotationen, die in der ersten Woche erstellt wurden. Zweitens werden wir spezifische Möglichkeiten eruieren, wie CATMA in den Projekten der einzelnen Teilnehmer*innen zur Anwendung kommen kann: Was sind die Ergebnisse der CATMA-basierten Annotation und Analyse der Texte sowie der Erstellung von genuin projektspezifischen Tagsets? Alle Teilnehmer*innen werden eine kurze Präsentation ihres Projektes mit anschließender Diskussion geben.
Zielgruppe des Workshops
Primär wird CATMA von Literaturwissenschaftlern und Studierenden der Literaturwissenschaft genutzt. Zudem kann der Workshop für folgende Gruppen von Interesse sein:
-
Geisteswissenschaftler aller Disziplinen, die sich mit Textanalyse beschäftigen (mit und ohne Erfahrung in der digitalen Textanalyse)
-
Softwareentwickler in den Geisteswissenschaften, die sich für non-deterministische Textanalyse und automatische Annotation interessieren.
Teilnehmer*innen brauchen kein Vorwissen über digitale Textannotation und können mit ihren eigenen Laptops und ihren eigenen digitalisierten Texten arbeiten. CATMA läuft auf Laptops und PCs (WIndows, Unix, MacOS) mit aktuellen Webbrowsern (MS Explorer oder Edge, Firefox, Chrome, Safari) mit einer Maus oder einem Touchpad. Touchscreen-Geräte werden derzeit noch nicht unterstützt (das ist jedoch geplant).
–––––––––––––
[1] Named Entity Recognition (NER), (Social) Network Analysis ((S)NA) und Sentiment Analysis (SA).