Jump to Navigation

"Culture & Technology" European Summer University in Digital Humanities
University of Leipzig

Digitale Annotation und Analyse literarischer Texte mit CATMA 6.0

Ziele des Workshops

Der Workshop bietet Studierenden der Literaturwissenschaft eine Einführung in CATMA 6.0 (Computer Assistet Text Markup and Analysis; www.catma.de), ein open-source-Tool, entwickelt und gehostet an der Universität Hamburg seit 2008. CATMA wird derzeit von über 60 Forschungsprojekten weltweit genutzt. Die neue Version 6.0 ist ein Teil des DFG-Projektes forTEXT (www.fortext.net) und bietet eine einzigartige Kombination dreier Komponenten:

  • CATMA unterstützt kollaborative Annotation und Analyse – ein Text oder ein Textkorpus kann individuell oder auch von einer Gruppe Studierender oder Forscher gemeinsam erforscht werden.

  • CATMA unterstützt eine explorative, non-deterministische Praxis der Textannotation – ein diskursiver, diskursorientierter Ansatz zur Textannotation, der auf Forschungspraktiken hermeneutischer Disziplinen basiert, bildet das grundlegende konzeptionelle Modell.

  • CATMA integriert Textannotation und -analyse in einer webbasierten Arbeitsumgebung – wodurch es möglich wird, die Identifikation textueller Phänomene mit ihrer Erforschung iterativ und nahtlos zu kombinieren.

Was CATMA von anderen digitalen Annotationsmethoden unterscheidet, ist sein ‘undogmatischer’ Ansatz: Das System schreibt weder vordefinierte Annotationsschemata oder -regeln vor, noch zwingt es die Nutzer*innen starre ja/nein-, richtig/falsch-Taxonomien auf Texte anzuwenden (auch wenn es präskriptivere Schemata ebenfalls ermöglicht). Mit anderen Worten lädt CATMAs Logik Nutzer*innen ein, die Vielfältigkeit und Facettenreichheit textlicher Phänomene in Bezug auf ihre individuellen Bedürfnisse zu explorieren: Sie können eigene individuelle Tagsets erzeugen, erweitern und kontinuierlich modifizieren. Wenn also eine Textpassage mehr als eine Interpretation zulässt, gibt es nichts, dass multiple oder sogar widersprüchliche Annotationen verhindert.

Trotz seiner Flexibilität erzeugt CATMA keine ideosynkratischen Annotationen: Sämtliche Markup-Daten können im TEI/XML-Format exportiert und in anderen Texten weiterverwendet werden. Weil CATMA ein sehr intuitives Tool ist, bietet es sich vor allem für Geisteswissenschaftler*innen mit wenig technischem Vorwissen an: Das GUI erlaubt einen schnellen Start und CATMAs Query Builder (eine dialogbasierte Schritt-für-Schritt-Vorrichtung) hilft, komplexe Informationen aus Texten zu filtern, ohne dass man eine Query-Language erlernen muss. Zudem werden CATMAs leicht nutzbare Distant-Reading-Funktionen kontinuierlich weiterentwickelt – die aktuelle Version 6.0 bietet beispielsweise eine Anzahl automatischer Annotationsroutinen, darunter die Identifikation grundlegender narrativer Eigenschaften.

In unserem Workshop werden wir die grundlegenden Annotations- und Analysefunktionalitäten von CATMA vorstellen und zeigen, wie diese mit dem automatischen Erzeugen von Annotationen kombiniert werden können.

In Woche 1 werden die Teilnehmer*innen in einem hands-on-Ansatz Schritt für Schritt durch den gesamten Ablauf der CATMA-basierten Texterforschung geführt, wobei sie an ihren eigenen Texten/Projekten arbeiten können:

  • Vom Textupload zur grundlegenden Texterforschung,

  • dann zur Annotation und Spezifikation von Annotationskategorien,

  • von dort zu kombinierten Abfragen von Textdaten und Annotationen

  • und schließlich zur visuellen Darstellung der Analyseergebnisse.

Teilnehmer*innen werden das Tool praktisch erproben können: Sie werden ihre eigenen Texte annotieren, ihre eigenen Tagsets erstellen, Tags definieren und Annotationsguidelines erstellen. Wir möchten außerdem gerne zu einer kritischen Diskussion von CATMAs Designkomponenten sowie genereller Bedarfe, die aus den jeweiligen Interessensfeldern an Textanalysetools gestellt werden, einladen.

In Woche 2 werden wir die Arbeit in CATMA mit anderen Methoden und Tools für die digitale Textanalyse (wie NER, (S)NA und SA [1]) in zwei Schritten kombinieren. Beginnen werden wir mit der visuellen Erforschung und Verfeinerung der Annotationen, die in der ersten Woche erstellt wurden. Zweitens werden wir spezifische Möglichkeiten eruieren, wie CATMA in den Projekten der einzelnen Teilnehmer*innen zur Anwendung kommen kann: Was sind die Ergebnisse der CATMA-basierten Annotation und Analyse der Texte sowie der Erstellung von genuin projektspezifischen Tagsets? Alle Teilnehmer*innen werden eine kurze Präsentation ihres Projektes mit anschließender Diskussion geben.

Zielgruppe des Workshops

Primär wird CATMA von Literaturwissenschaftlern und Studierenden der Literaturwissenschaft genutzt. Zudem kann der Workshop für folgende Gruppen von Interesse sein:

  • Geisteswissenschaftler aller Disziplinen, die sich mit Textanalyse beschäftigen (mit und ohne Erfahrung in der digitalen Textanalyse)

  • Softwareentwickler in den Geisteswissenschaften, die sich für non-deterministische Textanalyse und automatische Annotation interessieren.

Teilnehmer*innen brauchen kein Vorwissen über digitale Textannotation und können mit ihren eigenen Laptops und ihren eigenen digitalisierten Texten arbeiten. CATMA läuft auf Laptops und PCs (WIndows, Unix, MacOS) mit aktuellen Webbrowsern (MS Explorer oder Edge, Firefox, Chrome, Safari) mit einer Maus oder einem Touchpad. Touchscreen-Geräte werden derzeit noch nicht unterstützt (das ist jedoch geplant).

–––––––––––––

[1] Named Entity Recognition (NER), (Social) Network Analysis ((S)NA) und Sentiment Analysis (SA).

  • English
  • The Name
  • Background
  • Mission
  • Audience
  • Workshops
  • Lectures
  • Projects
  • Round Tables
  • Working Languages
  • Impressum
  • Kontakt

2022

  • Home
  • Important dates
  • Application
  • Workshops
  • Experts
  • ConfTool
  • Scholarships etc.
  • Participation fees
  • Moodle
  • Scientific Committee

2021

  • Home
  • ESU DH C&T 2021
  • Important dates 2021
  • ConfTool
  • Programme
  • Workshops
  • Experts
  • Application
  • Lectures
  • Scholarships
  • Participation fees
  • Scientific Committee

2020

  • Home
  • Important dates
  • Schedule
  • Workshops
  • Lectures (public)
  • Panel (public)
  • Experts
  • Lecturers
  • Application
  • Scholarships
  • Participation fees

2019

  • Home
  • Schedule
  • Workshops
  • Lectures (public)
  • Projects (public)
  • Poster Session (public)
  • Panel (public)
  • Teasers (public)
  • Cultural programme
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates (new)
  • Application
  • Scholarships (updated)
  • Participation fees
  • Refund policy
  • T-Shirts
  • Child care
  • Birthday thoughts

2018

  • Home
  • Schedule
  • Workshops
  • Lectures (public)
  • Projects (public)
  • Posters (public)
  • Panel discussion (public)
  • Teasers (public)
  • Cultural Programme
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Refund policy
  • T-Shirt
  • The logo riddle
  • Child Care

2017

  • Home
  • Schedule
  • Workshops
  • Lectures (public)
  • Projects (public)
  • Panel (public)
  • Teasers / Specials
  • Cultural Programme
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Refund Policy
  • T-Shirt
  • Flyer
  • Child care

2016

  • Home
  • Schedule
  • Workshops
  • Lectures (public)
  • Projects & Posters (public)
  • Panel
  • Teasers (public)
  • Slams
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Refund policy
  • Flyer
  • Child Care

2015

  • Home
  • Schedule
  • Workshops
  • Lectures
  • Projects
  • Posters
  • Panel
  • Teaser / Special sessions
  • Workshop Slams
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Refund policy
  • Child Care
  • T-Shirt 2015
  • Flyer and Poster
  • Sponsorship
  • Questions

2014

  • Home
  • Schedule
  • Workshops
  • Lectures
  • Projects
  • Panel
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Child care
  • Flyer
  • Sponsorship

2013

  • Home
  • Schedule
  • Workshops
  • Lectures
  • Projects & Posters
  • Panel
  • Experts
  • Lecturers
  • Project Presenters
  • Scientific Committee
  • Important dates
  • Application
  • Bursaries
  • Fees
  • Refund Policy
  • T-Shirt
  • Certificate
  • Sponsorship

2012

  • Home
  • Schedule
  • Workshops
  • Lectures
  • Project Presentations
  • Poster Slam & Session
  • Panel Discussions
  • Excursion
  • Lecturers
  • Certificate
  • Scientific Committee
  • Important Dates
  • Duration & Structure
  • Application
  • Registration Fees
  • Bursaries

2010

  • Home
  • Schedule
  • Workshops
  • Instructors
  • Lectures
  • Round table
  • Important dates
  • Application
  • Fees
  • Bursaries

2009

  • Home
  • Schedule
  • Workshops
  • Instructors
  • Lectures
  • Project presentations
  • Round tabel

Leipzig

  • Contact
  • Mailinglist
  • Host
  • Venue
  • Accommodation (updated)
  • City Map
  • Arrival
  • Weather

Experiences

What the ESU means to me
ESU 2022 (Dariah-EU)
ESU 2021 (Dariah-EU)
ESU 2019 Experiences (DARIAH-EU)
ESU 2018 Experiences (CLARIN-D)

ESU in the Media

ESU DH C&T in Zenodo
ESU 2017 (CLARIN-D Blog)
CLARIN-D at ESU 2015 (YouTube) english
CLARIN-D ESU 2015 (YouTube) deutsch
Mephisto 97.6 10.07.13
Campus Online 10.08.2012
Mephisto 97.6 26.07.2010
infotvleipzig 26.07.2010
In India 03.09.2010

Reviews

ESU 2021 (DiCultHer) How to Move a Summer University in Digital Humanities Online and Keep It Human
INFOtheka: Review of ESU DH 2009
INFOtheka: Review of ESU DH 2012
Infoclio.ch: Review of ESU DH 2013

Publications

Multimodal Analysis of “well”

Users

  • Login

DAAD

 

CLARIN ERIC

 

Sächsische Akademie der Wissenschaften

 

Universität Leipzig

 

BMBF

 

Electronic Textual Cultures Lab at the University of Victoria & Digital Humanities Summer Institute

CLARIN-D

 

DARIAH-EU

 

Slovenian Language Technologies Society (SDJT)

 

Parthenos

International Centre/AAA

 

Computational Humanities

 

Oxygen XML Editor

 

Universitätsbibliothek