Workshops
Die Sommeruniversität bietet verschiedene und die ganze Woche über parallel laufende Workshops zu in den digitalen Geisteswissenschaften eine zentrale Rolle spielenden Methoden und Technologien an. Jeder Workshop umfasst insgesamt 15 Sitzungen oder 30 SWS. Die Zahl der TeilnehmerInnen eines Workshops ist auf 15 begrenzt. Jede Teilnehmerin / jeder Teilnehmer kann nur an einem Workshop teilnehmen. Die Teilnehmenden sind gehalten, eigene Materialien und Projekte mitzubringen, an denen der Lehrstoff unmittelbar angewandt und erprobt werden kann.
Unter Berücksichtigung der vorliegenden Motivationsschreiben finden die folgenden Workshops statt:
Christiane Fritze / Malte Rehbein: Transkription und Beschreibung von Primärquellen mit Hilfe von TEI-konformem XML
- Kurzeinführung in XML; erste gemeinsame Übungen mit einer XML-verarbeitenden Software(Oxygen Editor)
- XML im Detail
- Einführung in das System der TEI
- Kodierung von gedruckten Primärquellen nach den TEI-Richtlinien
- Vertiefung bestimmter TEI-Module (je nach Bedarf, z.B. TEI Kapitel "11 Representation of Primary Sources", TEI Kapitel "16 Linking, Segmentation, and Alignment")
- Erstellen eines eigenen Schemas mit TEI-Roma
- Zugriff auf XML-Dokumente mit (XPath)
- Einführung in XML-Verarbeitung (XSLT) inklusive Einführung in HTML und CSS
- Bilddigitalisierung von Primärquellen
- Ausblick: Druckvorlage von XML-Dokumenten (XSL-FO)
- Konversion von bisherigen Projektarbeiten (z.B. in Word) nach XML mit regulären Ausdrücken
Alejandro Bia: Elektronisches Publizieren unter Anwendung von XML und TEI
- Einführung in die XML Technologie
- Das Modellieren der Struktur von Dokumenten mit Hilfe von DTDs und Schemas
- Textauszeichnung mit Hilfe von XML und TEI
- Die Wiedergabe von Text mit Hilfe von XSLT (die Übertragung von XML in andere Ausgabeformate)
- Weitere Fragen: Engineering der XML Produktion, digitale Bibliotheken, Präservierung digitaler Daten, etc.
Jan Rybicki: Textanalyse in den digitalen Geisteswissenschaften. Methoden und Tools
Je nachdem, welche Vorkenntnisse die TeilnehmerInnen mitbringen, werden in dem Workshop die folgenden Themen behandelt: Grundlagen von elektronischen Texten, Quellen elektronischer Texte, OCR, Korrektur, Auszeichnung sprachlicher Phänomene, einfache quantitative Verhältnisse (verschiedene Längen und Häufigkeiten), Reichtum des Wortschatzes, Listen der häufigsten Wörter, Multivariate Analyse, Werkzeuge (besonders Hoover Tabellenkalkulationswerkzeuge und JGAAP).
Die im Workshop benutzen Texte werden vom Lehrenden bereit gestellt; falls nötig, werden die von TeilnehmerInnen benutzten Korpora je nach Bedarf und Vorhandensein (online oder anders) einbezogen. Bei den Texten wird es sich um literarische und mehrsprachige Texte handeln. Darunter werden Originale und Übersetzungen sein.
Stefan Th. Gries: Korpus und Korpusanalyse in der Sprach- und Literaturwissenschaft
Dieser Kurs ist eine praktische Einführung in die quantitative Korpuslinguistik. Die folgenden Inhalte werden behandelt:
- Einführung: was sind Korpora, welche Arten von Korpora gibt es, warum sollte man korpuslinguistische Verfahren verwenden, Grundlagen der Korpuskompilierung;
- Einführung in R: Funktionen, Argumente, Datenstrukturen;
- Textverarbeitung 1: laden und durchsuchen von Korpusdateien sowie ersetzen in Korpusdateien;
- Textverarbeitung 2: suchen und ersetzen mit regulären Ausdrücken in Korpusdateien;
- korpuslinguistische Anwendungen: Häufigkeitslisten, einfache Konkordanzen, fortgeschrittene Konkordanzen;
- Grundlagen statistischer Evaluation;
- weiterführende Beispiele.
Es werden einfache Textdateien, Korpora mit SGLM/XML-Annotation, Chat-Dateien aus CHILDES Korpora und Unicodedateien verwendet. Fallbeispiele stammen u.a. aus den Bereichen Morphologie, Syntax, Erst / Zweitspracherwerb.
Die unterschiedlichen Vorkenntnisse werden in allen Workshops berücksichtig.