
Arbeiten mit SQL und Graphen-Datenbanken
Digitale Texteditionen, Sprachdatenbanken oder Videorepositories enthalten Millionen von miteinander verknüpften Datenelementen. Textarchive z.B. enthalten Dokumente die aus strukturierten Texten bestehen, die selber wieder aus Teilen, Kapiteln, Absätzen usw. bestehen, mit bestimmten linguistischen, historischen oder anderen Bezügen.
Datenbanken wurden für große Datenbestände entwickelt. Sie bieten sichere Speicherung, schnelle Datenextraktion über standardisierte Anfragesprachen und Mehrbenutzerbetrieb. Darüberhinaus haben sie Schnittstellen sowohl zu Standardanwendungen wie Excel, R oder SPSS als auch zu Programmiersprachen wie perl, Python, Java usw.
Das relationale Datenmodell sieht die Welt als eine Menge verknüpfter Tabellen, die mit einfachen relationalen Operatoren durchsucht werden können. Die Sprache SQL ist der de facto Standard für relationale Datenbanken -- ihre Englisch-artige Abfragesprache ist einfach zu lernen, und ihre deklarative Natur erlaubt es anzugeben, welche Daten man bekommen möchte, und nicht, wie man sie berechnen muss.
Obwohl das relationale Datenmodell immer noch das meistverbreitete Modell ist wurden neue Ansätze entwickelt die versprechen, für bestimmte Anwendungen besser geeignet zu sein. Ein besonders interessanter Ansatz ist das Graphen-Datenmodell. Dieses Datenmodell sieht die Welt als Knoten mit Eigenschaften, die durch benannte Beziehungen verknüpft sind. Die Abfragesprache Cypher ist eine quasi-graphische Sprache, und Abfragen sind einfache Graphendarstellungen des gesuchten Datenbankinhalts.
Im Kurs werde ich eine Datenbank für die Analyse gesprochener Sprache entwickeln. Diese Datenbank wird zuerst als relationale Tabellen in SQL implementiert, und wir lernen komplexte Abfrage in SQL auszudrücken. In der zweiten Hälfte des Kurses werden wir diese Datenbank als Graphen-Datenbank implementieren. Ziel des Kurses ist, dass Sie die jeweiligen Eigenschaften der beiden Datenmodelle kritisch evaluieren können und abschätzen können, welches Datenmodell für welche Anwendung besser geeignet ist.
2022
2021
2020
2019
- Home
- Schedule
- Workshops
- Lectures (public)
- Projects (public)
- Poster Session (public)
- Panel (public)
- Teasers (public)
- Cultural programme
- Experts
- Lecturers
- Scientific Committee
- Important dates (new)
- Application
- Scholarships (updated)
- Participation fees
- Refund policy
- T-Shirts
- Child care
- Birthday thoughts












