Bildmaschinen: Theorie und Praxis des erklärbaren maschinellen Lernens in den Digital Humanities
Obschon Text noch immer das primäre Forschungsobjekt der Digital Humanities ist, spielen Bilder seit mindestens zehn Jahren eine immer wichtigere Rolle in der Forschungspraxis. Besonders Ergebnisse aus der digitalen Kunstgeschichte haben dabei gezeigt, dass die Bedeutung der Bilder für die Digital Humanities über die Digitalisierung und Zugänglichmachung von Kunstwerken in digitalen Datenbanken hinausgeht: Im digitalen Bild treffen sich Digital Humanities und künstliche Intelligenz. Die Möglichkeit der automatisierten Klassifizierung und sogar Produktion von Bildern verweist dabei auf eine grundsätzliche Frage beider Disziplinen: Wie repräsentieren selbstlernenden Systeme Realität? Das Forschungsgebiet des erklärbaren maschinellen Lernens (interpretable machine learning) nimmt sich dieser Frage an und versucht die black box des maschinellen Lernens der Interpretation zugänglich zu machen.
Der zweiwöchige Workshop ist eine Einführung in die Theorie und Praxis des erklärbaren maschinellen Lernens. Die erste Woche kann dabei als Einführung in das Forschungsgebiet verstanden werden, die sich vor allem der Diskussion und Reproduktion von neusten Ergebnissen der Forschung widmet, mit einem Schwerpunkt im Bereich vorurteilsbehafteter selbstlernender Systeme (siehe z.B.: http://gendershades.org/). Die zweite Woche hat einen Praxisschwerpunkt: Teilnehmerinnen und Teilnehmer erlernen den Umgang mit PyTorch (https://pytorch.org/), einer der wichtigsten Bibliotheken für maschinelles Lernen, und setzen konkrete Experimente mit Bilddatensätzen um. Während die erste Woche keinerlei technisches Wissen voraussetzt, sind für die zweite Woche elementare Programmierkenntnisse erforderlich. Konkret setzen sich die zwei Wochen des Workshops ungefähr folgendermaßen zusammen:
Erste Woche
- Forschungsstand der künstlichen Intelligenz
- Erklärbares maschinelles Lernen und künstliche Intelligenz
- Wie ist es, eine Maschine zu sein? Phänomenologie des maschinellen Lernens
- Vom Text zum Bild: "kontinuierliche" und "diskrete" Datensätze
- ImageNet: ein mängelbehafteter und dennoch allgegenwärtiger Datensatz (und seine Geschichte)
- Vorurteile in selbstlernenden Systemen
Zweite Woche
- Einführung in PyTorch
- Einführung in kunsthistorische Datensätze
- Klassifizierung von Bildenr mit convolutional neural networks
- Produktion von Bildern mit generative adversarial networks
- Feature visualization und Deep Dream: Visualisierung von neuronalen Netzen
- Experimente mit CNNs und GANs: Interpretation von und mit Millionen von Bildern