Jump to Navigation

"Culture & Technology" European Summer University in Digital Humanities
University of Leipzig

Text Mining con Canonical Text Services

Il Canonical Text Service è un servizio che genera passi testuali identificabili con citazioni espresse mediante URN. Il servizio consente di creare CTS URNs per qualunque passo in un documento.

I dati possono essere richiesti usando GET requests fornite in un URL. Ogni richiesta deve contenere un parametro che specifica la funzione CTS da usare. Parametri specifici - come lo URN - sono aggiunti come addizionali GET parameters.

Per esempio il CTS riportato di seguito fornisce il contesto testuale del capitolo 3 del libro della Genesi della Bibbia di Re Giacomo: http://cts.informatik.uni-leipzig.de/pbc/cts/?request=GetPassage&urn=urn:cts:pbc:bible.parallel.eng.kingjames:1.3

Maggiori informazioni sul CTS si possono ottenere qui.

Il workshop intende presentare il protocollo CTS a nuovi utenti e fornir loro gli strumenti per creare nuovi esempi di citazioni CTS basate su dati preparati in anticipo. Alla fine dei primi due giorni, ogni partecipante avrà un esempio CTS funzionante e disponibile online.

Una volta che gli esempi CTS sono settati e funzionanti, i partecipanti impareranno a condividere i dati testuali con altri utenti e a clonarli tra diversi esempi del sistema. Saranno anche introdotti diversi strumenti e metodi, compresi due strumenti per l’allineamento testuale, un ambiente per il CTS text mining e un workflow per la citation analysis.

Non sono richieste capacità di programmazione. Graphic management tools per lavorare con esempi CTS sono disponibili. Il lavoro di text mining e di citation analysis richiede una comprensione di base della linea di comando (UNIX). I partecipanti lavoreranno su virtual machines. Si richiede che i participanti abbiamo famigliarità con le linee guida di marcatura dei testi TEI/XML. Questa parte, infatti, non rientra nella didattica del corso.

I partecipanti possono portare i propri dati in modo da usarli durante il workshop. I dati devono essere codificati secondo la codifica UTF-8 e usare un generico "TEI/XML div-type notation" simile a questo esempio. Testi che non sono in formato TEI/XML non sono al momento supportati. I partecipanti devono inoltre assicurarsi che i propri dati non violino copyright e licenze.

I partecipanti avranno accesso a programmi e dati aperti che sono parte dell’infrastruttura CTS dell’Università di Lipsia, compresi documenti del Parallel Bible Corpus, del Deutsche Textarchiv, del TED Talk Transcripts e molti altri. Si invitano i partecipanti a usare questi dati anche dopo la fine del workshop.

  • English
  • Deutsch
  • The Name
  • Background
  • Mission
  • Audience
  • Workshops
  • Lectures
  • Projects
  • Round Tables
  • Working Languages
  • Impressum
  • Kontakt

2022

  • Home
  • Important dates
  • Application
  • Workshops
  • Experts
  • ConfTool
  • Scholarships etc.
  • Participation fees
  • Moodle
  • Scientific Committee

2021

  • Home
  • ESU DH C&T 2021
  • Important dates 2021
  • ConfTool
  • Programme
  • Workshops
  • Experts
  • Application
  • Lectures
  • Scholarships
  • Participation fees
  • Scientific Committee

2020

  • Home
  • Important dates
  • Schedule
  • Workshops
  • Lectures (public)
  • Panel (public)
  • Experts
  • Lecturers
  • Application
  • Scholarships
  • Participation fees

2019

  • Home
  • Schedule
  • Workshops
  • Lectures (public)
  • Projects (public)
  • Poster Session (public)
  • Panel (public)
  • Teasers (public)
  • Cultural programme
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates (new)
  • Application
  • Scholarships (updated)
  • Participation fees
  • Refund policy
  • T-Shirts
  • Child care
  • Birthday thoughts

2018

  • Home
  • Schedule
  • Workshops
  • Lectures (public)
  • Projects (public)
  • Posters (public)
  • Panel discussion (public)
  • Teasers (public)
  • Cultural Programme
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Refund policy
  • T-Shirt
  • The logo riddle
  • Child Care

2017

  • Home
  • Schedule
  • Workshops
  • Lectures (public)
  • Projects (public)
  • Panel (public)
  • Teasers / Specials
  • Cultural Programme
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Refund Policy
  • T-Shirt
  • Flyer
  • Child care

2016

  • Home
  • Schedule
  • Workshops
  • Lectures (public)
  • Projects & Posters (public)
  • Panel
  • Teasers (public)
  • Slams
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Refund policy
  • Flyer
  • Child Care

2015

  • Home
  • Schedule
  • Workshops
  • Lectures
  • Projects
  • Posters
  • Panel
  • Teaser / Special sessions
  • Workshop Slams
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Refund policy
  • Child Care
  • T-Shirt 2015
  • Flyer and Poster
  • Sponsorship
  • Questions

2014

  • Home
  • Schedule
  • Workshops
  • Lectures
  • Projects
  • Panel
  • Experts
  • Lecturers
  • Scientific Committee
  • Important dates
  • Application
  • Scholarships
  • Fees
  • Child care
  • Flyer
  • Sponsorship

2013

  • Home
  • Schedule
  • Workshops
  • Lectures
  • Projects & Posters
  • Panel
  • Experts
  • Lecturers
  • Project Presenters
  • Scientific Committee
  • Important dates
  • Application
  • Bursaries
  • Fees
  • Refund Policy
  • T-Shirt
  • Certificate
  • Sponsorship

2012

  • Home
  • Schedule
  • Workshops
  • Lectures
  • Project Presentations
  • Poster Slam & Session
  • Panel Discussions
  • Excursion
  • Lecturers
  • Certificate
  • Scientific Committee
  • Important Dates
  • Duration & Structure
  • Application
  • Registration Fees
  • Bursaries

2010

  • Home
  • Schedule
  • Workshops
  • Instructors
  • Lectures
  • Round table
  • Important dates
  • Application
  • Fees
  • Bursaries

2009

  • Home
  • Schedule
  • Workshops
  • Instructors
  • Lectures
  • Project presentations
  • Round tabel

Leipzig

  • Contact
  • Mailinglist
  • Host
  • Venue
  • Accommodation (updated)
  • City Map
  • Arrival
  • Weather

Experiences

What the ESU means to me
ESU 2022 (Dariah-EU)
ESU 2021 (Dariah-EU)
ESU 2019 Experiences (DARIAH-EU)
ESU 2018 Experiences (CLARIN-D)

ESU in the Media

ESU DH C&T in Zenodo
ESU 2017 (CLARIN-D Blog)
CLARIN-D at ESU 2015 (YouTube) english
CLARIN-D ESU 2015 (YouTube) deutsch
Mephisto 97.6 10.07.13
Campus Online 10.08.2012
Mephisto 97.6 26.07.2010
infotvleipzig 26.07.2010
In India 03.09.2010

Reviews

ESU 2021 (DiCultHer) How to Move a Summer University in Digital Humanities Online and Keep It Human
INFOtheka: Review of ESU DH 2009
INFOtheka: Review of ESU DH 2012
Infoclio.ch: Review of ESU DH 2013

Publications

Multimodal Analysis of “well”

Users

  • Login

DAAD

 

CLARIN ERIC

 

Sächsische Akademie der Wissenschaften

 

Universität Leipzig

 

BMBF

 

Electronic Textual Cultures Lab at the University of Victoria & Digital Humanities Summer Institute

CLARIN-D

 

DARIAH-EU

 

Slovenian Language Technologies Society (SDJT)

 

Parthenos

International Centre/AAA

 

Computational Humanities

 

Oxygen XML Editor

 

Universitätsbibliothek