Bibliotheken und Archive stellen in großem Umfang ihre Bestände als Digitalisate online zur Verfügung und erleichtern so den Zugang für Forschung und Lehre. Dabei kommt standardmäßig spezielle Software zum Einsatz, um aus den digitalen Abbildern der gescannten Bücher und Schriftstücke automatisiert maschinenlesbare Texte zu gewinnen. Diese automatische Volltexterkennung liefert aber bisher nur bei gedruckten Dokumenten verlässliche Ergebnisse. Da das Schriftbild handschriftlicher Dokumente zu individuell ist, stehen diese meist nicht als elektronische Volltexte zur Verfügung. Hierfür wäre eine ressourcenintensive, manuelle Übertragung nötig. Die Entzifferung kann je nach Umfang des Materials sowie Epoche und individueller Hand der Schreiberin oder des Schreibers zu einem langwierigen und schwierigen Unterfangen werden. Dies gilt gerade für jene Wissenschaftlerinnen und Wissenschaftler, die im Rahmen ihrer Forschung in großem Umfang historische und literarische Quellen auswerten.
Den Prozess der Transkription so weit wie möglich zu automatisieren, hatte sich das EU-geförderte READ Projekt zum Ziel gesetzt. Eine Forschungsgruppe an der Universität Innsbruck entwickelte mit einem europaweiten Team die cloudbasierte virtuelle Forschungsumgebung Transkribus zur computergestützten Transkription und (semi-)automatischen Texterkennung handschriftlicher Dokumente. Möglich wird diese durch den Einsatz künstlicher Intelligenz. Auf Grundlage manuell abgetippter Beispielseiten lernt das Programm, die Schriften zu lesen.
Das Projekt war so erfolgreich, dass es 2019 in eine Europäische Genossenschaft (SCE) überführt wurde, um für eine nachhaltige und kooperative Weiterentwicklung der Software und Infrastruktur zu sorgen. Zu den Gründungsmitgliedern gehören neben der Universität Innsbruck und mehreren internationalen Universitäten auch Kulturinstitutionen wie das Finnische Nationalarchiv und die British Library. Die CAU ist im August 2020 Mitglied der READ-Genossenschaft geworden, um an der weiteren Entwicklung von Transkribus zu partizipieren und für die Forschung und Lehre in Kiel einfacher nutzbar zu machen.
Vizepräsidentin Professorin Anja Pistor-Hatam sagt:
„Mit dem Beitritt stärken wir die Digital Humanities an der CAU. Transkribus ist ein wichtiger Baustein beim Aufbau einer fortschrittlichen digitalen Infrastruktur für die Geisteswissenschaften.“
Zum Nachlesen
- Mehr zur Transkriptionssoftware: Transkribus