Big Data: Venedig wandert durch die Zeitmaschine
Die Vergangenheit ins digitale Zeitalter führen: Das ist das Ziel des «Venice Time Machine»-Projekts der ETH Lausanne und der Ca’Foscari Universität. Im Rahmen dessen wird von Venedig ein umfassendes Modell erstellt. Unter anderem mit über 190‘000 Datensätzen aus dem Staatsarchiv.
Die Initiative der «Venice Time Machine» (VTM) wurde 2012 von der ETH Lausanne (EPFL) und der Ca’Foscari Universität ins Leben gerufen. Der Name des Projektes legt es nahe: Ziel ist es, die Vergangenheit in das digitale Zeitalter zu führen. Dazu werde ein multidimensionales Modell von Venedig erstellt, dass das vergangene Jahrtausend mithilfe von Millionen an historischen Dokumenten darlegen soll, wie die EPFL in einer Mitteilung schreibt.
Frédéric Kaplan, Leiter des zuständigen Labors Digital Humanities an der EPFL ist der Meinung, dass solche Informationen in ferner Zukunft nur noch elektronisch zugänglich sein werden. Deshalb rief er 2016 in einem Manifest, Universitäten aus ganz Europa dazu auf, zusammenzuarbeiten und das kulturelle Erbe ihrer Region zu teilen. Daraufhin wurde seine Idee Teil des FET Flagship Programms der EU. Darin werden grosse Forschungsinitiativen unterstützt, die über zehn Jahre andauern. Für das verbreiterte Projekt unter dem Namen «Time-Machine» wurde dann eine Milliarde Euro bereitgestellt.
Quelle: zvg
Durch ein spezielles Erkennungsystem können auch Handschriften digitalisiert werden.
Roboterarm hilft beim Umblättern
Die Forscher mussten aber für die riesige Anzahl an Dokumenten, Datensätzen, Büchern und Fotos von Venedig erst Technologien entwickeln, mit deren Hilfe sich die kilometerlangen Archive schnell digitalisieren liessen. Aber auch für empfindliche teils über 500 Jahre alte Schriften musste eine Lösung her, wie die EPFL weiter schreibt. Genau dafür wurde ein spezieller Scanner entwickelt, der fragile Manuskripte und Dokumente schonend digitalisiert. Zudem helfe ein Roboterarm beim Umblättern von Büchern und Zeitschriften und ein Hochgeschwindigkeitsscanner könne in nur vier Sekunden eine fotografische Aufnahme scannen.
Historiker, Paläographen und Archivare halfen zudem mit über 160 Handnotizen dabei, ein automatisches Handschrifterkennungssystem zu entwickeln, dass Informationen aus den Dokumenten extrahieren kann. Mit einer Fehlerrate von nur vier Prozent könne das System zahlreiche verschiedene Schreib- und Abkürzungstypen handhaben, schreibt die EPFL weiter.
Quelle: zvg
Das umfangreiche Archiv von Venedig.
3‘000 Wissenschafts-Bücher digitalisiert
Die Idee der Datenbanken ist es auch, sie später für die Öffentlichkeit zugänglich zu machen. Dazu wurden drei Programme entwickelt, die den Nutzern beim Durchsuchen des digitalen Archivs helfen können. Die Suchmaschine «Canvas» kann die Nutzer beispielsweise in die Originalversionen gescannter Datensätzen einsehen lassen und durchsucht die Datenbank nach Schlüsselwörtern wie Name, Ort oder Datum.
Bei der Digitalisierung der zahlreichen Fotografien der Fondazione Giorgio Cini kamen ebenfalls einige Handnotizen zum Zug, die zur Entwicklung der Suchmaschine «Replica» führten. Diese könne nicht nur nach Text, sondern auch nach Bildern suchen, wie die EPFL mitteilt. Dies, indem sie Verbindungen bei der Zusammensetzung, der Position der Personen oder Gegenständen und Mustern der Fotografien herstellt.
Und auch die Hauptbibliotheken Venedigs mussten herhalten. Fast 3‘000 wissenschaftliche Bücher und Zeitschriften aus dem 19. Bis 21. Jahrhundert wurden bereits bearbeitet. Digitalisiert wurden sie im Rahmen des Projekts «Linked Books», das vom schweizerischen Nationalfonds finanziert wird. Dazu wurde das Ad-hoc-Programm «Venice Scholar» entwickelt, das Zitate aus den Texten extrahieren oder danach suchen kann. Die grosse Anzahl der digitalisierten Büchern würden bislang aber weniger als ein Prozent des Ganzen ausmachen, sagt Kaplan. Die Digitalisierung der Wasserstadt wird deshalb wohl noch lange nicht abgeschlossen sein. (pb)
Quelle: zvg
Auch alte Pläne wurden umfassend digitalisiert.