FDMLab@LABW – Etablierung eines Forschungsdatenzentrums am Landesarchiv Baden-Württemberg
Laufzeit: Juli 2020 bis 31. Juli 2023
Das Projekt untersuchte, wie sich maschinelles Lernen in Form automatisierter Erkennung und Annotation digitaler Texte und Bilder in den Archivalltag integrieren lässt. Maschinelles Lernen bezeichnet den Vorgang, dass ein aus Algorithmen bestehendes System mit Trainingsdaten versorgt wird und dadurch die Muster eines Sachverhalts lernt. Nach Abschluss der Lernphase kann das System auch Beispiele erkennen, die bisher nicht im Training vorgekommen sind. So können enorme Datenmengen miteinander in Beziehung gesetzt und analysiert werden.
Neben der Begleitung des Aufbaus einer internen Basisinfrastruktur für das Forschungsdatenmanagement beteiligte sich das Projekt bei den Vorarbeiten zum Aufbau der Nationalen Forschungsdateninfrastruktur im Rahmen der Aktivitäten des Landesarchivs bei der Konsortialinitiative NFDI4Memory.
Das FDMLab befasste sich konkret mit praktischen Tests zur maschinellen Unterstützung bei der Erstellung von Volltexten und Metadaten aus digitalem Archivgut. Das Team testete ausführlich, wie sich die Metadaten strukturiert aufarbeiten und mit Normdaten der Gemeinsamen Normdatei (GND) verknüpfen lassen. Zusätzlich wurde evaluiert, wie Volltexte und Erschließungsdaten unter Berücksichtigung der FAIR-Prinzipien zur Verfügung gestellt werden können.
Dabei wurden nicht nur neue Werkzeuge wie OpenRefine etabliert, sondern auch Ideen für Strategien, Workflows und Werkzeuge für andere Projekte wie zum Beispiel eines neuen Archiv-Fachinformationssystems entwickelt.
Während die erste Projektphase bewusst experimentell angelegt war, konnten in der zweiten Projektphase mit der Produktivnahme der geeigneten Tools und Workflows zahlreiche landesarchivinterne Vorhaben zur Datenaufbereitung und -anreicherung realisiert werden, sodass sowohl das Online-Angebot des Landesarchivs selbst als auch das von diesem betriebene Landeskundeportal LEO-BW um mehrere zehntausend Datensätze erweitert werden konnte.
Die im Projekt erzielten Ergebnisse, insbesondere die für den Einsatz von KI im Archivbereich erarbeitete datenwissenschaftliche Expertise als Schlüsselkompetenz der Zukunft fand bis auf internationale Ebene große Anerkennung. Für das Landesarchiv selbst brachte das Projekt FDMLab einen Innovationsschub.
Über detaillierte Ergebnisse berichtete das FDMLab-Team in einem eigenen Blog .