Data Services

Die Task Area Data Services verbessert die Interkonnektivität bestehender Datensammlungen, indem sie verschiedene, für die historische Forschung relevante Datenquellen in einem Data Space aggregiert und durchsuchbar macht. Der NFDI4Memory Data Space bildet dabei die Grundlage für innovative Dienste, die in einem Data Lab erprobt werden können.

Die Task Area Data Services verbindet wichtige Dienste und Datensammlungen in einem virtuellen NFDI4Memory Data Space. Ein übergreifender Knowledge Graph ermöglicht es der Community disziplin- und repositorienübergreifend nach Quellen und zugehörigen Daten zu suchen und diese sowohl mit klassischen Ansätzen als auch mit Methoden der „Digital Humanities“ zu bearbeiten, anzureichern und für die historisch arbeitenden Geisteswissenschaften und darüber hinaus verfügbar zu machen. 

Die Task Area Data Services verfolgt fünf Ziele, zu deren Umsetzung der NFDI4Memory Data Space beitragen soll:

  1. Gewährleistung der FAIR-Prinzipien: heterogene und verteilte Datensammlungen und -dienste für Forschende und Algorithmen gemäß den FAIR-Prinzipien nutzbar machen
  2. Interoperabilität und Nachhaltigkeit: Projektergebnisse durch die Erarbeitung und Veröffentlichung von Leitlinien, Best Practices und Standards verbessern
  3. Etablierung und Entwicklung innovativer Methoden: innovative Ansätze und neue Prozesse im Bereich der digitalen Geisteswissenschaften ermöglichen
  4. Datenvernetzung und -anreicherung: die Anzahl digitaler und maschinenlesbarer Datenquellen als Voraussetzung für diese Methoden und Prozesse erhöhen
  5. Nachnutzbarkeit: Mechanismen konzipieren, die es Gedächtniseinrichtungen ermöglichen, Forschungsergebnisse (z.B. Erschließungsleistungen aus Projekten) nachzunutzen

 

Falls Sie sich mit dem Koordinationsteam der Task Area Data Services in Verbindung setzen möchten, können Sie die folgende Mailinglist benutzen: nfdi4memory-ta3-coordination(at)lists.nfdi.de

Arbeitsprogramm

Im NFDI4Memory Data Space werden eine Vielzahl an für Historiker:innen relevanten Daten aus unterschiedlichen Quellen verzeichnet. Einheitliche Programmierschnittstellen ermöglichen einen standardisierten, interoperablen Zugriff auf diese heterogenen Daten sowie deren Betrachtung im Data Space mittels Viewern. Measure 1 wird auf Basis einer Marktanalyse ein Set an APIs für die Interaktion mit dem Data Space definieren und zur Implementierung empfehlen.

Mit dem Wissensgraphen entwickelt Measure 2 eine zentrale Komponente des NFDI4Memory Data Space. Der Wissensgraph wird als Index fungieren. Dabei geht es darum, Daten aus verschiedenen Quellen auf einer konzeptionellen Ebene in Beziehung zu setzen. Dadurch soll es Forschenden erleichtert werden, heterogene Datenbestände zu sichten, nach Konzepten zu suchen und so für sie relevante Bestände zu identifizieren. Den Kern bildet eine Ontologie, die die Task Areas Data Connectivity und Data Services gemeinsam konzipieren. Der Aufbau von Wissensgraph und Ontologie in NFDI4Memory schließt an Vorarbeiten aus dem früher gestarteten Konsortium NFDI4Culture  an.

In Measure 3 wird der NFDI4Memory Data Space als interoperables Netzwerk von Diensten und Datenbeständen aufgebaut. Schlüsseldienste und Datenquellen werden mittels gemeinsamer Schnittstellen und des Wissensgraphen miteinander verbunden. Dies wird es Forschenden ermöglichen, übergreifende Suchen durchzuführen und individuelle Korpora aus unterschiedlichen Ressourcen zusammenzustellen.

Um das entstehende Ökosystem der NFDI4Memory-Dienste und Datenquellen kontinuierlich zu erweitern und gleichzeitig die Interoperabilität der Dienste und die Wiederverwendbarkeit der Daten zu verbessern, richtet die Task Area Data Services einen technischen Beratungsdienst ein. Unter anderem wird der Dienst Forschende befähigen, ihre Daten und Systeme so zu konzipieren und bereitzustellen, dass sie sich einfach in den NFDI4Memory Data Space integrieren lassen und so über das eigene Projekt hinaus sicht- und nachnutzbar werden. Der Beratungsdienst wird Teil eines zentralen Helpdesk-Dienstes von NFDI4Memory werden.

Das NFDI4Memory Data Lab wird es ermöglichen, innovative Technologien und Anwendungen zur Annotation, Merkmalserkennung und Datenanalyse sowie zur Texterkennung anzuwenden und zu evaluieren. Das Angebot richtet sich insbesondere an Forschende sowie an kleine Gedächtniseinrichtungen, die eine derartige Infrastruktur nicht selbst aufbauen und betreiben können. Es wird den nahtlosen Zugang zu relevanten Datensätzen und Korpora über den NFDI4Memory Data Space mit dem Zugang zu einem leistungsstarken Hardware-Cluster kombinieren. Geeignete Anwendungen und Algorithmen des maschinellen Lernens entwickelt das Methodenlabor der Task Area Data Culture. Die beiden Labs arbeiten komplementär: Gemeinsam ermöglichen sie Innovation und tragen die Methoden der Digital Humanities in die Breite.

Im Zuge der Digital History werden die Daten aus Gedächtnisinstitutionen mit innovativen Methoden genutzt und weiterverarbeitet. Auch die Analysen von digital veröffentlichten Studien verweisen auf solche Bestände. Das Virtual Indexing Layer, das die Task Area Data Services gemeinsam mit Forschungsprojekten, Gedächtnisinstitutionen und Citizen Scientists auf der Konzeptebene erarbeiten wird, soll Erschließungsinformationen von Gedächtnisinstitutionen sowie Annotationen der Forschungsprojekte zum gleichen Material kombinieren und durch eine umfassende Suche und Abfrage der kombinierten Daten deren Wiederverwendung ermöglichen.

Das Team

Dr. Felix Bach

FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur (FIZ)

Borana Bozo

FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur (FIZ)

Daniel Fähle

Landesarchiv Baden-Württemberg (LABW)

Dr. Heike Fliegl

FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur (FIZ)

Oliver Henkes

FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur (FIZ)

Timo Holste

Landesarchiv Baden-Württemberg (LABW)

Sandra Göller

FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur (FIZ)

Dr. Andreas Neuburger

Landesarchiv Baden-Württemberg (LABW)

Sarah Rebecca Ondraszek

FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur(FIZ)

Prof. Dr. Harald Sack

FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur (FIZ)

Jan Schweikert

FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur (FIZ)