Task Area 2: Data Connectivity

TA2 advances the linking and contextualising of research data in the historical domain to enable a coherent historical record in the digital age and provide the foundation for the planned 4Memory Data Space. It lays the ground for historically sensitive, unambiguous data descriptions; the integration of research-led historical categorisation and cataloguing by archives, libraries and museums; and contextualisation within larger data structures. Data connectivity is vital to achieving the LINKAGE objectives. Developing and improving authority files, taxonomies, metadata, ontologies and APIs will increase the linking of research, memory institutions and infrastructures via a knowledge graph, also adding to the representation of a knowledge order for the digital future of the past. Connecting sources, publication and research data advances the analogue / digital interface of historical source material and data, as both types of material will be accessible in one data space. Open, jointly developed authority files generate standards for historical research data and sustainability.


Measures

Measure 1 analyses existing authority data approaches for the long-term development of graduated concepts for search strategies, data curation, data exploitation and quality requirements. This applies both to the subject-specific context of 4Memory and to interdisciplinary and internationalinitiatives. In doing so, 4Memory takes into account authority data that contextualise historical entities of time, object and place data, persons and activities in a long-term perspective that is vital to the disciplines in our community. To this end, existing approaches are gathered and screened, analysed and modelled, as well as represented and described in a directory of subject-specific knowledge organisation systems, such as authority data and controlled vocabularies. At the same time, existing activities are networked more closely in order to develop common goals and guidelines in the field of authority data production.
An “International Authority Data Working Group” aims to integrate and link authority data to the GND and other standards. The concepts derive from selected subject-specific authority data provided as use cases from the participants, in order to meet the needs of both compact, largely standardised keywording (metadata, authority data) and diversified processes of scholarly analysis with basically the same networked approaches and concepts. The aim is establishing a two-tiered, linked network of persistently addressable authority data (GND, metadata, search) in relation to dynamically changing data (taxonomies, ontologies, context data) geared towards scholarly analysis. This approach addresses an essential goal for producing FAIR data by maintaining data transparency, traceability and contextualisation from the (analogue or digital) source to the national/international authority data set: it is essential to integrating historical source criticism (contextualisation), developing standards and networking different process levels of RDM (i.e. data production, analysis, provision and reuse).
The measure is devoted to the conception, planning and preparation/development of tools for data curation, content quality measurement and the automated indexing or enrichment of research data (e.g. the definition of knowledge graphs, preparation for the Semantic Web or contextualisation of information) and providing the groundwork for their realisation in accompanying projects and/or the second NFDI funding phase. Together with TA1, criteria of a graded quality model for the authority data concepts of specific historical sub-areas are developed. Basic concepts for the normalisation (lemmatisation) and contextualisation of data as well as for its taxonomic preparation are subjected to quality control and prepared for transfer into tools and interfaces (TA1, TA3, TA5).
After evaluation of the status quo and its desiderata, expert groups develop common standards and rules for the description and documentation of research data, easing data linkage and aggregation in the 4Memory community and its Data Space, as well as with international services. Scholars will have a shared set of descriptors, authority data and taxonomies when searching for sources and research data. Service providers such as archives, libraries and museums will be given explicit guidelines on cataloguing and documenting research data based on common standards and rules and adapted to research data. The inclusion of a defined set of research data – as related to publications and as publications in their own right – into the German Historical Bibliography (GHB) and, possibly, into other bibliographies provides a proof of concept for the use of recommended formal descriptors, authority data and taxonomies. As described in the RDM-Strategy, the broad 4Memory researcher community will benefit from the extended GHB by being able to use this new type of resource in an established environment with direct-access options.
For the exchange, integration, delivery and reuse of research data, a 4Memory ontology and a metadata schema have to be developed by a metadata competence unit. This will allow both linking the research data of the 4Memory community within the consortium’s Data Space and connecting it to other aggregation services such as BASE and Google Dataset Search or future services within NFDI and EOSC. Furthermore, the developed data model has to integrate non-German languages as well as knowledge and organisation systems in order to represent research data from fields such as area studies, introduce postcolonial perspectives and secure the international connectivity and visibility of research data curated and listed by 4Memory, thus improving conditions for a truly transnational historiography. Additionally, canonical URIs will enable addressing granular data, thus improving the citation and reuse of research data through, e.g. linking to micro-publications such as annotations or referencing concepts within taxonomies.
Application Programming Interfaces (APIs) enable standardised access to data and their reuse. In 4Memory’s first phase, TA2 implements APIs to access the Data Space on three levels: (1) ensuring machine-readable access to selected data sets; (2) linking research data infrastructures within the 4Memory Data Space; (3) enabling viewing options for varied formats like visual or textual content, tabular data, geographic coordinates or three-dimensional models. For this, we – supported by expert groups – evaluate existing technologies like OAI-PMH or the IIIF-Standard and make recommendations to TA3 regarding which APIs to implement. Researchers from within and beyond the 4Memory community will gain easier access to newly generated research data as well as to existing material like digitised sources among the holdings of GLAM institutions.

Related Problem Stories

Mein Aufgabenschwerpunkt an einem Lehrstuhl der Geschichtswissenschaften ist die Konzeption unserer digitalen Projekte (vorrangig digitales Publizieren, digitale Wissensvermittlung) sowie die Koordination von deren Umsetzung durch unterschiedliche Teams. Seit Ende 2019 befassen mich die Daten einer ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: heterogene Datenlage; Datenmanagementplan; Kooperation Wissenschaft-IT

Als Forscher an einer fachwissenschaftlichen Einrichtung bin ich an einem kunsthistorischen Projekt beteiligt, das sich mit außereuropäischem Material beschäftigt. Wir möchten gerne Kunstwerke inhaltlich klassifizieren, aber die bestehenden (oft eurozentrischen) Vokabulare (IconClass, Getty) decken ... read more

Perspective: datacollection; datapublication

Tags: Linked Open Data; Gazetteer; Permanent Identifier

Als Archiv stellen wir massenhaft Erschließungsinformationen zu Archivgut im Sinne von primären Forschungsdaten im Internet bereit. Diese und weitere, noch nicht online veröffentlichte digitale Erschließungsinformationen liegen in sehr großer Zahl und unterschiedlicher Datenqualität vor. Eine Heraus ... read more

Perspective: datapublication; datareuse

Tags: Archiv; Normdaten; Datenanreicherung

In einem größeren Forschungsprojekt arbeite ich mit Quellen ganz unterschiedlicher Provenienz, z.B. aus Zeitungsdatenbanken (Online-Archive von "Der Spiegel", "Die Zeit", aber auch Zeitungen aus dem Ausland; daneben Fernseh- und Rundfunk-Archive, das Bundesarchiv etc. Ich werte Z ... read more

Perspective: datapublication

Tags: Zusammenarbeit Archive; Unterschiedliche Qualität der Quellen

Als Spezialbibliothek erzeugen wir mit OCR Volltexte unserer digitalisierten Quellen für die Forschung. Mit digitalisierten und auf Lemma-Ebene erschlossenen Fachlexika (19. Jh) verfügen wir über zeitspezifisches Vokabular. Bislang fehlt es an Kapazitäten, dieses Vokabular als Gazetteer oder Ontolog ... read more

Perspective: datacollection; datapublication

Tags: Thesaurus; Ontologie; Vokabular; Infrastruktur

Die anbieter- und systemunabhängige Nutzung digitaler/digitalisierter Quellen in der eigenen Forschungsumgebung wird durch die IIIF-Standards unterstützt. Als Bibliothek würden wir gerne auch unsere digitalisierten Audio-, Video-, und 3D-Daten ebenso wie die text-/bildbasierten Quellen über IIIF anb ... read more

Perspective: datapublication; datareuse

Tags: Software; Schnittstelle; IIIF

We are editing 19th century migrant letters that are physically located in German and American archives. In order to be able to reconstruct migration patterns and migrant networks, we would like to mark persons with a unique identifier. Since these are “ordinary people”, we do not find them in exist ... read more

Perspective: dataprocessing; datacollection

Tags: Personenidentifikation; Visualisierung; Werkzeuge

Seit einiger Zeit arbeite ich mit einer kleinen Gruppe an der Zusammenstellung von Glockengussdaten. Dabei handelt es sich um Informationen, die 1940/41 anlässlich der bevorstehenden Einschmelzung der Glocken auf Karteikarten gesammelt wurden, insgesamt etwa 20.000. Für uns von Interesse sind Stando ... read more

Perspective: dataprocessing; datacollection

Tags: Handschriftenerkennung; Georeferenzierung; Karten

In einer Forschergruppe erheben wir Informationen zu den in den Deutschen Staaten erteilten Patenten im Zeitraum 1840-1877. Die Daten erhalten reichhaltige Informationen zur patentierten Technologie, den Berufen der Patentinhaber und deren Wohnorten. Letztere ermöglichen eine Landkarte innovativer O ... read more

Perspective: dataprocessing; datacollection

Tags: Georreferenzierung

Unser bürgerwissenschaftlicher Verein hat ein Ortsverzeichnis entwickelt, das mit Bezug auf Deutschland und viele andere Länder Ortsnamen (in variierenden Schreibweisen), kirchliche und staatliche Zugehörigkeiten im Zeitverlauf sowie geographische Koordinaten erfasst. Die Abdeckung auf Ebene der Sie ... read more

Perspective: datareuse

Tags: Geodaten; Normdaten

In unserem familienkundlichen Verein wird seit den 1990er Jahren immer wieder der Wunsch laut, dass eine gemeinsame Familiendatenbank aufgebaut wird, an der alle Mitglieder gleichzeitig mitarbeiten können. Ziel wäre es, dass eine Person jeweils nur einmal in der Datei auftaucht, und dass sowohl die ... read more

Perspective: datacollection; dataprocessing; datapublication

Tags: Familienrekonstitution; Record Linkage; Normdaten

Unsere Arbeitsgruppe führt eine semi-automatische prosopgraphische Auswertung durch, in welcher wir spätmittelalterliche Gelehrtenkarrieren untersuchen. Geeignete Quellen hierfür liegen bereits in digitalisierter Form vor, teilweise sind sie mit TEI oder vergleichbaren Formaten ausgezeichnet. Die Da ... read more

Perspective: dataprocessing; datapublication

Tags: Geo-Referenzierung; historische Ortsnamen; digitale historische Karten

Ich bin Vertreter eines überregionalen Arbeitskreises . Etliche unserer Mitglieder haben schon seit den 1970er Jahren mit personen-, haushalts- und familienbezogenen Mikrodaten geforscht. Die entsprechenden Daten liegen in unterschiedlichen Formaten vor, unter anderem in TUSTEP, Kleio, dBase, SPSS u ... read more

Perspective: datareuse

Tags: Historische Demographie; personenbezogene Daten

Die Erforschung der Geschichte des betreffenden Landes steht vor grundsätzlichen Problemen hinsichtlich der Quellenlage. Zu nennen ist hier eine langjährige Vernachlässigung der einschlägigen Archivbestände, dann eine unzureichende Finanzierunggrundlage für die Sammlung, sachgerechte Unterbringung u ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Nicht lateinische Schriften; Datenschutz; Oral History

Forscher_innen aus den Bereichen Geowissenschaften, Biodiversität, Archäologie, Soziologie und Geschichte befassen sich mit der Landschaftsgeschichte des Libanon über einen langen Zeitraum hinweg. Dafür möchten diese Forscher_innen ein gemeinsames Geografisches Informationssystem (GIS) aufbauen und ... read more

Perspective: datareuse; datapublication; dataprocessing; datacollection

Tags: Geografisches Informationssystem (GIS); Geodaten; Interdisziplinarität

Ich befasse mich mit den kulturellen Artefakten außereuropäischer Gesellschaften und benötige dafür digitale Werkzeuge, die nicht schon bei der Erfassung der Daten erfordern, diese mit Modellen des Globalen Nordens im frühen 21. Jahrhundert zu beschreiben. Zur Beschreibung meines Forschungsgegenstan ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Datenmodelle; nicht lateinische Schriften und Sprachen; Variantensupport

Ich bin SozialhistorikerIn des spätosmanischen Nahen Ostens und habe in meinen Quellen eine große Anzahl Personen, Orte, und Institutionen identifiziert. Diese unter großem Zeitaufwand erstellten Rohdaten historischer Forschung möchte ich zur Nachnutzung als Linked Open Data im Semantic Web veröffen ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Historische Norm- und Geodaten; Karten; nicht lateinische Schrift (Arabisch)

Ein Forschender möchte einige historische Handschriften in nicht lateinischer Schrift retrodigitalisieren und eine Volltexterkennung durchführen. Dabei steht er vor dem Problem, dass die ihm bekannten Tools zur Retrodigitalisierung auf lateinischschriftliche Druckschriften ausgelegt sind und deshalb ... read more

Perspective: datacollection; dataprocessing; datareuse; datapublication

Tags: Volltexterkennung (OCR); nicht lateinische Schriften; Handschriften

Eine Forschende möchte prosopographische Netzwerke in Europa ermitteln und veranschaulichen. Zu diesem Zweck muss sie Quellen in unterschiedlichen lateinischen und nicht lateinischen Schriften sammeln, erfassen und analysieren. Anschließend sollen die Daten interaktiv visualisiert werden. Die Forsch ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Netzwerkforschung; nicht lateinische Quellen; Prosopographie

Eine Forschende untersucht Regionalität und Regionsbildung aus interdisziplinärer (genauer gesagt historischer und kunsthistorischer) Perspektive mit Blick auf die Identitäten und Repräsentationskultur des Adels im 17. und 18. Jahrhundert. Zu diesem Zweck sind Werke der bildenden und angewandten Kün ... read more

Perspective: dataprocessing; datacollection; datapublication; datareuse

Tags: Retrodigitalisierung; Kunst; Adel

Ein Forschender möchte in einem Projekt einen Korpus von Texten aus dem 18. Jahrhundert inklusive der dazugehörigen nicht lateinischschriftlichen Übersetzungen erstellen und im Internet verfügbar machen, um Wissens- und Sprachtransfer aus ideen- und begriffsgeschichtlicher Perspektive zu erforschen. ... read more

Perspective: datacollection; datapublication; dataprocessing; datareuse

Tags: Textkorpus; nicht lateinsiche Schrift

Ein Forschender möchte eine digitale Edition historischer Berichte aus dem 17. und 18. Jahrhunderts im Internet veröffentlichen. Die Dokumente liegen in unterschiedlichen Sprachen in lateinischer Schrift in verschiedenen europäischen Archiven vor. Die Edition soll ein Verzeichnis der Berichte und ve ... read more

Perspective: datacollection; datareuse; datapublication; dataprocessing

Tags: Digitale Edition; Internationales Projekt; Normdaten

Im Zuge eines internationalen Projektes sollen mehrere hundert Interviews in nicht lateinischer Schrift digitalisiert, mit Metadaten versehen und im Internet präsentiert werden. Die Interviews wurden in der ersten Hälfte des 20. Jahrhunderts verschriftlicht und befinden sich in verschiedenen Archive ... read more

Perspective: dataprocessing; datacollection; datapublication; datareuse

Tags: Interviews; Transkription nicht lateinischer Schriften; Datenschutz

Als Forschungsdatenmanager oder Forscher möchte ich den Entstehungsverlauf meiner Forschungsdaten im Forschungsprozess genau dokumentieren, um die Verarbeitungsschritte nachvollziehbar zu machen und die Arbeitsabläufe zur Erstellung und weiteren Verarbeitung darüber hinaus als Vorlage für spätere, ä ... read more

Perspective: dataprocessing

Tags: Datendokumentation; Forschungsdatenmanagement-Workflow; Datenmanagementplan

Als Forschungsdatenkurator möchte ich ich Forschungsdatensätze und weitere Ressourcen miteinander verknüpfen, um den Entstehungszusammenhang und die Beziehungen zu weiterem Forschungsoutput sichtbarer zu machen. Eine Mindestanforderung ist dabei z.B. die Berücksichtigung der DataCite-Relationstypen ... read more

Perspective: datapublication

Tags: Forschungsinformation; Provenienzinformation; graphischer Editor

Eine Gruppe von Forschenden möchte den sprachlichen Wandel rund um das Thema “Politikverdrossenheit” in internationalen historischen Zeitungen des 19. und 20. Jahrhunderts untersuchen. Die Zeitungen liegen in Teilen digitalisiert vor, allerdings auf unterschiedlichen, internationalen Plattformen. Ni ... read more

Perspective: datacollection; dataprocessing; datapublication

Tags: Digitale Textanalyse; Internationale Zeitungen

Eine Forscherin möchte gerne Geodaten, die sie aus einem gedruckten Textkorpus extrahiert hat, auf einer interaktiven Karte visualisieren. Die Daten sollen anschließend als .csv für die Forschung zur Verfügung gestellt werden. Konkret steht sie vor der Frage, welche der zahlreichen angebotenen Tools ... read more

Perspective: dataprocessing; datapublication; datareuse; datacollection

Tags: Geoinformationssystem; Karten; Normdaten

Als Forschungsdatenkurator möchte ich Normdaten und kontrollierte Vokabulare verwenden, um Forschungsdaten möglichst fachspezifisch und mit anderen Ressourcen integrierbar zu beschreiben. Normdaten wie insbesondere die GND wären für eine effiziente Erfassung von Autoren und Forschungseinrichtungen p ... read more

Perspective: datapublication

Tags: Normdaten; kontrolliertes Vokabular; SKOS (Linked Data)

Unser Online-Quellenportal bietet neben Text- und Bildquellen auch eine Vielzahl von Karten, die die wechselnden Grenzen und politischen Einheiten des heutigen Deutschlands von der Frühen Neuzeit bis in die Gegenwart zeigen. Statt statischer Karten erwarten durch Google Maps und ähnliche Dienste gep ... read more

Perspective: dataprocessing; datareuse; datapublication; datacollection

Tags: Historische Karten; Geoinformationssystem

Ich bin Nachwuchswissenschaftler*in und möchte das innerhalb meiner Qualifizierungsarbeit verwendete Quellenkorpus veröffentlichen. Die Daten liegen als TEI-XML vor. Neben der Veröffentlichung der Rohdaten soll aber auch eine Digitale Edition entstehen. Diese soll Basisfunktionen wie (parallele) Tex ... read more

Perspective: dataprocessing; datapublication; datareuse

Tags: Digitale Editiom; XML-TEI

Bei der Aufbereitung, Auswertung und Publikation von Forschungsdaten gibt es wiederkehrende Bearbeitungsschritte, die im Detail aber auch immer wieder leicht variieren können. Beispiel: Ich möchte meine Daten mit Hilfe von Named-Entity Recognition (NER)-Methoden semantisch anreichern. Das in einer O ... read more

Perspective: datapublication; datareuse; dataprocessing

Tags: Workflow; Named-entity recognition (NER); Repositorium

Als Forschungseinrichtung müssen wir die Langzeitarchivierung der Forschungsdaten sichern aber sind von unseren proprietären Softwares auf verschiedenen Ebenen eingeschränkt. Zwar erlaubt unser Datenbanksystem die Daten laut verschiedenen Formaten (e.g. XML) und Schemata eines selben Formats (e.g. a ... read more

Perspective: datapublication

Tags: Vokabulare; Software; Datenexport

Vor gut 20 Jahren wurden in einem Forschungsprojekt sämtliche Vorstände und Aufsichtsräte deutscher Unternehmen der Jahre 1906, 1927, 1932, 1933 und 1954 in einer Datenbank erfasst. Das Ziel war es, wirtschaftliche und familiäre Vernetzung zu ermitteln und die Struktur der Wirtschaftselite in den Um ... read more

Perspective: datareuse

Tags: Softwareaktualität; Datenbankkonvertierung; Datensicherung

Als verantwortlicher Datenkurator bin ich in einem zeithistorischen Forschungsprojekts dafür verantwortlich die im Rahmen der Einzelstudien entstehenden Interviews zu archivieren und nach Möglichkeit digital für die Nachnutzung bereitzustellen. Im Bereich der Geschichtswissenschaft ist die Nachnutzu ... read more

Perspective: datareuse

Tags: Forschungsdatenarchivierung; Nachnutzung

Als Leiter des Programmbereichs Forschungsinfrastrukturen an einem zeithistorischen Forschungsinstitut bin ich auf verschiedenen Ebenen mit den Bedürfnissen der Forschenden hinsichtlich Archivierung, Erschließung und Bereitstellung, der von ihnen produzierten Forschungsdaten, aber auch gleichzeitig ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Vertrauen; Forschungsnähe; Kulturwandel

Im Rahmen der Familienforschung werden seit mehr als 80 Jahren u.a. von der Upstalsboom – Gesellschaft für historische Personenforschung und Bevölkerungsgeschichte in Ostfriesland e. V. (UG) Ortssippenbücher und Ortsfamilienbücher erstellt. Sie enthalten die Daten der Familienstammbäume der jeweilig ... read more

Perspective: datapublication; datareuse

Tags: Integration Forschungsergebnisse; Veröffentlichung Forschungsergebnissse Familiengeschichte

Ein Digitalisierungsprojekt aus dem Bereich deutsch-jüdische Geschichte möchte die von ihm erschlossenen Quellen nicht nur chronologisch (Entstehungsdatum) und räumlich (Entstehungsort) sondern über die darin erwähnten Personen und Geografika hinaus auch thematisch einordnen. Dabei stellt sich die F ... read more

Perspective: datareuse; datapublication

Tags: Jüdische Geschichte; Klassifikation; Normdaten

Als An-Institut einer Universität sind wir Akteur in einem langhin etablierten Verbund unabhängiger Projekte der Grundlagenforschung, die zum Nutzen der interdisziplinären Städteforschung historisches Kartenmaterial edieren. Nach wie vor sind Printprodukte der traditionelle Output. Inzwischen aber h ... read more

Perspective: datareuse

Tags: Geodaten; Repositorium; Digitaledition

Ein außeruniversitäres, landesfinanziertes Forschungsinstitut, dessen geschichtswissenschaftlichen Bereich ich leite, betreibt ein regionales Online-Datenportal mit mehreren thematischen Angeboten. Dazu gehört auch eine ortsgeschichtliche Datenbank, die ca. 6000 Siedlungen der Referenzregion mit the ... read more

Perspective: dataprocessing

Tags: Verlinkung von Daten; Ortsdaten; Abgleichstool

Ich beschäftige mich mit Schriftstellerinnen um 1820 und recherchiere nach Artikeln dieser Frauen in Zeitungen und Zeitschriften. Bibliotheken bieten ihre digitalisierten Bestände auf eigenen Plattformen an. Als Bibliothekarin verstehe ich die Angebote, als Forschende habe ich jedoch eine andere Sic ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Bibliotheken; Plattformen; Wikisource

Task Area Coordination Team

Dr. Katrin Moeller (Historisches Datenzentrum Sachsen-Anhalt): katrin.moeller@geschichte.uni-halle.de

Dr. Silvia Daniel (Bayerische Staatsbibliothek): daniel@bsb-muenchen.de

Foto: BSB/Michaela Morys
Dr. Arnost Stanzel (Bayerische Staatsbibliothek): arnost.stanzel@bsb-muenchen.de