Data Quality

Qualitätsgesicherte Forschungsdaten bilden die Grundlage für die digitale Zukunft der Vergangenheit. Die Task Area Data Quality entwickelt gemeinsam mit der wissenschaftlichen Community Standards und Verfahren zur nachhaltigen Sicherung und Verbesserung der Datenqualität an der Schnittstelle von historischen Quellen, digitalen Ressourcen und Forschungsdaten.

Datenqualität ist grundlegend für verlässliche historische Forschungsergebnisse und deren Nachnutzung. Unsere Task Area entwickelt und etabliert Standards und Verfahren zur Qualitätssicherung von historischen Forschungsdaten und ermöglicht so die Voraussetzung für eine historische Quellenkritik digitaler Gegenstände.

Unsere Arbeit umfasst inhaltliche, administrative und technische Aspekte von Datenqualität. Im Dialog mit der Fachgemeinschaft erarbeiten wir praxisnahe Lösungen für Daten- und Metadatenstandards, ethische Fragestellungen, eine disziplinäre Ausprägung der FAIR-Prinzipien sowie die Etablierung von Publikations- und Qualitätsworkflows für historische Forschungsdaten, insbesondere auch in GLAM-Einrichtungen.

In enger Zusammenarbeit mit Expert:innengruppen und internationalen Initiativen evaluieren und entwickeln wir Empfehlungen und Richtlinien, die wir in Workshops und Schulungen vermitteln. Die Ergebnisse unserer Arbeit fließen in ein Kompetenznetzwerk ein, das den Dialog mit der wissenschaftlichen Gemeinschaft stärkt und die Implementierung nachhaltiger Qualitätsmaßnahmen unterstützt.

 

Bleiben Sie gezielt informiert und im Kontakt mit neuen Inhalten und dem Team der Task Area Data Quality:

Anmeldung zur Mailingliste

 

Arbeitsprogramm

Als erster Schritt werden die Bedarfe und Praktiken sowie die verfügbaren Dienste für Datenqualität in der Community systematisch erhoben und aus den Befunden Verbesserungen für die Datenqualitätspraxis abgeleitet. Darauf aufbauend stellen wir ein umfassendes Verzeichnis bestehender technischer Empfehlungen, Richtlinien und Standards für die qualitätsgesicherte Datenverarbeitung in der historischen Forschung bereit.

 

Ausgehend von den ermittelten Problembereichen werden die Anforderungen an Datenqualität für verschiedene Datentypen analysiert und systematisiert. Dabei werden ethische Fragestellungen sowie Fragen der Datennutzung und des Qualitätsmanagements in verschiedenen Kontexten behandelt. So entwickeln wir Richtlinien für disziplingerechte Ausformungen der FAIR-Prinzipien und datenethische Standards, die an die CARE-Prinzipien angelehnt sind sowie Empfehlungen für effizientes Qualitätsmanagement entlang des gesamten Datenlebenszyklus.

 

Unter Mitwirkung von Expert:innengruppen werden bestehende Zertifizierungssysteme für Datenqualität bewertet und systematisiert. Auf dieser Grundlage wird ein Messsystem zur Klassifizierung und Bewertung der Datenqualität entwickelt, das verschiedene Qualitätsstufen unterscheidet. Bestehende Peer-Review-Standards und Datenqualitätsprozesse werden in Zusammenarbeit mit der TA Data Culture evaluiert und integriert.

 

Die Ergebnisse der vorherigen Measures werden gemeinsam mit einer Expert:innengruppe und den anderen Task Areas in Empfehlungen, Kataloge und Richtlinien für die Erstellung, Bewertung und zukünftige Zertifizierung von Forschungsdaten umgesetzt. Außerdem wird eine dauerhafte Zusammenarbeit mit internationalen Qualitätssicherungsinitiativen (z.B. GoFAIR, RDA) angestoßen. Zudem werden Anforderungen an die Datenqualität für den NFDI4Memory Data Space definiert.

 

Redaktionelle Workflows für die Veröffentlichung von Forschungsdaten sollen gemeinsam mit anderen Institutionen im Konsortium entwickelt werden. Diese Verfahren zielen auf die formale Datenqualität in einem frühen Produktionsstadium ab und bilden die Grundlage für ein nachfolgendes Peer-Review-Verfahren, das sich auf Methodik und Inhalt konzentriert und an dessen Einführung durch die Task Area Data Culture unsere Task Area mitwirkt.

 

Entscheidend für alle unsere Aktivitäten ist ein ständiger Dialog mit der wissenschaftlichen Community und allen Task Areas zur effektiven Umsetzung und Verbreitung von Maßnahmen zur Verbesserung der Datenqualität. Dafür werden zielgruppenspezifische Leitlinien und Schulungsangebote für die Gewährleistung hoher Datenqualität („Train the Trainer“) in enger Abstimmung mit der Task Area Data Literacy entwickelt.

 

Das Team

Dr. Simon Donig

Herder-Institut für historische Ostmitteleuropaforschung

Peggy Große

Deutsches Museum

Prof. Dr. Peter Haslinger

Herder-Institut für historische Ostmitteleuropaforschung

Georg Hohmann

Deutsches Museum

Dr. Anna-Lena Körfer

Herder-Institut für historische Ostmitteleuropaforschung

Felix Köther

Herder-Institut für historische Ostmitteleuropaforschung

Anna Pravdyuk

Herder-Institut für historische Ostmitteleuropaforschung

Dr. Maximilian Reimann

Deutsches Museum