Task area

90 Grenzen des Machbaren

< Back to problem stories

WissenschaftlerInnen kennen das Problem, nicht aufhören zu können, aus vielen Bereichen: Wann ist ein Buch abgeschlossen? Wann ist genügend Literatur recherchiert? Wann ist der letzte Wörterbuchbeleg gefunden? Beim Aufbau digitaler Ressourcen stellt sich dieses Problem nicht anders, aber besonders. Ich arbeite in einem Projekt, das kodikologische Basisdaten sammelt. Doch was sind Basisdaten? Gehören Wasserzeichen, Provenienz, Illustrationsbeschreibungen dazu? Die potentielle Menge des Verzettelbaren ist scheinbar unbegrenzt. Dass damit weder dem Projekt noch den Benutzern ein Gefallen getan ist, weiß man zwar, doch die reine Möglichkeit verleiht den Handlungsdruck, immer weitere Daten aufzunehmen. TEI-BenutzerInnen werden das Problem ebenso kennen: Wie tief findet die Auszeichnung statt? Die Möglichkeit gewinnt den Charakter eines Wettlaufs von Hase und Igel. Man kommt nie hinterher, egal wie sehr man sich bemüht. Handelt es sich nur um ein psychisches Problem (der "geile Drang auf große Ganze", wie Benjamin sagte) oder um ein systembedingtes, dem auch mit klareren Prozessen beizukommen wäre?

Posted on

89 Thesaurus für ein Digitalisierungsprojekt

< Back to problem stories

Ein Digitalisierungsprojekt aus dem Bereich deutsch-jüdische Geschichte möchte die von ihm erschlossenen Quellen nicht nur chronologisch (Entstehungsdatum) und räumlich (Entstehungsort) sondern über die darin erwähnten Personen und Geografika hinaus auch thematisch einordnen. Dabei stellt sich die Frage nach einer passenden Systematik. Universalklassifikationen wie etwa die Dewey Decimal Classification erweisen sich als zu grob, um wichtige Themen im Quellenbestand wie z.B. die Hachschara (Vorbereitung auf die Auswanderung nach Palästina) zu erfassen. Solch passgenauen Sachbegriffe bietet umgekehrt die GND, allerdings nicht in Form eines hierarchischen Thesaurus. Für ein Online-Angebot bietet sich aber eine Baumstruktur an, da diese im Gegensatz zu einer flachen Verschlagwortung auch das hierarchische Browsing der Inhalte bzw. die schrittweise Facettierung von Suchergebnissen unterstützt. Für die erfolgreiche Projektdurchführung mit einer geeigneten Nutzerführung, zur Vermeidung von Doppelspurigkeiten und im Rahmen einer späterere Integration unserer Projektergebnisse in größere Quellenportale wie etwa die DDB oder die Europeana bräuchten wir Unterstützung bei den folgenden Fragen: • Gibt es evtl. Vorarbeiten von anderen Institutionen, an die wir anknüpfen können? Wie können wir umgekehrt unsere Klassifikationen zur Weiternutzung anbieten? • Wie strukturen wir unsere Metadaten, damit die von uns vergebenen Klassifikatoren ohne aufwändiges Mapping in bestehende oder neue Verbundangebote integriert werden können? • Wie gehen wir mit fehlenden Begriffen um? Wie kann sichergestellt werden, dass diese in bestehende Normdatenbestände wie die GND einfließen können? • Könnte ein Projekt aus dem Museumsbereich wie digiCULT x-tree (https://www.digicult-verbund.de/de/digicultxtree) mit dem bestehenden Vokabular in einer Datenbank zusammengeführt werden, ein Vorbild sein oder gar eine Ausgangsbasis bilden?

Posted on

87 Probleme bei Erfassung und Verarbeitung historischer Datumsangaben

< Back to problem stories

Das Entstehungsdatum einer Quelle anzugeben, ist nicht einfach, denn es ist nicht immer direkt auf Quellen verzeichnet. So hat man ggf. kein exaktes Tagesdatum, kann dieses nur aus Kontexten erschließen (z.B. aus Ereignis- oder Feiertagsangaben) oder nur anmerken, dass es um, vor oder nach einem anderen Datum entstanden ist. So können manchmal nur Jahreszahlen oder Monate angeben werden, ggf. mit einer zusätzlichen Angabe wie Anfang, Mitte oder Ende des Zeitraums, den man erschlossen hat. Datenbanken auf der anderen Seite erfordern ein exaktes Datum in der Form JJJJ-MM-TT. Nur dann können diese Daten weiterverarbeitet und z.B. für Suchzugriffe oder Sortieralgorithmen genutzt werden. Ein weiteres Problem ist, dass Standardisierungen nicht auf historische Belange angepasst sind. Die Unixzeit, die jedes Datum in Sekunden ab dem 1. Januar 1970 umrechnet, wird von vielen Computerprogrammen zur Datumsberechnungen verwendet. In der Microsoft-Welt werden alle Daten ab dem 1. Januar 1900 unterstützt. Die Norm ISO 8601 gilt nur für Daten ab 15. Oktober 1582. Für Daten davor müssen die Austauschpartner weitere Vereinbarung untereinander treffen (z.B. für v.Chr. ein Minus vor der Jahreszahl). Die Problematik des Jahres Null stellt für Computerverarbeitung ein weiteres Hürde dar. Die Eingabe ungenauer oder erschlossener Daten ist eigentlich nicht vorgesehen. Meistens wird es durch die Eingabe mehrerer Daten (z.B. weiteres Feld für Sortierdatum oder Angabe eines Zeitraums) und weiterer Felder, mit denen man die Art bzw. Qualität der Daten angibt (erschlossen, wahrscheinlich, etc.), umgangen. Dies ist aber individuell in Softwaren oder durch Datenmodelle festgelegt und kann dann nur schwer und nicht ohne weitere Absprache/Anpassungen in der digitalen Welt ausgetauscht werden. Auch besteht die Gefahr, dass das maschinenlesbare Datum, das nur aus Sortier- oder Verarbeitungszweck dem Digitalisat mitgegeben wurde, zum "eigentlichen" Datum der Quelle mutiert, da dieses Datum digital gelesen und verarbeitet werden kann.

Posted on

86 Probleme ohne Datenmanagementplan

< Back to problem stories

Ich koordiniere ein anderthalbjähriges audiovisuelles Zeitzeugenprojekt, angesiedelt an der Sächsischen Akademie der Wissenschaften, in Kooperation mit der Humboldt Universität zu Berlin. Das Projekt wird durch Bund und Länder gefördert: Thüringen, Sachsen und die Wismut GmbH, die ihre Gelder durch das BMWi erhält. Laut Antrag beinhaltet das Vorhaben, 50 Zeitzeugeninterviews zu führen, diese filmisch zu dokumentieren, anschließend zu transkribieren, zu verschlagworten und sowohl für eine (Langzeit)archivierung bereitzustellen als auch in eine noch aufzubauende Datenbank zu integrieren. Ein Zeitzeugenprojekt mit diesem Umfang benötigt ein Team, um es im Rahmen der vorgegebenen Zeit umzusetzen. Bisher besteht unsere Projektgruppe lediglich aus zwei Mitarbeitern. Diese „dünne Personaldecke“ ist dem Umstand geschuldet, dass wir als Projektgruppe seit sechs Monaten die Zusicherung der Förderung des BMWi zwar haben, aber bis heute kein Geld geflossen ist. Zudem erwartet das BMWi, die Zahl der zu führenden Interviews auf eine unbestimmte Zahl zu erhöhen. Es sind kaum 50 qualitative Interviews in einem Jahr schaffbar, geschweige denn die erweiterte. Der Aufbau der Datenbank, das Frontend, und die Langzeitarchivierung der großen Datenmenge sollten über die Sächsische Akademie (SAW) organisiert werden, um die Nachhaltigkeit des Projektes zu sichern. Erst nach Beginn des Projekts wurde deutlich, dass die SAW keine Kapazitäten dafür hat. Wir einigten uns auf einen Prototyp der Datenbank mit einem entsprechenden Frontend, das in Folgeprojekte münden und ausgearbeitet werden soll. Doch bleibt die Befürchtung, dass wir Daten produzieren, die in Vergessenheit geraten. Bei einem Projekt, in das mehrere erfahrene Institutionen involviert sind, hätte ich mehr Kommunikation und Unterstützung, zum Beispiel im Vorfeld für das Erstellen eines Datenmanagementplanes erwartet, das uns sicher vor einigen Problemen bewahrt hätte. Beispielsweise hätten wir mit einem DMP die juristische Komplexität, sowie die logistische und finanzielle Herausforderung einer Langzeitarchivierung erkennen und klären können. Wir stehen nun vor der Aufgabe, uns zusätzlich in neue Themenfelder einzuarbeiten, obwohl unsere finanziellen und personellen Kapazitäten dafür nicht vorhanden sind.

Posted on

85 Integration und Veröffentlichung von örtlichen Forschungen zur Familiengeschichte auf regionaler Ebene

< Back to problem stories

Im Rahmen der Familienforschung werden seit mehr als 80 Jahren u.a. von der Upstalsboom – Gesellschaft für historische Personenforschung und Bevölkerungsgeschichte in Ostfriesland e. V. (UG) Ortssippenbücher und Ortsfamilienbücher erstellt. Sie enthalten die Daten der Familienstammbäume der jeweiligen Kirchengemeinden einzelner Orte oder Familien. Diese werden mit Hilfe von Kirchenbüchern, standesamtlichen Unterlagen oder ähnlichen Primärquellen erstellt. Zurzeit sind von der UG 106 Ortssippenbücher, vier Familienbücher sowie dreiundzwanzig Bücher zur Familienkunde erstellt worden. Pro Jahr kommen drei bis fünf neue hinzu. Auch andere genealogische Vereinigungen erstellen Ortssippenbücher und Ortsfamilienbücher. Seit mehreren Jahren werden auch viele Informationssammlungen im Internet von vielen Autoren bereitgestellt. Diese stehen jede für sich und die Validität ist meist nicht zu beurteilen. Daher bleibt die klassische Suche in Archiven nach Primärdokumenten. Um eine Abstimmung von Personendaten zu erreichen, sollten die Forschungsdaten, versehen mit Referenzen auf Primärdokumente, untereinander vernetzt im Internet zu Verfügung werden. Beispiel hierfür wäre „WieWasWie-Everyone has a history“ (https://www.wiewaswie.nl). Hierzu wäre eine koordinierende und administrierende Person als Ansprechpartner sehr wichtig, ergänzt um FAQs im Internet. Den Autoren sollten Werkzeuge zur Unterstützung der Integration bereitgestellt werden. Diese Integration bedarf einer ständigen Überwachung sowie einer Dokumentation, die z. B. tote Punkte der jeweiligen Person, unscharfe Dokumentationen sowie Randunterschärfe der Datenwolke festhält. Weiter wäre es sinnvoll, Unterstützung bereit zu stellen, um vorhandene Primärdokumente, wie z.B. Archivmaterialien, Ortssippenbücher und Ortsfamilienbücher, zu digitalisieren und mit den anderen Daten validiert zu integrieren.

Posted on

84 Forschungsdaten als Vertrauenssache

< Back to problem stories

Als Leiter des Programmbereichs Forschungsinfrastrukturen an einem zeithistorischen Forschungsinstitut bin ich auf verschiedenen Ebenen mit den Bedürfnissen der Forschenden hinsichtlich Archivierung, Erschließung und Bereitstellung, der von ihnen produzierten Forschungsdaten, aber auch gleichzeitig auch mit einer ganzen Reihe von Unsicherheiten und Befürchtungen konfrontiert. Beim Aufbau eines institutsweiten Verfahrens und Regelsystem für den Umgang mit Forschungsdaten haben sich folgende Probleme gezeigt, die für den Aufbau übergreifender Infrastrukturen von Bedeutung sind: 1. Forschungsdaten sind eine "Vertrauenssache" und ein Feld von hoher Sensibilität für die Forschenden. Gegenüber forschungsfernen zentralen Infrastrukturen gibt es daher zahlreiche Vorbehalte, die durch intermediäre Strukturen des Datenmanagements aufgefangen werden müssen 2. Forschungsdatenmanagement setzt einen Kulturwandel in der Disziplin voraus. Wer seine Daten erschließt, archiviert und zur Nachnutzung bereitstellt muss daraus fachlichen Reputationsgewinn ziehen können. 3. Als Praxis muss Forschungsdatenmanagement bereits von Anfang an in den Prozess der Projektbearbeitung implementiert werden. Entsprechende Infrastrukturen sollten als Arbeitsumgebung funktionieren und Werkzeuge für die Bearbeitung der Daten bereitstellen. 4. Es müssen fachliche Standards für die Qualität von Forschungsdatensammlungen etabliert werden und ein Instrumentarium für die fachliche Kritik solcher Ergebnisformen etabliert werden ("H-Soz-Kult für Forschungsdaten") 5. Bislang fehlt es in den meisten Einrichtungen an Personal und Ressourcen für das Forschungsdatenmanagement. Neben dem Aufbau einer nationalen Infrastruktur muss diese Aufgaben in den Bereichen vor Ort als Feld fachlicher Wertschätzung und strategische Aufgabe etabliert werden, wofür entsprechende Ressourcen bereitgestellt werden. 6. Um eine Kultur im Umgang mit Forschungsdaten zu etablieren braucht es neben der zentralen Infrastruktur fachdisziplinbezogenen Wissensplattformen mit Tutorials, Ratgebern, Musterverträgen und Best-Practice Beispielen. Dazu sollten die etablierten Plattformen der Fachinformation und -Kommunikation weiterentwickelt werden 7. Es bedarf einer Aufklärungskampagne über Fragen des Datenschutzes bei Forschungsdaten, die Rechtssicherheit etablieren hilft. Auch dies eine Aufgabe für Data Culture

Posted on

83 Forschungsdatenmnagement als Support für Forschungsprojekte

< Back to problem stories

Als IT-Verantwortlicher an einer außeruniversitären Forschungseinrichtung möchte ich ein Forschungsdaten-Management-Verfahren einrichten. Ich erhalte Informationen über beginnende und laufende Projekte bzw. Ansprechpartner*innen aus der Verwaltung und führe Gespräche mit einzelnen Wissenschaftler*innen. Gleichzeitig beginnt das Institut mit der Aufarbeitung am Haus überlieferter Datensammlungen. So nimmt die Menge der anfallenden Projektinformationen aktuell stark zu, so dass ich ein eigenes Verwaltungssystem (interne Datenbank) angelegt habe. Ich erkenne die Notwendigkeit, von diesem System aus Schnittstellen zu unserem Forschungsinformationssystem wie auch zu anderen öffentlichen Online-Katalogen des Instituts herzustellen. Allerdings würde eine solche Erweiterung des Systems derzeit mehr Ressourcen kosten als mir auch mittelfristig für das Forschungsdatenmanagement zur Verfügung stehen. Auch erscheint mir die Entwicklung solcher Insellösungen pro Einrichtung nicht sehr effektiv. Konkret fehlen m.E. Data-Services, die Metadaten bzw. Formate für die Projektdaten-Beschreibung definieren und für eigene Bedürfnisse zu erweitern wären. Dies würde mehr Zeit für die Betreuung der einzelnen Forscher*innen und Projekte eröffnen.

Posted on

82 Interviews aus Forschungsprojekt als Forschungsdaten archivieren

< Back to problem stories

Als verantwortlicher Datenkurator bin ich in einem zeithistorischen Forschungsprojekts dafür verantwortlich die im Rahmen der Einzelstudien entstehenden Interviews zu archivieren und nach Möglichkeit digital für die Nachnutzung bereitzustellen. Im Bereich der Geschichtswissenschaft ist die Nachnutzung von Interviews eher ungewöhnlich. Einerseits ist vielen schwer vorstellbar, dass Interviews außerhalb des eigenen Forschungskontext bzw. der ursprünglichen Forschungsfrage einen wissenschaftlichen Wert besitzen. Andererseits besteht die Befürchtung, die Nachnutzung den Interviewten und dem zu ihnen entwickelten Vertrauensverhältnis nicht gerecht wird. Schließlich gibt es die durchaus berechtigte Sorge, durch das Offenlegen des gesamten Interviews inkl. der eigenen vielleicht auch naiven oder ungelenken Fragen, angreifbar zu werden. Diese Vorstellungen und Vorbehalte äußern sich auf verschiedenen Ebenen: 1. Massive Befürchtungen, dass die Interviewten gar nicht mehr zum Interview bereit sind, wenn man auch die Möglichkeit der Nachnutzung mit anspricht. 2. Vorbehalte durch eine entsprechende Lizenzierung die gemachten Interviews nach der Veröffentlichung der eigenen Studie zugänglich zu machen. 3. Die mit einer Archivierung verbundenen Anforderungen werden als Mehrarbeit/-belastung wahrgenommen, von der der/die jeweilige Forschende nichts hat. 4. Jenseits von technischen, Orts- und Zeitangaben nur wenige Standardvokabularien für zeithistorische Themen vorhanden. Um diesen und anderen Vorbehalten zu begegnen sehe ich verschiedene Ansatzpunkte: 1. Eine Wissensplattform auf der technische und methodische Hinweise sowie best-practice Erfahrungsberichte für zeitgeschichtliche Interviews und deren Nachnutzung gebündelt sind. 2. Die Weiterentwicklung der Wissenschaftskultur einer verantwortungsvollen Nachnutzung von zeithistorischen Interviews. 3. Idealerweise die für eine Langzeitarchivierung nötige Erfassung und Aufbereitung von Metadaten und Ton-/Bildaufnahmen auf einer Online-Plattform so implementieren, dass dieser Schritt auch für das eigene Forschungsvorhaben und die eigene Transkription/Annotation des Materials hilfreich ist. Die Mehrarbeit also durch einen sofortigen Mehrwert aufgewogen wird. Die zunächst nur im Forschungskontext sichtbaren Materialien könnten dann später leicht öffentlich zugänglich gemacht werden.

Posted on

81 Nachnutzung von zeitgeschichtlichen Interviews

< Back to problem stories

Zu einem zeitgeschichtlichen Thema wurden in den letzten Jahrzehnten viele Interviews im Rahmen von wissenschaftlichen Arbeiten zum Thema geführt. Ich würde gerne diese Interviews mit dem heutigen zeitlichen Abstand darauf untersuchen, welchen Einfluss sie auf die allgemeine Wahrnehmung des Gegenstands ausgeübt haben und wie der jeweilige zeitgeschichtliche Kontext der Interviewsituation sich in dieser und den (nicht) gestellten Fragen niedergeschlagen hat. Leider gibt es keine zentrale Stelle, an der solche Interviews verzeichnet sind, geschweige denn ein zentrales oder auch virtuelles Archiv. Viele Interviews sind in privaten Regalen der Forschenden oder kaum erschlossen an den beteiligten Institutionen gelagert, andere finden sich verteilt über verschiedene Archive. Manche Originalaufnahmen sind nicht mehr existent. In den seltensten Fällen ist die Frage der Nachnutzung rechtlich eindeutig geklärt. Oft hängt die Möglichkeit der Nachnutzung an persönlichen oder institutionellen Beziehungen und dem Vertrauen der Urheber*innen in die Nachnutzenden. Um die Ausgangssituation für solche Fragestellungen zu verbessern, sehe ich verschiedene Ansatzpunkte: 1. Ein Archivübergreifendes digitales Verzeichnis von Interviews, das die Auffindbarkeit verbessert. Vorhaben wie das DFG Projekt „Oral History digital“ mit dem das ZZF kooperiert sollten deshalb unbedingt in den NFDI-Prozess einbezogen werden. 2. Ein vereinheitlichtes Set von Metadaten, um die Recherche über Archivgrenzen hinweg zu vereinfachen. 3. Archivierungsangebote für einzelne Forschende und kleinere Institutionen, die eine angemessene Archivierung inkl. Aufbereitung des Materials für die Archivierung nicht selber leisten können. 4. Vorlagen für rechtliche Erklärungen (Einverständniserklärung,…), die auch die Möglichkeit der Nachnutzung einbeziehen und für alle Seiten transparent und praktikabel regeln. 5. Eine Debatte um den Wert von Interviews über den eigenen Forschungskontext hinaus als originäre Forschungsdaten. 6. Die Entwicklung einer Wissenschaftskultur der verantwortlichen Nachnutzung, die berücksichtigt, dass a) ein Interview nur auf Grundlage einer Vertrauensbeziehung zwischen Interviewenden und Interviewten entstanden ist und dieses Vertrauen nicht einfach übertragbar ist. b) ein Interview auch viel über den/die Forschende verrät und damit verletzbar/angreifbar macht.

Posted on

80 Zusammenhang und Trennschärfe zwischen Forschungsdaten und Objektdigitalisaten in einer kulturhistorischen Sammlung

< Back to problem stories

Unsere Einrichtung verfügt über eine große und thematisch breit gefächerte Sammlung historischer Objekte, die zugleich Grundlage der Forschungsarbeit unserer Wissenschaftler*innen ist. Die (z.T. dreidimensionale) Digitalisierung von Objekten zu Zwecken der Dokumentation, wissenschaftlichen Verfügbarmachung und nicht zuletzt auch zur Publikumsansprache gehört ebenso zu unserem wachsenden Aufgabenprofil wie diese objektbezogene Forschung. Dies wirft für mich, der ich den Aufbau entsprechender personeller und technischer Infrastrukturen betreue, Fragen danach auf, wo genau hier die Grenze des Begriffs ‚Forschungsdaten‘ zu ziehen ist: Sind z.B. die ‚bloßen‘ Digitalisate schon Forschungsdaten? Falls nicht, wie gehen wir mit dem Umstand um, dass die ‚tatsächlichen‘ Forschungsdaten sehr oft nur im direkten Zusammenhang mit den Digitalisaten interpretierbar sind? Hier sind technische Lösungen unabdingbar, die z.B. die Einbindung von (teils sehr großen) 3D-Modellen in digitale Forschungsumgebungen ermöglichen und die so m.E. nicht von Einzelinstitutionen entwickelt werden können.

Posted on