Task Area 4

94 Tiefenerschließung von digitalisierten Urkundenbüchern

< Back to problem stories

In einem Regional-Portal, das von einem Institut betrieben ist, dessen historischen Bereich ich leite, ist unter anderem ein landesgeschichtliches Urkundenbuch eingestellt. Es besteht aus derzeit 27 gedruckten Bänden, deren Volltext-Urkunden in digitalisierter Form bandweise und innerhalb dessen nach Urkundennummern abrufbar sind. Die gedruckten Register sind beigegeben, doch gibt es keine elektronische Verknüpfung der Registereinträge mit dem Textteil. Suchmöglichkeiten in den Daten bestehen derzeit nicht. Um die Nutzbarkeit des Urkundenbuchs in zeitgemäßer Weise zu erhöhen, bieten sich zwei Wege an: 1) Der Aufbau einer bandübergreifenden Volltextsuche – idealerweise mit Booleschen Operatoren, schreibweisentolerant und mit Umgebungs- und Phrasensuchmöglichkeit etwa nach den Vorbildern der »Library of Latin Texts« oder der »Migne«-Datenbanken. Doch wären in diesem Fall sehr hohe Investitionen in die notwendige IT erforderlich. Zudem zielt das landesgeschichtliche Interesse auch weniger auf die Durchsuchung des Wortschatzes als auf die enthaltenen historischen Orte und Personen. An dieser Stelle bieten sich – Weg 2) – die gedruckten Register an, in denen ein beachtlicher Teil der historisch-kritischen Arbeit der Herausgeber überliefert ist, die nun auch für die Online-Fassung des Urkundenbuches genutzt werden könnte. Dazu müssten allerdings – so stellt sich das Problem derzeit für uns dar – die Orts- und Personennamensregister jedes der 27 Bände händisch in eine datenbanktaugliche Form (Excel-Dateien) überführt werden. Anschließend würden die erfassten Registereinträge mit den bereits vorhandenen, online gestellten Bilddateien der Urkunden verlinkt. Schließlich könnten die digitalisierten und verlinkten Registereinträge der einzelnen Bände zu einer Gesamt-Datenbank verbunden werden. NutzerInnen könnten dann bandübergreifend von lediglich einem einzigen Suchportal aus nach Orts- und Personennamen recherchieren und die Suchergebnisse gesammelt abrufen. Bei Weg 2) fielen allerdings ähnlich wie bei Weg 1) hohe Kosten an –vor allem aufgrund der benötigten Arbeitszeit, was die Erreichung des Ziels auch hier in Frage stellt (Blocker: Ressourcenaufwand). Mögliche technische Lösungen: Gibt es beispielweise OCR-Technik für die Aufschlüsselung von komplex strukturierten Registern und für die Verknüpfung der dort genannten Nummern mit den zugehörigen Textdokumenten?

Posted on

92 Metadaten aus Forschungsprojekten: Singuläres vs. Standardisierung. Zum Problem der kategorialen Erschließung von Daten

< Back to problem stories

Auch im Bereich der philosophiehistorischen Grundlagenforschung wird zunehmend die Digitalisierung von Daten (Editionen, Zeitschriften, Kompendien, Archive) vorangetrieben. Dabei stellt sich die Frage, wie die entstehenden Datenmengen auszuwerten sind. Neben der Überlegung zu den technischen Möglichkeiten tritt auch ein hermeneutisches Problem: Wie ist ein sinnvoller kategorialer Zugriff auf die Daten möglich? Die klassischen Werkzeuge sind: Kategorien, Termini, Begriffe usw., aber auch Textsorten (Monographie, Zeitschriftenbeitrag, Nachlassmaterial usw.). Neue Werkzeuge des distant readings treten hinzu, bspw. die Makroanalyse, die computerbasierte Formanalyse von Textualität usw. In diesem Zusammenhang fehlt es bisher an einem Forum für eine vorgeschaltete Methodenreflexion. Es scheint kein guter Rat zu sein, ein Maximum an Werkzeugen in der Analyse der Datenmengen anzuwenden, oder sich ohne weiteres gegen die alten und für die neuen Werkzeuge zu entscheiden. Ein Vorteil der qualitativen Datenanalyse war und ist, dass singuläre Einheiten (Episoden) der Philosophiegeschichte bewahrt werden konnten; ein Nachteil der quantitativen Analyse könnte sein, dass im Verfahren der Standardisierung die Möglichkeit qualitativer Differenzierung von Episodischen und Generalisierendem verloren geht. Darüberhinaus besteht auch die Gefahr, dass durch die Erfassung der Daten im Prozess der Digitalisierung die alten Wissensspeicher - wie bspw. Lexika der Wörter, Begriffe, Metaphern, Kompendien systematischer und historischer Fragen an die Philosophiegeschichte - für obsolet erklärt werden und die Suggestion der für sich selbst sprechenden Daten (der alte "Mythos der Gegebenheit") sich festsetzt. Um hier Klarheit zu schaffen, sollte es als eine dringliche Aufgabe markiert werden, einen Weg zu finden, die alten und die neuen Werkzeuge zu kombinieren und andere Methoden, eventuell verscuhsweise Hybrid-Methoden zu entwickeln. So ist davon auszugehen, dass bspw. ein Historisches Wörterbuch der Philosophie (Erstauflage in den 1970er Jahren) für eine Neubearbeitung seinen Werkzeugkasten neu bestücken wird. Was das heißt und wie unsere Forschung als historisch arbeitende Geisteswissenschaftler*innen nicht nur in der Philosophie, sondern auch in den benachbarten Wissensdisziplinen aussehen wird, vor welchen Herausforderungen/ Möglichkeiten wir stehen und wie ein angemessener hermeneutischer Zugriff auf die digitalisierten Datenmengen (for Memory!) aussehen kann, darüber sollte eine Debatte stattfinden.

Posted on

91 Im Forschungsverbund – Der steinige Weg zum Geodaten-Repositorium

< Back to problem stories

Als An-Institut einer Universität sind wir Akteur in einem langhin etablierten Verbund unabhängiger Projekte der Grundlagenforschung, die zum Nutzen der interdisziplinären Städteforschung historisches Kartenmaterial edieren. Nach wie vor sind Printprodukte der traditionelle Output. Inzwischen aber haben sich Geoinformationssysteme (GIS) in den benachbarten Arbeitsbereichen Geografie und Archäologie so weit durchgesetzt, dass die Umstellung der Projektarbeiten von konventioneller Zeichensoftware hin zu GIS der nächste logische Schritt war, zumal dies auch eine Ausgangsbasis dafür bot, online die Verbreitung der Arbeitsergebnisse aus den Projekten zu verbessern. Bei der Koordinierung dieses Übergangsprozesses innerhalb des Forschungsverbundes, die bei uns im Haus erfolgt, treten für die internationale Scientific Community vielfältige Herausforderungen zutage. Während verschiedene Projekte in experimentellen Schritten die Datenproduktion erfolgreich auf Geodaten umgestellt und in Workshops ihre Ergebnisse verglichen haben, ist deutlich geworden, dass die anfänglichen ‚handwerklichen‘ Startschwierigkeiten (Knowhow, User Skills) tieferliegende, wissenschaftliche Probleme überdeckten. Unser Ziel der Schaffung eines domänenspezifischen (aber disziplinenübergreifenden) Forschungsdaten-Repositoriums für die Dissemination der Projektgeodaten, verstärkt dies noch. Einerseits ist der Schritt hin zu einem ‚Forschungsdatenbewusstsein‘ in der Scientific Community und zu einer Kultur, die neben der Datenproduktion auch die Bereitstellung der Basisdaten für die interdisziplinäre, länderübergreifende und vergleichende Forschung mitplant, größer als gedacht. Andererseits macht sich der Mangel an Standards für die Produktion und Verwendung von Geodaten in den Geschichtswissenschaften bemerkbar. Auch in diesem ‚Digital Turn‘, der primär die Historischen Grundwissenschaften Kartografie und Geografie tangiert, mündet die Quellenproblematik (Uneinheitlichkeit der Quellenüberlieferung, Uneindeutigkeit der Quellenbefunde) direkt in eine Datenproblematik. Etablierte Metadatenstandards müssen zudem für Geodaten mit historischem Bezug angepasst werden. Die Schaffung einer gemeinsamen Ontologie in einem angeschlossenen Forschungsprojekt steht vor eigenen inhaltlichen Herausforderungen. Letztlich wird ihre Verwendung im Repositorium dabei helfen, die Vergleichbarkeit der Daten über Disziplinen- und Ländergrenzen hinweg herzustellen, jedoch ist ihre Berücksichtigung im Workflow der Datenproduktion innerhalb der einzelnen Projekte eine weitere Hürde.

Posted on

86 Probleme ohne Datenmanagementplan

< Back to problem stories

Ich koordiniere ein anderthalbjähriges audiovisuelles Zeitzeugenprojekt, angesiedelt an der Sächsischen Akademie der Wissenschaften, in Kooperation mit der Humboldt Universität zu Berlin. Das Projekt wird durch Bund und Länder gefördert: Thüringen, Sachsen und die Wismut GmbH, die ihre Gelder durch das BMWi erhält. Laut Antrag beinhaltet das Vorhaben, 50 Zeitzeugeninterviews zu führen, diese filmisch zu dokumentieren, anschließend zu transkribieren, zu verschlagworten und sowohl für eine (Langzeit)archivierung bereitzustellen als auch in eine noch aufzubauende Datenbank zu integrieren. Ein Zeitzeugenprojekt mit diesem Umfang benötigt ein Team, um es im Rahmen der vorgegebenen Zeit umzusetzen. Bisher besteht unsere Projektgruppe lediglich aus zwei Mitarbeitern. Diese „dünne Personaldecke“ ist dem Umstand geschuldet, dass wir als Projektgruppe seit sechs Monaten die Zusicherung der Förderung des BMWi zwar haben, aber bis heute kein Geld geflossen ist. Zudem erwartet das BMWi, die Zahl der zu führenden Interviews auf eine unbestimmte Zahl zu erhöhen. Es sind kaum 50 qualitative Interviews in einem Jahr schaffbar, geschweige denn die erweiterte. Der Aufbau der Datenbank, das Frontend, und die Langzeitarchivierung der großen Datenmenge sollten über die Sächsische Akademie (SAW) organisiert werden, um die Nachhaltigkeit des Projektes zu sichern. Erst nach Beginn des Projekts wurde deutlich, dass die SAW keine Kapazitäten dafür hat. Wir einigten uns auf einen Prototyp der Datenbank mit einem entsprechenden Frontend, das in Folgeprojekte münden und ausgearbeitet werden soll. Doch bleibt die Befürchtung, dass wir Daten produzieren, die in Vergessenheit geraten. Bei einem Projekt, in das mehrere erfahrene Institutionen involviert sind, hätte ich mehr Kommunikation und Unterstützung, zum Beispiel im Vorfeld für das Erstellen eines Datenmanagementplanes erwartet, das uns sicher vor einigen Problemen bewahrt hätte. Beispielsweise hätten wir mit einem DMP die juristische Komplexität, sowie die logistische und finanzielle Herausforderung einer Langzeitarchivierung erkennen und klären können. Wir stehen nun vor der Aufgabe, uns zusätzlich in neue Themenfelder einzuarbeiten, obwohl unsere finanziellen und personellen Kapazitäten dafür nicht vorhanden sind.

Posted on

84 Forschungsdaten als Vertrauenssache

< Back to problem stories

Als Leiter des Programmbereichs Forschungsinfrastrukturen an einem zeithistorischen Forschungsinstitut bin ich auf verschiedenen Ebenen mit den Bedürfnissen der Forschenden hinsichtlich Archivierung, Erschließung und Bereitstellung, der von ihnen produzierten Forschungsdaten, aber auch gleichzeitig auch mit einer ganzen Reihe von Unsicherheiten und Befürchtungen konfrontiert. Beim Aufbau eines institutsweiten Verfahrens und Regelsystem für den Umgang mit Forschungsdaten haben sich folgende Probleme gezeigt, die für den Aufbau übergreifender Infrastrukturen von Bedeutung sind: 1. Forschungsdaten sind eine "Vertrauenssache" und ein Feld von hoher Sensibilität für die Forschenden. Gegenüber forschungsfernen zentralen Infrastrukturen gibt es daher zahlreiche Vorbehalte, die durch intermediäre Strukturen des Datenmanagements aufgefangen werden müssen 2. Forschungsdatenmanagement setzt einen Kulturwandel in der Disziplin voraus. Wer seine Daten erschließt, archiviert und zur Nachnutzung bereitstellt muss daraus fachlichen Reputationsgewinn ziehen können. 3. Als Praxis muss Forschungsdatenmanagement bereits von Anfang an in den Prozess der Projektbearbeitung implementiert werden. Entsprechende Infrastrukturen sollten als Arbeitsumgebung funktionieren und Werkzeuge für die Bearbeitung der Daten bereitstellen. 4. Es müssen fachliche Standards für die Qualität von Forschungsdatensammlungen etabliert werden und ein Instrumentarium für die fachliche Kritik solcher Ergebnisformen etabliert werden ("H-Soz-Kult für Forschungsdaten") 5. Bislang fehlt es in den meisten Einrichtungen an Personal und Ressourcen für das Forschungsdatenmanagement. Neben dem Aufbau einer nationalen Infrastruktur muss diese Aufgaben in den Bereichen vor Ort als Feld fachlicher Wertschätzung und strategische Aufgabe etabliert werden, wofür entsprechende Ressourcen bereitgestellt werden. 6. Um eine Kultur im Umgang mit Forschungsdaten zu etablieren braucht es neben der zentralen Infrastruktur fachdisziplinbezogenen Wissensplattformen mit Tutorials, Ratgebern, Musterverträgen und Best-Practice Beispielen. Dazu sollten die etablierten Plattformen der Fachinformation und -Kommunikation weiterentwickelt werden 7. Es bedarf einer Aufklärungskampagne über Fragen des Datenschutzes bei Forschungsdaten, die Rechtssicherheit etablieren hilft. Auch dies eine Aufgabe für Data Culture

Posted on

81 Nachnutzung von zeitgeschichtlichen Interviews

< Back to problem stories

Zu einem zeitgeschichtlichen Thema wurden in den letzten Jahrzehnten viele Interviews im Rahmen von wissenschaftlichen Arbeiten zum Thema geführt. Ich würde gerne diese Interviews mit dem heutigen zeitlichen Abstand darauf untersuchen, welchen Einfluss sie auf die allgemeine Wahrnehmung des Gegenstands ausgeübt haben und wie der jeweilige zeitgeschichtliche Kontext der Interviewsituation sich in dieser und den (nicht) gestellten Fragen niedergeschlagen hat. Leider gibt es keine zentrale Stelle, an der solche Interviews verzeichnet sind, geschweige denn ein zentrales oder auch virtuelles Archiv. Viele Interviews sind in privaten Regalen der Forschenden oder kaum erschlossen an den beteiligten Institutionen gelagert, andere finden sich verteilt über verschiedene Archive. Manche Originalaufnahmen sind nicht mehr existent. In den seltensten Fällen ist die Frage der Nachnutzung rechtlich eindeutig geklärt. Oft hängt die Möglichkeit der Nachnutzung an persönlichen oder institutionellen Beziehungen und dem Vertrauen der Urheber*innen in die Nachnutzenden. Um die Ausgangssituation für solche Fragestellungen zu verbessern, sehe ich verschiedene Ansatzpunkte: 1. Ein Archivübergreifendes digitales Verzeichnis von Interviews, das die Auffindbarkeit verbessert. Vorhaben wie das DFG Projekt „Oral History digital“ mit dem das ZZF kooperiert sollten deshalb unbedingt in den NFDI-Prozess einbezogen werden. 2. Ein vereinheitlichtes Set von Metadaten, um die Recherche über Archivgrenzen hinweg zu vereinfachen. 3. Archivierungsangebote für einzelne Forschende und kleinere Institutionen, die eine angemessene Archivierung inkl. Aufbereitung des Materials für die Archivierung nicht selber leisten können. 4. Vorlagen für rechtliche Erklärungen (Einverständniserklärung,…), die auch die Möglichkeit der Nachnutzung einbeziehen und für alle Seiten transparent und praktikabel regeln. 5. Eine Debatte um den Wert von Interviews über den eigenen Forschungskontext hinaus als originäre Forschungsdaten. 6. Die Entwicklung einer Wissenschaftskultur der verantwortlichen Nachnutzung, die berücksichtigt, dass a) ein Interview nur auf Grundlage einer Vertrauensbeziehung zwischen Interviewenden und Interviewten entstanden ist und dieses Vertrauen nicht einfach übertragbar ist. b) ein Interview auch viel über den/die Forschende verrät und damit verletzbar/angreifbar macht.

Posted on

77 Workshop Datenpublikation: Suche Syllabus!

< Back to problem stories

Als verantwortliche Person an einer außeruniversitären Einrichtung möchte ich für die Forschenden in der Qualifizierungsphase Weiterbildungsformate im Bereich Forschungsdatenmanagement anbieten. Insbesondere die Publikation von Forschungsdaten soll gemäß der institutionellen Forschungsdatenleitlinie unterstützt werden. Ein eintägiger Workshop zu Möglichkeiten und Rahmenbedingungen von Datenpublikationen in den Geschichtswissenschaften soll für den Themenbereich sensibilisieren und konkrete Handlungsoptionen für die Forschenden bieten. Eine Konzeption der Veranstaltung von Null auf wäre zu aufwendig für die Einrichtung, so dass ich auf vorhandene Konzepte und Material zurückgreifen möchte und dieses über eine Internetrecherche auffindbar sein sollte. Das Material sollte einen vollständigen Syllabus und Foliensätze umfassen sowie idealerweise auch das Feedback von Teilnehmenden bereits realisierter Veranstaltungen enthalten. Die Recherche blieb jedoch erfolglos: Veranstaltungen zum Forschungsdatenmanagement in den historischen Wissenschaften finden sich insgesamt nur wenige, die recherchierbar und dokumentiert sind, darunter sind noch weniger als Fortbildungsveranstaltung für die Qualifizierungsphase konzipiert und nachnutzbares Lehrmaterial findet sich darunter nur in absoluten Ausnahmefällen, jedoch keines zum Thema Datenpublikation. Während für generische Themen des Forschungsdatenmanagements ausreichend Material zur Verfügung steht, fehlt es an den notwendigen fachspezifischen Adaptionen, besonders im Bereich der historischen Geisteswissenschaften.

 

Task Area

Perspective

Tags

Posted on

73 How to avoid misrepresentations of data

< Back to problem stories

I am Principal Investigator in a project (PENELOPE, funded by ERC, Deutsches Museum) where the key objective is to explore what is categorised as tacit knowledge, in (ancient) weaving. We make a claim that mathematical knowledge, was itself abstracted from weaving principles in Ancient Greece. In order to explicate such knowledge as being rational and technological, we show coding, algorithms, and numbers implicit in weaving practices. Our problem for data management is that, even though we developed a lot of experiments (live coded looms, robot swarms dancing around a maypole, documenting tacit technological conversations of weavers at looms), only the interaction of all of them can eventually be understood as the point we make for weaving knowledge. Once we move forward, the object cannot solve the problem, and when placed in the public domain can end up misrepresenting what the research outcomes are. How do we avoid this situation? In order to generate the necessary insights, we get users to experience the nature of this knowledge, creating analogies through different algorithmic practices – in music, in computers, on looms. We will set up a final workshop/exhibit and make videos of such experiments as documentation. However, the data processing when weaving becomes available only when the object is in motion, in use. The information is complete only when there is actual engagement with the material objects of our project. How do we save this experiential component, which is available in the project, as data structure? If we put this into a data storage facility, we fall into the trap of creating a new graveyard for weaving knowledge. How do we avoid this trap? How can we actually mark points of ‘missing’ data connections?

Posted on

72 Interdisziplinäre Forschung

< Back to problem stories

Story In einem gemeinsamen Projekt wollen Kunsthistoriker*innen, Historiker*innen und Musikwissenschaftler*innen die Geschichte, Rezeption und Präsentation eines epochalen Ereignisses erforschen. Sie suchen nun für die Entwicklung des Antrags und die Planung der Aufgaben Ansprechpartner*innen und Infrastruktureinrichtungen, die ihnen sagen können, wie sie mit den entstehenden Datenmengen (Bilddaten, digitale Editionen, Textdatenbanken, annotierte Digitalisate, etc.) umgehen sollen. Sie möchten z.B. wissen: • Was sind die besten Vorgehensweisen zur Benennung der Daten und ihrer Verwaltung? • Welche Datenformate sind besonders geeignet? • Wo können sie die Daten nach Abschluss des Projektes sichern? • Wie und wo sie können sie diese Daten für andere Wissenschaftler*innen ihrer Disziplinen gut auffindbar machen? Bei der Suche nach Informationen finden sie viele sehr allgemeine und wenige genauere Hinweise, die dann aber aus der Sicht nur einer der beteiligten Disziplinen verfasst sind. Das Team findet keine Best Practices und keine Beratungen, die auf die Herausforderungen interdisziplinärer Vorhaben in ihren Wissenschaften eingehen. Potentielle Lösung Arbeitskreis Digital Humanities als ein institutionalisiertes Gremium von Digital Humanists aus der Projektpraxis in den verschiedenen Geistes- und Sozialwissenschaften

Posted on

71 Grenzübergreifende Forschung

< Back to problem stories

Story In einem gemeinsamen Projekt italienischer, französischer und deutscher Wissenschaftler*innen werden die Berichte, Korrespondenzen und Sachzeugnisse dreier Reisender auf ihrer Grand Tour erforscht. Die Quellen befinden sich in Archiven und Museen in Italien, Frankreich, Deutschland und in der Schweiz. Viele dieser Quellen sind nicht digitalisiert, sollen aber durch das Projekt digitalisiert werden. Von Beginn an möchte das Team, dass: • die Digitalisate anschließend übergreifend auffindbar und verwendbar sind, • die Daten zu den Stationen der Grand Tour in allen beteiligten Ländern einfach auffindbar sind, • die Daten und Digitalisate im Rahmen des Wissenstransfers frei und einfach genutzt werden können. Das Projektteam findet aber in jedem Land unterschiedliche Ansprechpartner*innen, zum Beispiel sind mal die Archive und mal Forschungsinstitute zuständig. Die Wissenschaftler*innen können bei den Auskünften nicht einschätzen, inwieweit die vorgeschlagenen Lösungen auch für das andere Land passend sind. Insgesamt fehlen Best Practices und Ansprechpartner*innen für den Umgang mit Forschungsdaten in grenzübergreifenden Projekten in der Geschichtswissenschaft. Potentielle Lösung Kompetenzbereich der Max Weber Stiftung: traditionsreiche bi- und multinationale Projektarbeit

Posted on