Task area

78 Alle nutzen dann meine Daten – aber was habe ich davon?

< Back to problem stories

Ich soll zukünftig meine Forschungsdaten unter einer offenen Lizenz publizieren und zur Nachnutzung zur Verfügung stellen. Prinzipiell habe ich da nichts dagegen, aber ich habe diese Daten schon seit zehn Jahren gesammelt, sehr viel Arbeit investiert und auch die Aufbereitung für die Publikation ist noch einmal aufwändig. Ich habe auch nocht nicht selbst alle Aspekte ausgewertet. Was habe ich als Forschende eigentlich davon? Bisher werden die Daten in der Geschichtswissenschaft maximal zitiert (wenn überhaupt) und das bringt mir kaum einen wissenschaftlichen Benefit. In den naturwissenschaftlichen Fächern werden die Produzenten von Daten bei Nachnutzung automatisch auch an den neu entstehenden Publikationen als Co-Autoren beteiligt. In der Geschichtswissenschaft ist davon noch nichts zu spüren, sondern man erfährt mit solchen Ansinnen eher Ablehnung. Ganz im Gegenteil: Wenn ich Paper mit mehreren Autoren einreiche, werden diese bei Qualifizierungsanerkennungen noch aussortiert, weil da mein eigener Beitrag nicht ausreichend erkennbar ist.

 

Task Area

Perspective

Tags

Posted on

77 Workshop Datenpublikation: Suche Syllabus!

< Back to problem stories

Als verantwortliche Person an einer außeruniversitären Einrichtung möchte ich für die Forschenden in der Qualifizierungsphase Weiterbildungsformate im Bereich Forschungsdatenmanagement anbieten. Insbesondere die Publikation von Forschungsdaten soll gemäß der institutionellen Forschungsdatenleitlinie unterstützt werden. Ein eintägiger Workshop zu Möglichkeiten und Rahmenbedingungen von Datenpublikationen in den Geschichtswissenschaften soll für den Themenbereich sensibilisieren und konkrete Handlungsoptionen für die Forschenden bieten. Eine Konzeption der Veranstaltung von Null auf wäre zu aufwendig für die Einrichtung, so dass ich auf vorhandene Konzepte und Material zurückgreifen möchte und dieses über eine Internetrecherche auffindbar sein sollte. Das Material sollte einen vollständigen Syllabus und Foliensätze umfassen sowie idealerweise auch das Feedback von Teilnehmenden bereits realisierter Veranstaltungen enthalten. Die Recherche blieb jedoch erfolglos: Veranstaltungen zum Forschungsdatenmanagement in den historischen Wissenschaften finden sich insgesamt nur wenige, die recherchierbar und dokumentiert sind, darunter sind noch weniger als Fortbildungsveranstaltung für die Qualifizierungsphase konzipiert und nachnutzbares Lehrmaterial findet sich darunter nur in absoluten Ausnahmefällen, jedoch keines zum Thema Datenpublikation. Während für generische Themen des Forschungsdatenmanagements ausreichend Material zur Verfügung steht, fehlt es an den notwendigen fachspezifischen Adaptionen, besonders im Bereich der historischen Geisteswissenschaften.

 

Task Area

Perspective

Tags

Posted on

76 Bereitstellung von Daten – Daten aus einer Objektsammlung

< Back to problem stories

Als Forscher wollte ich gern eine datengetriebene Analyse zur Verbreitung heraldischer Motive auf mittelalterlichen Objekten durchführen. Geeignete Daten schien es an einer großen Objektsammlung zu geben, die ihre Sammlung sehr ansprechend in einem online-Portal präsentiert. Hier konnte man facettiert die Suchmenge z.B. auf Mittelalter, Deutsches Reich, heraldisch eingrenzen. Die einzelnen Objekte sind zudem jeweils in LIDO-XML beschrieben, wobei die XML-Dateien zu den Objekten jeweils downloadbar sind. Um tatsächlich über den gesamten Bestand arbeiten zu können, hätte ich auch Zugang zu den Daten der Sammlung gebraucht. Eine Schnittstelle oder einen Data-Dump für die gesamte Sammlung und das Treffen einer entsprechenden Auswahl gab es nicht. Alles, was man herunterladen konnte, waren die LIDO-Files für die einzelnen Objekte, in denen die Informationen zu den heraldische Motiven nicht inkludiert waren.

 

Task Area

Perspective

Tags

Posted on

75 Sicherung und Aktualisierung von „älteren“ Datenbanken

< Back to problem stories

Vor gut 20 Jahren wurden in einem Forschungsprojekt sämtliche Vorstände und Aufsichtsräte deutscher Unternehmen der Jahre 1906, 1927, 1932, 1933 und 1954 in einer Datenbank erfasst. Das Ziel war es, wirtschaftliche und familiäre Vernetzung zu ermitteln und die Struktur der Wirtschaftselite in den Umbruchzeiten zu analysieren. Als Quelle standen die Handbücher der deutschen Aktiengesellschaften in mehreren Ausgaben zur Verfügung. Die Angaben wurden per Hand in eine „Filemaker“-Datenbank eingetragen. Im Laufe der Jahre musste die Datenbank mehrfach in gängigere Formate konvertiert werden, um sie les- und bearbeitbar zu halten. Im Zuge dessen ergaben sich entsprechende Übertragungsprobleme. In diesem Kontext ergeben sich folgende Fragen: a) Wir kann die dauerhafte Sicherung und Aktualisierung von älteren Datenbanken garantiert werden? Sollte es Software-Vorgaben bzw. Empfehlungen geben, um die Daten langfristig nutzbar zu halten? b) Bei der Eingabe der Daten wurden bestimmte Schlagwörter und Abkürzungen z.B. für Berufsbezeichnungen oder Titel vergeben. Es wäre sicher sinnvoll, solche Zuordnungen von Angaben zu Personen nach einem gemeinsamen Standard vorzunehmen, um die spätere Metasuche zu erleichtern. Wie kann dies gelingen?

Posted on

74 Kontrollierte Vokabulare und proprietäre Softwares

< Back to problem stories

Als Forschungseinrichtung müssen wir die Langzeitarchivierung der Forschungsdaten sichern aber sind von unseren proprietären Softwares auf verschiedenen Ebenen eingeschränkt. Zwar erlaubt unser Datenbanksystem die Daten laut verschiedenen Formaten (e.g. XML) und Schemata eines selben Formats (e.g. archivfachlichem XML-EAC) zu exportieren aber die innerhalb des Datenbanksystems bereits bestehenden Thesauri und Taxonomien können ohne (gebührenpflichtige) technische Betreuung nicht ausgeführt werden. Da die Migration aller Forschungsdaten zu einem neuen geeigneteren (Langzeitarchivierungs-)Gerät jedenfalls zeit-, arbeits- und kostenintensiv wäre, möchten wir dafür sorgen, dass nicht nur die Daten sondern auch die kontrollierten Vokabulare aufbewahrt werden sollen. Wie werden kontrollierte Vokabulare in den Geisteswissenschaften normgerecht freigemacht und langfristig archiviert?

Posted on

73 How to avoid misrepresentations of data

< Back to problem stories

I am Principal Investigator in a project (PENELOPE, funded by ERC, Deutsches Museum) where the key objective is to explore what is categorised as tacit knowledge, in (ancient) weaving. We make a claim that mathematical knowledge, was itself abstracted from weaving principles in Ancient Greece. In order to explicate such knowledge as being rational and technological, we show coding, algorithms, and numbers implicit in weaving practices. Our problem for data management is that, even though we developed a lot of experiments (live coded looms, robot swarms dancing around a maypole, documenting tacit technological conversations of weavers at looms), only the interaction of all of them can eventually be understood as the point we make for weaving knowledge. Once we move forward, the object cannot solve the problem, and when placed in the public domain can end up misrepresenting what the research outcomes are. How do we avoid this situation? In order to generate the necessary insights, we get users to experience the nature of this knowledge, creating analogies through different algorithmic practices – in music, in computers, on looms. We will set up a final workshop/exhibit and make videos of such experiments as documentation. However, the data processing when weaving becomes available only when the object is in motion, in use. The information is complete only when there is actual engagement with the material objects of our project. How do we save this experiential component, which is available in the project, as data structure? If we put this into a data storage facility, we fall into the trap of creating a new graveyard for weaving knowledge. How do we avoid this trap? How can we actually mark points of ‘missing’ data connections?

Posted on

72 Interdisziplinäre Forschung

< Back to problem stories

Story In einem gemeinsamen Projekt wollen Kunsthistoriker*innen, Historiker*innen und Musikwissenschaftler*innen die Geschichte, Rezeption und Präsentation eines epochalen Ereignisses erforschen. Sie suchen nun für die Entwicklung des Antrags und die Planung der Aufgaben Ansprechpartner*innen und Infrastruktureinrichtungen, die ihnen sagen können, wie sie mit den entstehenden Datenmengen (Bilddaten, digitale Editionen, Textdatenbanken, annotierte Digitalisate, etc.) umgehen sollen. Sie möchten z.B. wissen: • Was sind die besten Vorgehensweisen zur Benennung der Daten und ihrer Verwaltung? • Welche Datenformate sind besonders geeignet? • Wo können sie die Daten nach Abschluss des Projektes sichern? • Wie und wo sie können sie diese Daten für andere Wissenschaftler*innen ihrer Disziplinen gut auffindbar machen? Bei der Suche nach Informationen finden sie viele sehr allgemeine und wenige genauere Hinweise, die dann aber aus der Sicht nur einer der beteiligten Disziplinen verfasst sind. Das Team findet keine Best Practices und keine Beratungen, die auf die Herausforderungen interdisziplinärer Vorhaben in ihren Wissenschaften eingehen. Potentielle Lösung Arbeitskreis Digital Humanities als ein institutionalisiertes Gremium von Digital Humanists aus der Projektpraxis in den verschiedenen Geistes- und Sozialwissenschaften

Posted on

71 Grenzübergreifende Forschung

< Back to problem stories

Story In einem gemeinsamen Projekt italienischer, französischer und deutscher Wissenschaftler*innen werden die Berichte, Korrespondenzen und Sachzeugnisse dreier Reisender auf ihrer Grand Tour erforscht. Die Quellen befinden sich in Archiven und Museen in Italien, Frankreich, Deutschland und in der Schweiz. Viele dieser Quellen sind nicht digitalisiert, sollen aber durch das Projekt digitalisiert werden. Von Beginn an möchte das Team, dass: • die Digitalisate anschließend übergreifend auffindbar und verwendbar sind, • die Daten zu den Stationen der Grand Tour in allen beteiligten Ländern einfach auffindbar sind, • die Daten und Digitalisate im Rahmen des Wissenstransfers frei und einfach genutzt werden können. Das Projektteam findet aber in jedem Land unterschiedliche Ansprechpartner*innen, zum Beispiel sind mal die Archive und mal Forschungsinstitute zuständig. Die Wissenschaftler*innen können bei den Auskünften nicht einschätzen, inwieweit die vorgeschlagenen Lösungen auch für das andere Land passend sind. Insgesamt fehlen Best Practices und Ansprechpartner*innen für den Umgang mit Forschungsdaten in grenzübergreifenden Projekten in der Geschichtswissenschaft. Potentielle Lösung Kompetenzbereich der Max Weber Stiftung: traditionsreiche bi- und multinationale Projektarbeit

Posted on

70 Sozialdaten als Quellen der Zeitgeschichte

< Back to problem stories

Im Rahmen eines geförderten Projekts beteiligt sich das DHI London daran, Richtlinien für eine von zeithistorischen ForscherInnen dringend benötigte Infrastruktur zur Erfassung, Langzeitarchivierung, Zugänglichkeit und Auswertung neuartiger Datenbestände (sogenannter „Sozialdaten“) aufzubauen. Bei Sozialdaten handelt es sich um die seit der 2. Hälfte des 20. Jahrhunderts zunehmend erzeugten Datensammlungen einerseits staatlicher Behörden, andererseits (im breitesten Sinne) sozialwissenschaftlicher Forschungen. Dies sind heterogene, oft fragmentarisch überlieferte, quantitative und qualitative Daten. Ziel der laufenden Machbarkeitsstudie ist, vorhandene Sozialdatenbestände zu evaluieren, die Bedarfe zeithistorischer Forschung zu erfassen und Umsetzungsmodelle für den Aufbau einer solchen Forschungsdateninfrastruktur herauszuarbeiten und in der Fachcommunity breit zu verankern. Die Forschungsinfrastruktur soll unter anderem zum Erreichen folgender Ziele beitragen: • Sozialdaten sollen als historische Quellen erschlossen und langzeitarchiviert werden können; • diese Datenbestände sollen für die historische Forschung sichtbar dokumentiert und zentral recherchierbar sein; • Metadatenformate zur Kontextualisierung sollen bereitgestellt werden; • es sollen fortlaufend Tools zur optimalen Nutzung der Sozialdaten gemäß den historischen Forschungsinteressen entwickelt und betreut werden; • Beratungs- und Schulungsangebote zu Sozialdaten sollen angeboten werden; • Bedingungen einer rechtskonformen Nachnutzung von Sozialdaten in Bezug auf Datenschutz, Nutzungsbedingungen und Eigentum an den Daten sollen erkundet werden; • Plattformen für die Kommunikation zwischen DatennutzerInnen und DatenhalterInnen sowie zwischen sozial- und geschichtswissenschaftlichen Forschenden sollen entstehen; • die Verknüpfung mit anderen nationalen und internationalen Infrastrukturen gleichen Typs soll hergestellt werden, um mittel- bzw. langfristig internationale Forschungsinfrastrukturen aufbauen zu können. Die Forschenden stoßen auf folgende Probleme: • stark fragmentierte Datenbestände; • Fehlen einer leicht auffindbaren und aussagekräftigen Dokumentation der Daten (beispielsweise zum Archivierungsort); • Fehlen einheitlicher Standards zum Kuratieren zeitgeschichtlicher Daten, etwa von Interviews; • rechtliche Unklarheiten, etwa zu Datenschutz, Urheberrecht, Anonymisierung; • hohe Hürden für HistorikerInnen zur Forschung mit Sozialdaten, da frei verfügbare Sozialdatenbestände fehlen und die statistischen Kenntnisse für deren Auswertung nicht in den historischen Curricula der Universitäten verankert sind; • Nichtberücksichtigung von Schnittstellen zu sozialwissenschaftlichen Infrastrukturen und Erschließungstechniken beim bisherigen Aufbau digitaler geisteswissenschaftlicher Forschungsinfrastrukturen.

Posted on

69 Wie lassen sich die Bestände unseres Forschungsarchivs zeitgemäß erschließen?

< Back to problem stories

Unser Spezialarchiv, das Teil einer außeruniversitären Forschungseinrichtung ist, befasst sich mit der Bewahrung historischen Materials institutioneller wie privater Herkunft und muss daher frühere Konzepte der Strukturierung physisch vorhandener Bestände und von Wissen (Behördenhierarchien etc.) nachvollziehen. Zugleich müssen wir bei der Erschließung und Digitalisierung versuchen vorwegzunehmen, was für künftige Nutzer*innen interessant sein wird, und eine entsprechende Aufbereitung des Vorhandenen ermöglichen oder zumindest nicht verhindern. Darüber hinaus befinden wir uns in einer größeren technischen und organisatorischen Umbruchphase und stehen dabei unter anderem vor der Frage, welche Erschließungsformen zukunftsträchtig und arbeitsökonomisch sind: freie Schlagworte oder kontrollierte Vokabulare? Hierarchien oder Ontologien/Wissensnetzwerke?

Posted on