Task Area 5: Data Culture

TA5 aims to encourage reflection upon and the (re)use of research data and corresponding digital methods and to foster a distinct data culture in our community. This requires a critical, shared discourse about the demands, pathways and consequences of digitalisation in our disciplines; incentivising the development of new competencies, methods and approaches; and expanding our instruments of information, opinion-formation and communication. TA5 thus aims to integrate long-established analogue research practices into new, data-driven approaches, anchoring the standards and services developed in the consortium in day-to-day disciplinary practice. Here, “data culture” has two senses. More broadly, it refers to the integration of data and data-driven methods and practices into the professional culture of historical disciplines, which requires increasing the understanding and acceptance of new digital methods and procedures and a wideranging discussion on how they change the production of historical knowledge. More narrowly, the term encompasses the day-to-day practices of dealing with research data and their associated responsibilities, including legal and ethical issues, questions of sustainability and the referencing and recognition of data as scholarly achievements. We require policies and guidelines to encourage a data culture that values research data; facilitates and promotes data sharing and (re)use to preserve, critically evaluate and advance historical knowledge; and ensures data security and reliability. It is based on the FAIR principles and accords with the CARE principles, ensuring that data is used not only academically but also ethically and responsibly.


Measures

We must encourage reflection on digitalisation’s consequences: changing epistemological foundations, the permeability and potential redrawing of disciplinary boundaries, and the role of citizen sciences in producing historical knowledge. Future research must account for the impact of the digital encoding of knowledge systems, e.g. cultural bias and constraints on long-term disciplinary development. Addressing these questions, M1 provides a basis for other measures. The goals are: bringing together experts and gatekeepers from across the community, but also representatives from neighbouring consortia such as 4Objects, to further a critical discourse on digital epistemologies and disseminate their findings to the wider community; engaging in a vibrant exchange with the community; enabling a mutual integration between our discourse and those of the relevant international communities; and helping early-career researchers join the debate. Specific topics will be determined by the expert group and may include: the datafication of historical sources, digitality and epistemology; AI and historical knowledge production; the impact of knowledge graphs and authority files on the knowledge order; born-digital sources and the loss of authenticity; and new disciplinary boundaries and professional profiles.
Researchers will only create and provide research data if they know how to use them and are sure that others will be able to use them effectively. Relevant methods must be made known and accessible and anchored in practice. We first gain an overview of the state of the use of data and methods in historical studies, track community developments and trace 4Memory’s impact and the need for further action. We evaluate established and innovative methods, demonstrate their utility and make them available to researchers with the necessary data skills (TA4), while creating incentives for others to acquire them. By drawing on the consortium's infrastructure and data (with TA3), we create use case demonstrators. By organising hackathons, impulses will be gathered from a broader community, highlighting the public relevance of the critical function of research data and the digital transformation of historical studies. The information and competencies thus gained will be proactively made available to DH centres and coordinators at universities, research and memory institutions and, through them, anchored in practice; in return, their experiences will be reintegrated. Finally, we shift the focus from methods to research questions to incorporate those methods in current historical research, strengthen the link and dialogue between analogue and digital historians and showcase new methods and practices (such as co-authorship) in traditional publications. In doing so, we aim to boost disciplinary innovation processes while ensuring domain-specific accessibility to a variety of algorithms and methods to prevent monopolisation, which is essential for free and open research and use of research data.
Responsibly using sources from contexts of injustice (such as dictatorships, colonial rule or genocide) has long been central to the historical study of entire eras, regions and themes. But the changes that come with the digital representation of these sources, born-digital sources and new technologies – such as the decontextualisation of data or their easier availability, duplicability and mutability – pose new challenges for our field and for society. We need a comprehensive discourse on the ethical principles and legal challenges arising from Machine Learning, Big Data and the emergence of AI (such as synthetic data, deep fakes or bias); on public responsibility for open access research data and its reuse by third parties with different agendas (such as private companies or government agencies); on data authenticity and falsification; on protecting personal data and privacy; on data security; on copyright issues and the legal framework for preserving and providing digital sources for future research (to avoid the loss of the history of the digital present); on issues of scientific freedom such as user tracking or free access to data and open software as well as the ecological footprints of our research data. Many in our community are unsure about these issues: moving towards a data culture thus requires a better understanding of and competence in addressing them. We will gather a range of expertise and also explore the legal and ethical challenges arising from technological developments to provide guidance to the community and the public and to highlight where steps must be taken. The often abstract and complex nature of such issues has limited the community's interest in addressing them. Thus, they need to be communicated as comprehensibly as possible. Building on this, the community needs basic information. Finally, since historical data and their handling are also societal issues, this discussion must extend beyond narrower academic circles into the public.
Researchers’ status and visibility depend on peer review, which ultimately defines “good” and “relevant” research. Increasing the acceptance of data-driven research in our field requires incorporating a review system for research data and data-driven research into practices and institutions established over centuries. Digital transformation and datafication are leading to even greater changes in our publication culture, as established genres expand via data publications, data papers or computational publications and digital publications of all kinds. These shifts entail new forms of authorship, publication technologies and citation methods. A new data culture requires a new publication culture and – especially for innovative young researchers – integrating research data into our established reputation system. M4 identifies challenges and introduces solutions, testing and implementing them via our own publications, exemplarily anchoring them in the publication culture. M4 focuses on integrating research data and data-driven research into the reputation system, requiring new assessment criteria that combine established, analogue standards of quality assessment with technical, data-driven methodological competencies. Changing review processes and their technological underpinnings must also be explored. Above all, changes must be visibly implemented in the key review publications, as is done here using the online platform H-Soz-Kult, published by Clio-online e.V., with its over 30,000 subscribers, over one million monthly pageviews by natural persons, and more than 1,000 reviews per year covering all fields of historically oriented humanities.
What practical means will shift the historically oriented humanities towards a data culture, increase the acceptance of research data and support the next generation of digital researchers in working with research data? Other measures enable reflection, methodological innovation, discussion of ethical and legal issues and increase recognition for data-driven research: M5 aims at implementing these efforts among different groups, especially early-career researchers. It provides an infrastructure for informing, discussing, networking and collaborating, thus anchoring needed changes in our community. It includes creating a communicative hub on data culture; providing space and time for master's students, early career researchers and practitioners from academia, memory institutions and public history and citizen science projects to learn about digital transformation, discuss mutual expectations and needs and reflect upon new job profiles and qualification pathways; networking PhD students who are integrating digital methods and digital transformation in historical scholarship in order to strengthen their position in the field; offering short-term postdoc fellowships to share research data from their PhD or other projects, demonstrating the publication of research data; and communicating the digital transformation in historical scholarship and resulting shifts in our perspectives to the larger public.

Related Problem Stories

Als Lehrstuhl einer Hochschule forschen wir auch mit und an Werkzeugen aus dem Bereich der automatisierten Auswertung von Datenbeständen. Ein wesentlicher Teil der Datenbestände sind digitalisierte Textkorpora, die zumeist in einem Textformat, wie beispielsweise XML, vorliegen, die aber für die Anal ... read more

Perspective:

Tags:

Als Projektverantwortliche im Bereich Dateninfrastruktur und Digital Humanities ist es Teil meiner Aufgabe, aber auch mein Wunsch, meine Kolleginnen und Kollegen beim Erstellen und Veröffentlichen von Datenpublikationen zu ermutigen. Momentan gestaltet sich das vor allem deswegen schwier ... read more

Perspective: datapublication

Tags: Publikationsformate; Anreizstrukturen

Ich leite eine historische Beratung für Autorinnen und Autoren. Daher arbeite ich viel mit Online-Bilddatenbanken aus der ganzen Welt. Gerade bei den deutschen Datenbanken fällt mir auf: Es wird zwar fleißig digitalisiert und ins Netz gestellt. Ob man diese Bilder aber nutzen kann, z.B. in einem Rom ... read more

Perspective: datareuse; datapublication

Tags: Fehlende Creative Commons-Angaben - Publikation möglich oder nicht?

Vor dem Hintergrund meiner Erfahrungen als Hochschullehrerin scheint es mir so zu sein, dass die Geschichtswissenschaften digitale Ressourcen noch kaum als neuen und auch relevanten Lehrinhalt etabliert haben. Das bringt auch mit sich, dass die Quellenkritik bspw. zu digitalisierten und born d ... read more

Perspective: datareuse

Tags: Digitale Publikationen; Lehre; Verwendung von digitalen Ressourcen für Forschung und Lehre

Ich verwalte als Privatperson einen großen Bestand von einigen Millionen Familienanzeigen (vor allem Todesanzeigen) aus Tageszeitungen des 20., z.T. auch 19. Jahrhunderts. Die Daten liegen einerseits als Digitalisate, andererseits als partielle Texterfassungen (Name des Verstorbenen, Ort, Datum) vor ... read more

Perspective: datapublication

Tags: Datenschutz

Eine mögliche Strategie der Datensicherung und verbreitung besteht darin, sie auf einer Website selbst zu veröffentlichen und auf dauerhafte Zugänglichkeit z.B. über das Internet Archive zu hoffen. Eine Website scheint die beste Form zu sein, um die Auffindbarkeit zu garantieren - aber wie steht es ... read more

Perspective: datapublication

Tags: Websitearchivierung

Aus der Praxis meiner Arbeit mit in verschiedenen Ländern verstreuten und in unterschiedlichen Sprachen verfassten historischen Quellen zu einem geschichtspolitisch kontroversen Thema gibt es v.a. drei Problemfelder: Rechte, Erfassung/Auswertung, Nutzung. Auch wenn mir Daten zur wissenschaftlichen A ... read more

Perspective: datapublication; dataprocessing

Tags: Rechte; incentives; Grundlagenforschung

Ein Nachwuchswissenschaftler möchte die gesammelten Beiträge einer von ihm organisierten internationalen Konferenz publizieren. Er hat leider keine finanziellen Mittel zur Verfügung, sodass er eine kostenfreie Lösung benötigt. Da die Beiträge von Forschenden aus vielen verschiedenen Ländern mit jewe ... read more

Task Area: Task Area 1; Task Area 3; Task Area 4; Task Area 5

Perspective: dataprocessing; datacollection; datareuse; datapublication

Tags: Publikationsinfrastruktur; Open Access; Dissemination

Eine Wissenschaftlerin möchte ihre Forschungsergebnisse publizieren. Da Quellen aus unterschiedlichen Ländern in Europa und darüber hinaus Gegenstand ihrer Forschung sind, möchte die Forschende eine internationale Zielgruppe ansprechen. Zudem bietet ihre Forschung Anknüpfungspunkte für nicht histori ... read more

Task Area: Task Area 1; Task Area 3; Task Area 4; Task Area 5

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Publikationsinfrastruktur; Internationale Vernetzung; Open Access

Mehrere Forschende arbeiten über verschiedene Standorte international verteilt an ihren Projekten, die einem gemeinsamen Metathema verpflichtet sind. Der Austausch mit den Projektbeteiligten an den anderen Standorten ist von zentraler Bedeutung. Ungeachtet der räumlichen, sprachlichen und fachdiszip ... read more

Perspective: datapublication; datareuse; datacollection; dataprocessing

Tags: Transregionale Forschung; Nicht lateinische Schriften; Internationalität/Mehrsprachigkeit

Ein Forschender möchte die Rolle des kommerziellen Städtetourismus für die historische Sinnbildung untersuchen. Zu diesem Zweck sollen einerseits städtetouristische Angebote erfasst sowie typologisiert und andererseits Interviews mit StadtführerInnen und ReiseveranstalterInnen in verschiedenen Sprac ... read more

Perspective: datacollection; datapublication; dataprocessing; datareuse

Tags: Städtetourismus; Datenschutz; nicht lateinischschriftliche Quellen

Ein Forschender möchte in einem Projekt einen Korpus von Texten aus dem 18. Jahrhundert inklusive der dazugehörigen nicht lateinischschriftlichen Übersetzungen erstellen und im Internet verfügbar machen, um Wissens- und Sprachtransfer aus ideen- und begriffsgeschichtlicher Perspektive zu erforschen. ... read more

Perspective: datacollection; datapublication; dataprocessing; datareuse

Tags: Textkorpus; nicht lateinsiche Schrift

Als Redakteur einer geschichtswissenschaftlichen Zeitschrift will ich die Publikation von Forschungsdaten organisieren, um die in Aufsätzen publizierten Forschungsergebnisse anhand der verwendeten Daten (Quellen) nachvollziehbar bzw. reproduzierbar zu machen. Das Problem ist, dass aktuell noch Empfe ... read more

Perspective: datapublication

Tags: Publikation; Zeitschrift; Forschungsdaten-Policy

Eine Gruppe von Forschenden der Geschichtswissenschaft möchte ihre Forschungsergebnisse sowie einige Quellen (Texte, Bildmaterial) veröffentlichen. Da für die Publikation keine Finanzmittel zur Verfügung stehen, suchen sie ein Publikationsmedium im Internet, das keine Kosten verursacht, aber dennoch ... read more

Perspective: datacollection; datapublication; dataprocessing; datareuse

Tags: Blog; Online-Publikation; Open Acces

Ich möchte einen großen Datensatz von digitalisierten Zeitungen analysieren. Mein Forschungsvorhaben soll die Volltexte im Hinblick auf Veränderungen thematischer Schwerpunkte in der Berichterstattung untersuchen und darüber hinaus auch eine Analyse des verwendeten Bildmaterials beinhalten. Die Date ... read more

Perspective: dataprocessing

Tags: digitale Text- und Bildanalyse; Maschinelles Lernen; Hardware/Rechenleistung

Ich bin Wissenschaftler*in und möchte einen aus unterschiedlichen Quellen aggregierten Datenbestand für Fragestellungen nutzen, die ich z.B. mit Hilfe von Methoden aus dem Bereich des Textmining oder der Netzwerkanalyse beantworten könnte. Anschließend möchte ich die Ergebnisse so publizieren, dass ... read more

Perspective: datapublication; datacollection; dataprocessing; datareuse

Tags: Aggregierter Datenbestand; Textmining; Netzwerkanalyse

Im Rahmen eines geförderten Projekts beteiligt sich das DHI London daran, Richtlinien für eine von zeithistorischen ForscherInnen dringend benötigte Infrastruktur zur Erfassung, Langzeitarchivierung, Zugänglichkeit und Auswertung neuartiger Datenbestände (sogenannter „Sozialdaten“) aufzubauen. Bei S ... read more

Perspective: dataprocessing; datapublication; datareuse; datacollection

Tags: Sozialdaten; Virtuelle Forschungsinfrastruktur; Interdisziplinarität

Story In einem gemeinsamen Projekt wollen Kunsthistoriker*innen, Historiker*innen und Musikwissenschaftler*innen die Geschichte, Rezeption und Präsentation eines epochalen Ereignisses erforschen. Sie suchen nun für die Entwicklung des Antrags und die Planung der Aufgaben Ansprechpartner*innen und In ... read more

Perspective: datareuse; datapublication; dataprocessing

Tags: Rezeption; Interdisziplinarität; Digital Humanities

Ich soll zukünftig meine Forschungsdaten unter einer offenen Lizenz publizieren und zur Nachnutzung zur Verfügung stellen. Prinzipiell habe ich da nichts dagegen, aber ich habe diese Daten schon seit zehn Jahren gesammelt, sehr viel Arbeit investiert und auch die Aufbereitung für die Publikation ist ... read more

Perspective:

Tags:

Unsere Einrichtung verfügt über eine große und thematisch breit gefächerte Sammlung historischer Objekte, die zugleich Grundlage der Forschungsarbeit unserer Wissenschaftler*innen ist. Die (z.T. dreidimensionale) Digitalisierung von Objekten zu Zwecken der Dokumentation, wissenschaftlichen Verfügbar ... read more

Perspective: datapublication; datareuse

Tags: Sammlungen; Digitalisate

Zu einem zeitgeschichtlichen Thema wurden in den letzten Jahrzehnten viele Interviews im Rahmen von wissenschaftlichen Arbeiten zum Thema geführt. Ich würde gerne diese Interviews mit dem heutigen zeitlichen Abstand darauf untersuchen, welchen Einfluss sie auf die allgemeine Wahrnehmung des Gegensta ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: oral history; Interviews; Zeitgeschichte

Als verantwortlicher Datenkurator bin ich in einem zeithistorischen Forschungsprojekts dafür verantwortlich die im Rahmen der Einzelstudien entstehenden Interviews zu archivieren und nach Möglichkeit digital für die Nachnutzung bereitzustellen. Im Bereich der Geschichtswissenschaft ist die Nachnutzu ... read more

Perspective: datareuse

Tags: Forschungsdatenarchivierung; Nachnutzung

Als IT-Verantwortlicher an einer außeruniversitären Forschungseinrichtung möchte ich ein Forschungsdaten-Management-Verfahren einrichten. Ich erhalte Informationen über beginnende und laufende Projekte bzw. Ansprechpartner*innen aus der Verwaltung und führe Gespräche mit einzelnen Wissenschaftler*in ... read more

Perspective: datacollection

Tags: Metadaten; Data-Services

Als Leiter des Programmbereichs Forschungsinfrastrukturen an einem zeithistorischen Forschungsinstitut bin ich auf verschiedenen Ebenen mit den Bedürfnissen der Forschenden hinsichtlich Archivierung, Erschließung und Bereitstellung, der von ihnen produzierten Forschungsdaten, aber auch gleichzeitig ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Vertrauen; Forschungsnähe; Kulturwandel

Ich koordiniere ein anderthalbjähriges audiovisuelles Zeitzeugenprojekt, angesiedelt an der Sächsischen Akademie der Wissenschaften, in Kooperation mit der Humboldt Universität zu Berlin. Das Projekt wird durch Bund und Länder gefördert: Thüringen, Sachsen und die Wismut GmbH, die ihre Gelder durch ... read more

Perspective: datacollection; datapublication

Tags: DMP; Zeitzeugeninterview

WissenschaftlerInnen kennen das Problem, nicht aufhören zu können, aus vielen Bereichen: Wann ist ein Buch abgeschlossen? Wann ist genügend Literatur recherchiert? Wann ist der letzte Wörterbuchbeleg gefunden? Beim Aufbau digitaler Ressourcen stellt sich dieses Problem nicht anders, aber besonders. ... read more

Perspective: datacollection

Tags: Datentiefe; Prokrastination; Ziel

Als An-Institut einer Universität sind wir Akteur in einem langhin etablierten Verbund unabhängiger Projekte der Grundlagenforschung, die zum Nutzen der interdisziplinären Städteforschung historisches Kartenmaterial edieren. Nach wie vor sind Printprodukte der traditionelle Output. Inzwischen aber h ... read more

Perspective: datareuse

Tags: Geodaten; Repositorium; Digitaledition

Auch im Bereich der philosophiehistorischen Grundlagenforschung wird zunehmend die Digitalisierung von Daten (Editionen, Zeitschriften, Kompendien, Archive) vorangetrieben. Dabei stellt sich die Frage, wie die entstehenden Datenmengen auszuwerten sind. Neben der Überlegung zu den technischen Möglich ... read more

Perspective: dataprocessing; datacollection

Tags: Metadaten; Standardisierung; Methodenreflexion

Task Area Coordination Team

Prof. Dr. Eva Schlotheuber (Düsseldorf, VHD): eva.schlotheuber@uni-duesseldorf.de

Prof. Dr. Torsten Hiltmann (Humboldt Universität zu Berlin): torsten.hiltmann@hu-berlin.de

Prof. Dr. Rüdiger Hohls (Humboldt Universität zu Berlin): hohlsr@geschichte.hu-berlin.de

Claudia Prinz (Humboldt Universität zu Berlin): prinzc@geschichte.hu-berlin.de