Task area

10 Erstellung und Mapping von Referenzvokabularen

< Back to problem stories

Als Spezialbibliothek erzeugen wir mit OCR Volltexte unserer digitalisierten Quellen für die Forschung. Mit digitalisierten und auf Lemma-Ebene erschlossenen Fachlexika (19. Jh) verfügen wir über zeitspezifisches Vokabular. Bislang fehlt es an Kapazitäten, dieses Vokabular als Gazetteer oder Ontologie aufzubereiten und für die automatische Analyse der Volltexte zur Verfügung zu stellen, also Vokabulare als Forschungsdateninfrastrukturleistung zu entwickeln. Weder für die Infrastrukureinrichtung (Bibliothek) noch für Wissenschaftler*innen existieren günstige Rahmenbedingungen (Finanzierung, wissenschaftliche Anerkennung) für solche fachlich spezialisierte Infrastrukturleistungen an der Schnittstelle zwischen historischer Subdisziplin, Informationswissenschaft und Data Science.

Posted on

9 Archivquellen – Zusammenarbeit mit vielen unterschiedlichen Archiven

< Back to problem stories

In einem größeren Forschungsprojekt arbeite ich mit Quellen ganz unterschiedlicher Provenienz, z.B. aus Zeitungsdatenbanken (Online-Archive von "Der Spiegel", "Die Zeit", aber auch Zeitungen aus dem Ausland; daneben Fernseh- und Rundfunk-Archive, das Bundesarchiv etc. Ich werte Zeitungsartikel, Protokolle von Bundestagsreden, Akten aus verschiedenen Ministerien, Fernsehserien u.v.m. als Quellen aus, und zwar qualitativ. Wie kann ich daraus einen Quellenkorpus machen, der so einheitlich ist, dass er sich irgendwie zur Nachnutzung aufbereiten lässt? Und wie kann ich die Archive, die ja die Rechteinhaber sind, mit ins Boot holen? Meine Idealvorstellung wäre ein E-book, in dem alle Quellenangaben in den Fußnoten "klickbar" sind, d.h. man kommt mit einem Klick zum Original.

Posted on

7 Lizenzen

< Back to problem stories

Als Lehrstuhl einer Hochschule forschen wir auch mit und an Werkzeugen aus dem Bereich der automatisierten Auswertung von Datenbeständen. Ein wesentlicher Teil der Datenbestände sind digitalisierte Textkorpora, die zumeist in einem Textformat, wie beispielsweise XML, vorliegen, die aber für die Analysen in andere Dateiformate konvertiert werden müssen. Einige der Korpora unterlagen und unterliegen einer Lizenzpflicht. Dies bedeutet, sie dürfen nur dann von einer Person benutzt werden, wenn deren Institution (zum Beispiel über die UB) oder sie selbst eine kostenpflichtige Lizenz erworben hat. Die Lizenzen sind meist zeitlich begrenzt.
Um die Analyseergebnisse der automatisierten Auswertung der Textbestände nach den FAIR-Prinzipien langfristig zur Verfügung zu stellen, ist es notwendig, die Rohdaten, also die Korpora selbst, einzubeziehen. Es ist für uns schwer nachvollziehbar, welche praktischen Konsequenzen § 60d Urheberrechtsgesetz, speziell Absatz 3, für die Ausgestaltung dieser Prinzipien bei Textkorpora hat, die einer Lizenzpflicht unterlagen oder noch unterliegen. Einerseits soll das Korpus und dessen Vervielfältigungen nach Abschluss der Forschungsarbeiten gelöscht werden, andererseits darf es von den in den §§ 60e und 60f genannten Institutionen dauerhaft aufbewahrt werden. Zu den in 60f benannten Bildungseinrichtungen gehören laut Definition in § 60a Absatz 4 beispielsweise auch Hochschulen. Nach dieser Lesart dürften die Korpora und deren Vervielfältigungen auf hochschuleigenen Servern dauerhaft gespeichert werden. Das Aufbewahren an sich ermöglicht jedoch noch nicht den Zugang, da dieser nur über eine Bezahlschranke möglich ist. Ohne eine gültige Lizenz darf der Zugang zu den Rohdaten nicht gewährt werden.
Es erscheint insgesamt fragwürdig, wie die Qualität wissenschaftlicher Forschung bei automatisierten Analyseverfahren überprüf- und nachnutzbar gehalten werden kann, wenn ein wesentlicher Bestandteil der Forschung, die Rohdaten selbst, nicht zugänglich gemacht werden darf bzw. bei Nachnutzung durch den Erwerb einer Lizenz erst „hinzugekauft“ werden muss.

 

Task Area

Perspective

Tags

Posted on

6 Archivische Forschungsdaten massenhaft mit zukunftsfähigen Normdaten anreichern

< Back to problem stories

Als Archiv stellen wir massenhaft Erschließungsinformationen zu Archivgut im Sinne von primären Forschungsdaten im Internet bereit. Diese und weitere, noch nicht online veröffentlichte digitale Erschließungsinformationen liegen in sehr großer Zahl und unterschiedlicher Datenqualität vor. Eine Herausforderung ist die nachträgliche Anreicherung mit zukunftsfähigen Normdaten im Interesse einer vernetzten Recherche. Dabei bestehen zwei weisentliche Herausforderungen:
1. Benötigt werden Tools zur nachträglichen, automatisierten Anreicherung von Erschließungsinformationen in Archivinformationssystemen und den daraus zu exportierenden Onlineressourcen.
2. Während für Personen mit der GND ein anerkanntes Normdatensystem bereits institutionenübergreifend anerkannt ist, fehlt hinsichtlich von Geografika, Regional- und Gebietseinheiten noch eine vergleichbare Verbindlichkeit (z.B. GND, Amtliche Gemeindeschlüssel, Georeferenzierung).

Posted on

5 Sicherung der Nachhaltigkeit von MyCoRe-Daten

< Back to problem stories

An meiner Institution baue ich seit 2012 ein umfangreiches Informationssystem im MyCoRe System auf. Um das System dauerhaft nutzbar zu halten, ist in den nächsten Monaten dringend ein systemtechnisches Update des Informationssystems nötig, d.h. es müsste auf die nächste Version von MyCoRe übertragen werden.
Hierzu sind Mittel in Höhe einer halben Informatikerstelle für ein halbes Jahr nötig, Kapazitäten, die weder bei mir am Lehrstuhl noch im Rechenzentrum unserer Universität vorgehalten werden. Nun ist MyCoRe in Deutschland recht gebräuchlich, es kommt in rund 70 Anwendungen zum Einsatz, wo wahrscheinlich ähnliche Bedarfe anfallen. Meine Frage ist, ob hier nicht in punkto Finanzierung, Aufbau einer Koordinationsstelle und technische Umsetzung eine anwendungsübergreifende Lösung bereitgestellt werden könnte, die es den individuellen Projektleitern auf einfachere Weise ermöglichen würde, diese Updates durchzuführen.

Posted on

4 Wie kann unser Portal mit wertvollen Forschungsdaten in zehn Jahren noch benutzt werden?

< Back to problem stories

Als Verantwortlicher für die digitale Bereitstellung der Forschungsergebnisse in einer außeruniversitären Forschungseinrichtung bin ich für das langfristige Angebot, die Bereitstellung und Verfügbarkeit der Daten verantwortlich. Wir bieten online Themenportale mit Forschungsdaten an, die in der Regel über eine Suchmaske und einen Index erschlossen sind und z.B. auch im Kontext einer Karte angezeigt werden können. Wir möchten sicherstellen, dass die Daten auch noch in zehn oder 20 Jahren verwendet werden können, und zwar mit den Verknüpfungen und Querverweisen, die wir über die bei der Bereitstellung verwendeten Software erzeugen. Zwar nutzen viele Projekte inzwischen XML kodierte Daten nach dem TEI Standard, aber die Software zu Bereitstellung der Daten und einer benutzerfreundlichen Umgebung muss permanent gepflegt und angepasst werden, um z.B. Sicherheitsupdates in der verwendeten Software oder den Programmiersprachen zu gewährleisten. Zudem bestehen vielfältige Abhängigkeiten zwischen den verwendeten Programmpaketen. Teilweise werden die Daten auch unter Verwendung von Content Management Systemen angeboten oder sind darin eingebettet. Wie können wir sicherstellen, dass unsere Themenportale, die teilweise Ergebnisse jahrzehntelanger Forschungsarbeit präsentieren und bereitstellen, auch in Zukunft für Forscherinnen und Forscher mit einem individuell zum Thema passenden und die spezifische Datenstruktur abbildenden Interface nutzbar sind?

Posted on

3 Archiv-Metadaten in XML-Format verfügbar machen

< Back to problem stories

Metadaten in Archivportalen bzw. in den Online-Findmitteln der Archive liegen als strukturierte Daten in den dahinter liegenden Datenbanken. Die Struktur der Metadaten folgt meistens dem internationalen Erschließungsstandard ISAD(G) mit dem dazu korrespondierenden Metadatenschema EAD. Dennoch lassen sich Archiv-Metadaten meistens nicht in strukturierter Form als XML-Datei, bspw. im EAD-Format, herunterladen und weiter verwerten, z.B. in ein Literaturverwaltungsprogramm einfügen: 1. weil die erforderliche Funktion von den Archivportalen/Online-Findmitteln nicht bereit gestellt wird, 2. weil die Literaturprogramme das EAD-Format nicht unterstützen. Auch die denkbare datenbankgestützte Auswertung dieser Metadaten hat entsprechend ihre Grenzen. Derzeit lassen sich in manchen Archivportalen/ Online-Findmitteln die Archiv-Metadaten als PDF-Dokument ausdrucken.
Zielstellung: strukturierte Archiv-Metadaten lassen sich in Literaturverwaltungsprogramme importieren, am besten zusammen mit einem verfügbaren Digitalisat. Erforderlich sind dazu aber nicht nur Metadaten zu dem Objekt selbst, sondern auch die Kontextinformationen sowie die Metadaten zu dem Digitalisat selbst.

Posted on

2 Linked Data ja, aber wie?

< Back to problem stories

Als Forscher an einer fachwissenschaftlichen Einrichtung bin ich an einem kunsthistorischen Projekt beteiligt, das sich mit außereuropäischem Material beschäftigt. Wir möchten gerne Kunstwerke inhaltlich klassifizieren, aber die bestehenden (oft eurozentrischen) Vokabulare (IconClass, Getty) decken unser Material nicht ab. Wir brauchen also ein eigenes Vokabular, das aber möglichst (da, wo es Überschneidungen gibt) Cross-Links zu bestehenden Vokabularen bietet. Dafür steht an unserer Einrichtung keine Software bereit, und die typischen Lösungen (wie z.B. VocBench) sind kompliziert aufzusetzen.
Noch schwieriger wird es bei komplexeren Datenstrukturen, wie z.B. historischen Gazetteers, deren Modell noch etwas komplizierter ist als das eine Thesaurus. Hier bestehen z.B. mit LinkedPlaces gute Referenzformate, aber keine Tools, um komplatible Daten nutzerfreundlich zu erstellen.
Neben dem Editor für die Vokabulare selbst ist es für LinkedData natürlich auch notwendig, stabile URIs zu verwenden. Und auch wenn diese als Identifier nicht unbedingt auf eine tatsächliche Ressource verweisen müssen, ist es doch gute Praxis, dass die URIs auflösen und auf menschen- sowie maschinenlesbare Dokumentation verweisen. Unsere Einrichtung selbst kann dafür nicht die Gewähr der Dauer bieten. Also wäre ein Handle-System sowie ein System zur Generierung von Dokumentation für Vokabularen zusätzlich nützlich.

Posted on

1 Transformation wild gewachsener Datenbestände, nichts ist FAIR

< Back to problem stories

Mein Aufgabenschwerpunkt an einem Lehrstuhl der Geschichtswissenschaften ist die Konzeption unserer digitalen Projekte (vorrangig digitales Publizieren, digitale Wissensvermittlung) sowie die Koordination von deren Umsetzung durch unterschiedliche Teams. Seit Ende 2019 befassen mich die Daten einer vor einigen Jahren begonnenen Erschließung eines umfangreichen und sehr heterogenen Korrespondenzbestandes von Ende des 18. Jh./Anfang des 19. Jh. Ursprüngliches Ziel war, den Materialbestand mit einer ersten Roherschließung der Metadaten zu dokumentieren als Grundlage für eine Antragstellung auf Förderung einer digitalen Edition der Korrespondenzen. Das zu Beginn der Arbeiten vorrangig inhaltliche Interesse und eine stark editorische Sichtweise auf die Korrespondenzen haben Fragen des Forschungsdatenmanagements nicht weitreichend genug berücksichtigt. In der Folge wurden Rohdaten erhoben und in einer für die weitere Datenbe- und -verarbeitung nicht geeigneten Form dokumentiert. Das Ende des Dienstverhältnisses des Hauptbearbeiters führte dazu, dass das ursprüngliche Projektziel des Antrags auf Förderung einer digitalen Edition nur noch mit geringen Bordmitteln von verschiedenen BearbeiterInnen, die etwas Zeit erübrigen konnten, betrieben wurde. Formale Erfassungsstandards wurden nicht mehr konsequent angewendet bzw. nachgehalten und haben am Ende zu einer umfangreichen, aber qualitativ äußerst heterogenen Datenlage geführt. 2019 wurde meinem Vorschlag zugestimmt, das ursprüngliche Projektziel umzudefinieren und anstelle einer digitalen Edition die erhobenen Daten aufgrund ihres Umfangs und Potenzials in Form eines Metadatenkatalogs recherchierbar und nachnutzbar zu machen. Ich habe die Rolle der Datenkuratorin übernommen und in Zusammenarbeit mit der ansässigen Bibliothek, einer digitalen Expertin und wiss. MitarbeiterInnen ein erweitertes Datenmodell entwickelt, habe den ersten Teil der Rohdaten in Excel standardisiert und transformiert für die Übernahme in ein neues Datenbanksystem und koordiniere das Team, das den weiteren wiss. Abgleich der Datensätze bzw. Metadaten am Material vornimmt.

Das alles wäre im Nachhinein deutlich weniger mühsam und ressourcenaufwändig, wären die Rohdaten zumindest in einer nachnutzbaren Struktur dokumentiert gewesen. Aus meiner Sicht sind zwei Dinge unbedingt erforderlich: Projekte, in denen Daten generiert werden, brauchen von Anfang an professionelle Begleitung durch Infrastrukturpartner, die sich auch als Dienstleister der WissenschaftlerInnen verstehen wollen. Wir brauchen AnsprechpartnerInnen im IT-Bereich. Parallel dazu müssen die historisch arbeitenden GeisteswissenschaftlerInnen selbst ausreichende Kompetenzen im Umgang mit Forschungsdaten entwickeln, um überhaupt sprechfähig zu sein: Welche Daten erheben wir, welche Fragen haben wir am Ende an die Daten und welches Datenmodell brauchen wir dafür, welche Datenstandards müssen wir berücksichtigen, um Auswertung und Nachnutzung zu ermöglichen? In welchen zeitlichen Dimensionen bewegen wir uns? Was soll am Ende mit den Daten passieren? Das können und sollen uns InfrastrukturpartnerInnen nicht abnehmen.

Posted on

Task Area 6: Participation and Steering

TA6 not only establishes the foundation for the collaborative work in the consortium – including handling administration, building the internal consortial infrastructure and setting policies – but also provides the space and structures for an overarching layer to foster synergies and collaborative efforts, enable open knowledge exchange, encourage participatory decisionmaking, maintain relationships with our community and with other consortia and coordinate joint contributions to the NFDI and the community.


Measures

This measure formally integrates the community and ensures the consortium’s structural integrity and operational sustainability, including its RDM infrastructure and services. The community is integrated through formal procedures developed by the 4Memory Coordination Office and monitored jointly with the community, including proposals, partnerships, decision-making and collaborations to advance or complement the work programme. To enable participatory yet efficient steering, the spokespersons are continuously involved in strategy through formal, transparent processes documented and communicated within the consortium. Policy development – including compliance management – will lead to standardised workflows and fewer case-by-case analyses, ensuring greater equality and inclusion. The consortium’s sustainable operational model joins different models, reflecting various services and hosting institutions. Sustainable models for services derived from research projects, such as data collections without institutional curation, are also included (a need expressed in our problem stories.) Our community has key roles in ongoing needs assessment.
Academic coordination facilitates collaboration among the TAs and initiates interactions among the consortial members, ensuring technical, organisational and social interoperability. The scope of coordinating activities includes organising and contributing to teamwork within the consortium and the community. The technical coordination ensures the interoperability and assessment of services on the technological level. Ethical and legal issues are addressed both specifically and in general. The transfer of the consortium’s key results is subject to multiple activities and publication formats, overseen by the editorial board.
4Memory will incorporate and support cutting-edge RDM methods, products and processes in its community, which are constantly being developed; at the same time, the consortium must maintain consistent liaison with relevant national and international networks and perspectives. For innovations arising in the first project phase, parts of the budget are reserved in an incubator fund for which awarding procedures are established. Apart from the 4Memory Coordination Office, many participants will serve as community agents embedded in their respective (sub-)communities – including societies and associations; citizen-science organisations; state RDM initiatives; humanities data centres; and collaborative projects and centres (CRCs, GRKs, Merian Centres) – keeping us up to date on the latest developments in our community. The scope of coordinating activities includes cross-consortial co-operations within the NFDI and contributions to and benefits from cross-cutting topics. Networking on a global level takes place through liaisons, joint projects and knowledge exchange with international partners.
4Memory’s communication and community management activities will liaison with the community through meaningful outreach and inreach. Their guiding aims are establishing two-way communication and treating every request from the community as a chance to support and advance historical research. The establishment of an internal and external single point of contact – both technically and in the person of the MD – enables clear, consistent communication. Through organisational workflows and digital tools, the 4Memory Coordination Office’s officers ensure constant information flows, forming the core of the communication strategy. Public activities focus both on inreach and outreach, offering information to and input from the community. The 4Memory web portal will be a knowledge base and guidebook for the community.
4Memory’s administration aims for professional management and a comprehensive service portfolio to allow operational staff to efficiently implement the work programme and provide the (co-)spokespersons with effective, trustworthy and accountable workflows. The FO enables the 4Memory Coordination Office to set up reliable, responsive financial management. The 4Memory Coordination Office’s professional project and process management eases controlling and enables change management. A cloud-based project information and communication infrastructure meets the needs for digital tools in day-to-day work while enabling a secure data and information flow. 4Memory sets high standards for its own data management and documentation. Centralised monitoring of funding opportunities will initiate collaborations on joint project proposals.

Related Problem Stories

An meiner Institution baue ich seit 2012 ein umfangreiches Informationssystem im MyCoRe System auf. Um das System dauerhaft nutzbar zu halten, ist in den nächsten Monaten dringend ein systemtechnisches Update des Informationssystems nötig, d.h. es müsste auf die nächste Version von MyCoRe übertragen ... read more

Perspective: datareuse; datapublication

Tags: Nachnutzbarkeit; Systempflege; anwendungsübergreifende Lösungen

Als Lehrstuhl einer Hochschule forschen wir auch mit und an Werkzeugen aus dem Bereich der automatisierten Auswertung von Datenbeständen. Ein wesentlicher Teil der Datenbestände sind digitalisierte Textkorpora, die zumeist in einem Textformat, wie beispielsweise XML, vorliegen, die aber für die Anal ... read more

Perspective:

Tags:

Die anbieter- und systemunabhängige Nutzung digitaler/digitalisierter Quellen in der eigenen Forschungsumgebung wird durch die IIIF-Standards unterstützt. Als Bibliothek würden wir gerne auch unsere digitalisierten Audio-, Video-, und 3D-Daten ebenso wie die text-/bildbasierten Quellen über IIIF anb ... read more

Perspective: datapublication; datareuse

Tags: Software; Schnittstelle; IIIF

An der Akademie der Wissenschaften und der Literatur, Mainz bin ich tätig im Projekt Regesta Imperii und als Projektleiter von DFG-Projekten.</BR>Dabei kommen immer wieder andere DFG-Projekte mit der Bitte auf mich zu, beim digitalen Start zu helfen. Fragen drehen sich z.B. um </BR>Welch ... read more

Perspective: datacollection; dataprocessing; datapublication

Tags: Data Literacy; Finanzierung

Ich verwalte als Privatperson einen großen Bestand von einigen Millionen Familienanzeigen (vor allem Todesanzeigen) aus Tageszeitungen des 20., z.T. auch 19. Jahrhunderts. Die Daten liegen einerseits als Digitalisate, andererseits als partielle Texterfassungen (Name des Verstorbenen, Ort, Datum) vor ... read more

Perspective: datapublication

Tags: Datenschutz

Aus der Praxis meiner Arbeit mit in verschiedenen Ländern verstreuten und in unterschiedlichen Sprachen verfassten historischen Quellen zu einem geschichtspolitisch kontroversen Thema gibt es v.a. drei Problemfelder: Rechte, Erfassung/Auswertung, Nutzung. Auch wenn mir Daten zur wissenschaftlichen A ... read more

Perspective: datapublication; dataprocessing

Tags: Rechte; incentives; Grundlagenforschung

Viele ForscherInnen und Forscher betreiben Blogseiten oder thematische Portale, auf denen sie Material aus Ihrer Forschungsarbeit oder aus dem Kontext ihrer Qualifikationsarbeiten anbieten. Gerade in den Geisteswissenschaften sind häufige Standort- und Beschäftigungswechsel keine Seltenheit. Meist k ... read more

Perspective: datapublication; datareuse

Tags: Wissenschaftliche Blogs; Thematische Portale; Forschungsdaten ohne Institutionen

Mehrere Forschende arbeiten über verschiedene Standorte international verteilt an ihren Projekten, die einem gemeinsamen Metathema verpflichtet sind. Der Austausch mit den Projektbeteiligten an den anderen Standorten ist von zentraler Bedeutung. Ungeachtet der räumlichen, sprachlichen und fachdiszip ... read more

Perspective: datapublication; datareuse; datacollection; dataprocessing

Tags: Transregionale Forschung; Nicht lateinische Schriften; Internationalität/Mehrsprachigkeit

Ein Forschender möchte die Rolle des kommerziellen Städtetourismus für die historische Sinnbildung untersuchen. Zu diesem Zweck sollen einerseits städtetouristische Angebote erfasst sowie typologisiert und andererseits Interviews mit StadtführerInnen und ReiseveranstalterInnen in verschiedenen Sprac ... read more

Perspective: datacollection; datapublication; dataprocessing; datareuse

Tags: Städtetourismus; Datenschutz; nicht lateinischschriftliche Quellen

Ein Forschender möchte Informationen, ein einschlägiges Wörterbuch und historische Quellen (Bilder und Text) zu Leben und Kultur des Adels im Internet zugänglich zu machen. Sowohl die Quellen als auch die Präsentationsansicht sollen in kyrillischer Sprache sein. Der Forschende entscheidet sich für d ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Wiki; Kyrillische Schrift; Wörterbuch

Ein Forschender möchte in einem Projekt einen Korpus von Texten aus dem 18. Jahrhundert inklusive der dazugehörigen nicht lateinischschriftlichen Übersetzungen erstellen und im Internet verfügbar machen, um Wissens- und Sprachtransfer aus ideen- und begriffsgeschichtlicher Perspektive zu erforschen. ... read more

Perspective: datacollection; datapublication; dataprocessing; datareuse

Tags: Textkorpus; nicht lateinsiche Schrift

Im Zuge eines internationalen Projektes sollen mehrere hundert Interviews in nicht lateinischer Schrift digitalisiert, mit Metadaten versehen und im Internet präsentiert werden. Die Interviews wurden in der ersten Hälfte des 20. Jahrhunderts verschriftlicht und befinden sich in verschiedenen Archive ... read more

Perspective: dataprocessing; datacollection; datapublication; datareuse

Tags: Interviews; Transkription nicht lateinischer Schriften; Datenschutz

Eine Gruppe von Forschenden der Geschichtswissenschaft möchte ihre Forschungsergebnisse sowie einige Quellen (Texte, Bildmaterial) veröffentlichen. Da für die Publikation keine Finanzmittel zur Verfügung stehen, suchen sie ein Publikationsmedium im Internet, das keine Kosten verursacht, aber dennoch ... read more

Perspective: datacollection; datapublication; dataprocessing; datareuse

Tags: Blog; Online-Publikation; Open Acces

Eine Gruppe von Forschenden untersucht im Rahmen eines Drittmittelprojekts orientalische Musik des 19. Jahrhunderts. Die Musikstücke liegen in analoger Form in verschiedenen Handschriften und Drucken vor, wobei teilweise unterschiedliche Quellen für ein und dasselbe Werk existieren. Die Quellen befi ... read more

Perspective: datacollection; datareuse; datapublication; dataprocessing

Tags: nicht lateinische Schriften; digitale Musikedition; digitale Textedition

Ich möchte einen großen Datensatz von digitalisierten Zeitungen analysieren. Mein Forschungsvorhaben soll die Volltexte im Hinblick auf Veränderungen thematischer Schwerpunkte in der Berichterstattung untersuchen und darüber hinaus auch eine Analyse des verwendeten Bildmaterials beinhalten. Die Date ... read more

Perspective: dataprocessing

Tags: digitale Text- und Bildanalyse; Maschinelles Lernen; Hardware/Rechenleistung

Ich bin Mediävist*in und habe zahlreiche in meinen Quellen genannte Personen, Orte und Institutionen identifizieren können. Nun möchte ich diese Ergebnisse einem breiteren Fachpublikum zur Verfügung stellen und damit vermeiden, dass eine solche zeitintensive Forschungstätigkeit immer wieder neu betr ... read more

Perspective: dataprocessing; datapublication

Tags: Normdaten; Linked Open Data

Bei der Aufbereitung, Auswertung und Publikation von Forschungsdaten gibt es wiederkehrende Bearbeitungsschritte, die im Detail aber auch immer wieder leicht variieren können. Beispiel: Ich möchte meine Daten mit Hilfe von Named-Entity Recognition (NER)-Methoden semantisch anreichern. Das in einer O ... read more

Perspective: datapublication; datareuse; dataprocessing

Tags: Workflow; Named-entity recognition (NER); Repositorium

Unser Spezialarchiv, das Teil einer außeruniversitären Forschungseinrichtung ist, befasst sich mit der Bewahrung historischen Materials institutioneller wie privater Herkunft und muss daher frühere Konzepte der Strukturierung physisch vorhandener Bestände und von Wissen (Behördenhierarchien etc.) na ... read more

Perspective: datareuse; datacollection

Tags: Bestandsstrukturen; Erschließungsweisen

Im Rahmen eines geförderten Projekts beteiligt sich das DHI London daran, Richtlinien für eine von zeithistorischen ForscherInnen dringend benötigte Infrastruktur zur Erfassung, Langzeitarchivierung, Zugänglichkeit und Auswertung neuartiger Datenbestände (sogenannter „Sozialdaten“) aufzubauen. Bei S ... read more

Perspective: dataprocessing; datapublication; datareuse; datacollection

Tags: Sozialdaten; Virtuelle Forschungsinfrastruktur; Interdisziplinarität

Vor gut 20 Jahren wurden in einem Forschungsprojekt sämtliche Vorstände und Aufsichtsräte deutscher Unternehmen der Jahre 1906, 1927, 1932, 1933 und 1954 in einer Datenbank erfasst. Das Ziel war es, wirtschaftliche und familiäre Vernetzung zu ermitteln und die Struktur der Wirtschaftselite in den Um ... read more

Perspective: datareuse

Tags: Softwareaktualität; Datenbankkonvertierung; Datensicherung

Zu einem zeitgeschichtlichen Thema wurden in den letzten Jahrzehnten viele Interviews im Rahmen von wissenschaftlichen Arbeiten zum Thema geführt. Ich würde gerne diese Interviews mit dem heutigen zeitlichen Abstand darauf untersuchen, welchen Einfluss sie auf die allgemeine Wahrnehmung des Gegensta ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: oral history; Interviews; Zeitgeschichte

Als IT-Verantwortlicher an einer außeruniversitären Forschungseinrichtung möchte ich ein Forschungsdaten-Management-Verfahren einrichten. Ich erhalte Informationen über beginnende und laufende Projekte bzw. Ansprechpartner*innen aus der Verwaltung und führe Gespräche mit einzelnen Wissenschaftler*in ... read more

Perspective: datacollection

Tags: Metadaten; Data-Services

Als Leiter des Programmbereichs Forschungsinfrastrukturen an einem zeithistorischen Forschungsinstitut bin ich auf verschiedenen Ebenen mit den Bedürfnissen der Forschenden hinsichtlich Archivierung, Erschließung und Bereitstellung, der von ihnen produzierten Forschungsdaten, aber auch gleichzeitig ... read more

Perspective: datacollection; dataprocessing; datapublication; datareuse

Tags: Vertrauen; Forschungsnähe; Kulturwandel

Ich koordiniere ein anderthalbjähriges audiovisuelles Zeitzeugenprojekt, angesiedelt an der Sächsischen Akademie der Wissenschaften, in Kooperation mit der Humboldt Universität zu Berlin. Das Projekt wird durch Bund und Länder gefördert: Thüringen, Sachsen und die Wismut GmbH, die ihre Gelder durch ... read more

Perspective: datacollection; datapublication

Tags: DMP; Zeitzeugeninterview

In einem Regional-Portal, das von einem Institut betrieben ist, dessen historischen Bereich ich leite, ist unter anderem ein landesgeschichtliches Urkundenbuch eingestellt. Es besteht aus derzeit 27 gedruckten Bänden, deren Volltext-Urkunden in digitalisierter Form bandweise und innerhalb dessen nac ... read more

Perspective: datapublication; dataprocessing

Tags: Texterkennung; Volltextsuche; Durchsuchbarkeit nach Namen

Task Area Coordination Team

 

Spokesperson

Prof. Dr. Johannes Paulmann, Spokesperson (Leibniz-Institut für Europäische Geschichte, Mainz): 4memory@ieg-mainz.de

4Memory Coordination Office

Daniel Bachelier, Financial Officer (Leibniz-Institut für Europäische Geschichte, Mainz): 4memory-finances@ieg-mainz.de

Annika Cöster-Gilbert, Project and Process Management Officer (Leibniz-Institut für Europäische Geschichte, Mainz): 4memory@ieg-mainz.de

Theresa-Sophie Herget, Communications and Community Management Officer (Leibniz-Institut für Europäische Geschichte, Mainz): 4memory@ieg-mainz.de

Marietta Wissmann, Financial Assistent (Leibniz-Institut für Europäische Geschichte, Mainz): 4memory-finances@ieg-mainz.de

apl. Prof. Dr. John Carter Wood, Managing Director (Leibniz-Institut für Europäische Geschichte, Mainz): 4memory@ieg-mainz.de

Bereich Digitale Historische Forschung | DH Lab

Constanze Buyken (Leibniz-Institut für Europäische Geschichte, Mainz): buyken@ieg-mainz.de

Fabian Cremer (Leibniz-Institut für Europäische Geschichte, Mainz): cremer@ieg-mainz.de

Thorsten Wübbena (Leibniz-Institut für Europäische Geschichte, Mainz): wuebbena@ieg-mainz.de

Posted on