Task Area 2

46 Adlige Identitäten und Repräsentationskulturen im Königlichen Preußen des 17. und 18. Jahrhunderts

< Back to problem stories

Eine Forschende untersucht Regionalität und Regionsbildung aus interdisziplinärer (genauer gesagt historischer und kunsthistorischer) Perspektive mit Blick auf die Identitäten und Repräsentationskultur des Adels im 17. und 18. Jahrhundert. Zu diesem Zweck sind Werke der bildenden und angewandten Künste sowie der Architektur zu untersuchen. Hierzu zählen unter anderem Adelssitze mit ihrer künstlerischen Ausstattung, Kirchen, Grabmäler, Stiftungen, Sammlungen usw. Untersucht werden entweder die Objekte selbst oder – im Falle ihres Verlustes – die Spuren, die sie in Inventaren, Briefen, Beschreibungen etc. hinterlassen haben. Es sollen sowohl Digitalisate der untersuchten Quellen als auch die Ergebnisse der Forschung virtuell präsentiert und gesichert werden. Die Forschende stößt bei ihrem Forschungsvorhaben auf folgende Probleme: • Die für die Forschung relevanten Quellen sind örtlich stark verteilt und umfassen unterschiedliche Objekttypen, unter anderem Texte, Bildmaterial, Architektur, Objekte des Kunsthandwerks, etc. Dies erschwert die Schaffung eines einheitlichen Quellenkorpus. • Die Objekttypen weisen jeweils verschiedene mediale Charakteristika auf, die für ihre Erfassung und Beschreibung wichtig sind. Dies macht die Gestaltung einheitlicher Metadaten schwierig, auch weil die Forschende mit den unterschiedlichen Daten- und Metadatenstandards nicht vertraut ist. • Die Website soll eine virtuelle Ansicht der Digitalisate der Quellen erlauben. Dafür müssen die Quellen digitalisiert werden. Doch mit dem Prozess der digitalen Erfassung, insbesondere von Objekten, ist die Forschende nur rudimentär vertraut. • Dies alles führt zu Problemen bei der Auswahl eines geeigneten technischen Systems für die Internetpräsenz. • Auch die Frage, wie die langfristige Verfügbarkeit der Internetpräsenz und der darauf befindlichen Digitalisate gewährleistet werden kann, bereit der Forschenden Schwierigkeiten.

Posted on

44 Netzwerkforschung aus prosopographischer Perspektive

< Back to problem stories

Eine Forschende möchte prosopographische Netzwerke in Europa ermitteln und veranschaulichen. Zu diesem Zweck muss sie Quellen in unterschiedlichen lateinischen und nicht lateinischen Schriften sammeln, erfassen und analysieren. Anschließend sollen die Daten interaktiv visualisiert werden. Die Forschende muss unter anderem die nachfolgenden Probleme bewältigen: • Die zu untersuchenden Quellen müssen gesammelt, zusammengeführt und in normierter Form erfasst werden. Dafür mangelt es an einer geeigneten technischen Lösung. Zudem ist unklar, welche Anforderungen notwendig sind, um ein solches System auszuwählen; ebenso, welche Arbeitsaufwände und Kosten es erzeugt. • Zudem herrscht Unklarheit hinsichtlich der Frage, wie man die in unterschiedlichen Sprachen und Schriften vorliegenden Quellen so erfassen und auswerten kann, dass man möglichst ohne großen Aufwand die gesuchten Netzwerke herausarbeiten und visualisieren kann. • Des Weiteren ist nicht klar, ob bzw. wie man digitale Methoden und Werkzeuge zur Netzwerkanalyse einsetzen kann bzw. wobei diese helfen können. Daher sind auch die mit derartigen Methoden verbundenen Standards nicht bewusst. • Schließlich ist unklar, wie Netzwerkanalysen angemessen präsentiert und publiziert werden können. Hierfür fehlt eine passende Publikationsumgebung. Außerdem ist nicht klar, wie die Netzwerkanalysen und Quellen langfristig gesichert werden können und was dafür erforderlich ist.

Posted on

43 Retrodigitalisierung und Volltexterkennung von Handschriften in nicht lateinischer Schrift

< Back to problem stories

Ein Forschender möchte einige historische Handschriften in nicht lateinischer Schrift retrodigitalisieren und eine Volltexterkennung durchführen. Dabei steht er vor dem Problem, dass die ihm bekannten Tools zur Retrodigitalisierung auf lateinischschriftliche Druckschriften ausgelegt sind und deshalb entweder nicht funktionieren oder schlechte Ergebnisse liefern. Zudem sind die Handschriften an unterschiedlichen Orten zu finden, sodass eine zentral zu verwaltende, aber ortsverteilt durchführbare Lösung wünschenswert ist. Sowohl retrodigitalisierte Bilder als auch Texte sollen nachhaltig gesichert werden. Dem Forschenden stellen sich daher einige Fragen: • Welche Hard- und Software sind für die Retrodigitalisierung und Volltexterkennung von Handschriften in nicht lateinischer Schrift notwendig? • Welche Richtlinien und Standards sind bei der Digitalisierung und Volltexterkennung von handschriftlichen Dokumenten in nicht lateinischer Schrift zu beachten? • Wie lässt sich ein solcher Digitalisierungsprozess als Workflow ortsverteilt gestalten und koordinieren? • Was für Daten entstehen bei einem solchen Digitalisierungsprozess und wie können diese nachhaltig gesichert werden?

Posted on

42 Normdaten

< Back to problem stories

Ich bin SozialhistorikerIn des spätosmanischen Nahen Ostens und habe in meinen Quellen eine große Anzahl Personen, Orte, und Institutionen identifiziert. Diese unter großem Zeitaufwand erstellten Rohdaten historischer Forschung möchte ich zur Nachnutzung als Linked Open Data im Semantic Web veröffentlichen. Existierende Normdatensätze und Plattformen zur deren Auffindung, wie z.B. Wikidata, VIAF, OCLC oder PeriodO decken mein Forschungsgebiet nur sehr mangelhaft ab, was auch daran liegt, dass die für mein Forschungsgebiet relevanten Sprachen (Arabisch, Persisch, Osmanisch) und Kalender (islamischer Mondkalender, julianischer Kalender, osmanischer Finanzkalender etc.) nur unzureichend oder gar nicht unterstützt werden. So lassen sich Namen z.B. nur in einer sehr spezifischen Transkription auffinden, aber nicht in der Schrift, Sprache und Form der Quellen. Gazeteers für das Georeferencing von Toponymen sind ebenso wie Shapefiles praktisch inexistent.

Posted on

40 Software und Datenmodelle

< Back to problem stories

Ich befasse mich mit den kulturellen Artefakten außereuropäischer Gesellschaften und benötige dafür digitale Werkzeuge, die nicht schon bei der Erfassung der Daten erfordern, diese mit Modellen des Globalen Nordens im frühen 21. Jahrhundert zu beschreiben. Zur Beschreibung meines Forschungsgegenstands muss die Möglichkeit der Vielsprachigkeit und Vielschriftlichkeit gegeben sein, ohne dass eine der Sprachen Präzedenz über die anderen hat. Voller Unicodesupport auf allen Ebenen der digitalen Datenverarbeitung ist hierbei notwendig, aber nicht ausreichend (und leider auch momentan keinesfalls gegeben). Personennamen müssen jenseits von Vor- und Nachnamen beschrieben werden können. Ereignisse müssen sich jenseits des gregorianischen Kalenders mit 24 equinoctalen Stunden und einem Tagesbeginn um Mitternacht in der Zeit verorten lassen. Normalisierung ist wichtig, kann aber nicht schon bei der Datenerfassung geleistet werden, da damit eine epistemische Gewalt einhergeht, deren Auswirkungen aus den Forschungsdaten selbst nicht mehr rekonstruiert werden können.

Posted on

38 Integration von verschiedenen Datensets mit externen Werkzeugen

< Back to problem stories

Forscher_innen aus den Bereichen Geowissenschaften, Biodiversität, Archäologie, Soziologie und Geschichte befassen sich mit der Landschaftsgeschichte des Libanon über einen langen Zeitraum hinweg. Dafür möchten diese Forscher_innen ein gemeinsames Geografisches Informationssystem (GIS) aufbauen und sowohl mit Geodaten, Shapefiles als auch anderen Datenbanken als Forschungstool nutzen. Da es die für GIS notwendigen geographische Lexika (Gazetteer), die Orte mit Namen, Verwaltungseinheiten und, im besten Fall, Geodaten, für den Nahen Osten nur sehr eingeschränkt gibt, funktioniert automatisches geo-referencing häufig nicht, und Toponyme werden nur unzureichend gefunden. Die Forscher_innen aus verschiedenen Disziplinen können die überwiegende Mehrheit aller Entities von internationalen Normdatensätzen nicht gebrauchen und müssen diese erst als Grundlage definieren. Notwendig wäre daher, dass • Server-basierte Plattformen zur allgemeinen Nutzung durch Forschende zur Verfügung gestellt werden; • die erlaubten Standards nicht vordefinieren, sondern volle Anpassung an die Bedürfnisse der Nutzer_innen bei gleichzeitiger Validierung der Daten erlauben; • bei der Entwicklung und Aushandlung von Standards (in der Form von z.B. Community Standards oder Best Practices) Hilfe geboten wird.

Posted on

35 Bildungs- und Armutsgeschichte im außereuropaeischen Raum

< Back to problem stories

Die Erforschung der Geschichte des betreffenden Landes steht vor grundsätzlichen Problemen hinsichtlich der Quellenlage. Zu nennen ist hier eine langjährige Vernachlässigung der einschlägigen Archivbestände, dann eine unzureichende Finanzierunggrundlage für die Sammlung, sachgerechte Unterbringung und vor allem systematische Katalogisierung und archivarische Erschließung von Quellen. Diese Probleme haben der Geschichtsforschung zu diesem Land nicht nur in Deutschland, sondern weltweit erhebliche Schwierigkeiten bereitet. Um diesem unhaltbaren Zustand in ersten Schritten abzuhelfen, hat ein Pilotprojekt verschiedenes Material gesammelt und dabei einen thematischen Schwerpunkt auf die Bildungsgeschichte gelegt. Dieses Quellenmaterial wurde in einer Zotero basierten Datenbank erschlossen. Des Weiteren ist ein Korpus von Audiomaterial entstanden, das Oral History Interviews zusammenführt. Zu den Tonaufnahmen gibt es auch entsprechende Transkriptionen. Diese Bestände sind in einem Forschungsinstitut aufbewahrt, können dort auf Anfrage kostenlos benutzt werden, was auch regelmäßig und intensiv geschieht. Der Erfolg des Pilotprojekts, in dem wertvolle Datenbestände erschlossen wurden, zeigt sich nicht zuletzt in der intensiven Nachnutzung der erschlossenen Materialien. Daraus leiten sich allerdings weitere Fragen für die fortdauernde Verfügbarkeit der Daten für die Wissenschaft ab: • Wie können die Datenbestände angesichts der intensiven Nutzung besser aufbereitet werden? Und welche Vorkehrungen muss man treffen, um einen erweiterten Nutzerkreis sowohl in Deutschland als auch international zu erreichen? • Welche Maßnahmen sind für eine langfristige Verfügbarkeit und dauerhafte Bereitstellung der Bestände zu ergreifen? • Welche Datenformate kommen hierfür infrage? Müssen also die derzeit vorhandenen Daten nochmals bearbeitet, transformiert und migriert werden? Gibt es für ein solches Szenario musterhafte Workflows? Dies auch, da das Projekt abgeschlossen ist und keine weitere Finanzierung dafür in Aussicht steht?

Posted on

32 Übersicht über ältere Familiendatenbanken aus der akademischen Forschung

< Back to problem stories

Ich bin Vertreter eines überregionalen Arbeitskreises . Etliche unserer Mitglieder haben schon seit den 1970er Jahren mit personen-, haushalts- und familienbezogenen Mikrodaten geforscht. Die entsprechenden Daten liegen in unterschiedlichen Formaten vor, unter anderem in TUSTEP, Kleio, dBase, SPSS und Access. Der Arbeitskreis kann einerseits entsprechende Daten lokalisieren, andererseits auch Wissen darüber zusammentragen, wie die damaligen Projekte gearbeitet haben. Wer kann uns dabei helfen, diese Daten für die aktuelle Forschung nutzbar zu machen und dabei insbesondere mithilfe von Normdaten anschlussfähig für neue Datenbestände zu machen?

Posted on

31 Geo-Referenzierung von Orten und historischen Entitäten

< Back to problem stories

Unsere Arbeitsgruppe führt eine semi-automatische prosopgraphische Auswertung durch, in welcher wir spätmittelalterliche Gelehrtenkarrieren untersuchen. Geeignete Quellen hierfür liegen bereits in digitalisierter Form vor, teilweise sind sie mit TEI oder vergleichbaren Formaten ausgezeichnet. Die Daten sind entweder über eine Schnittstelle abfragbar oder als Data-Dump verfügbar. Innerhalb der entsprechenden Texte werden verschiedene Orte genannt, deren Ortsnamen durch die mittelalterlichen Schreiber der Texte in einer nicht normierten latinisierten Schreibweise aufgezeichnet wurden. Dadurch können wir die genannten Orte aktuell noch nicht automatisch referenzieren. Zur Identifikation der Orte haben wir nach einer georeferenzierte Ortsnamen-Datenbank gesucht, welche die historischen Schreibweisen eines Ortsnamen in lateinischer und deutscher Sprache enthält. Dabei stießen wir auf die Ortsnamen-Datenbank der Monumenta Germaniae Historica (http://www.mgh.de/dmgh/imgh/geo/), die für die darin enthaltenen Orte die entsprechenden Geo-Daten und deren unterschiedlichen lateinischen Schreibweisen bereit stellt. Allerdings mussten wir feststellen, dass die MGH-Datenbank nur einen Bruchteil der in unseren Texten aufgeführten Orte enthält. Zudem stellte sich bei unserer Arbeit heraus, dass die Datenbank die darin enthaltenen Namensformen für Suchanfragen nicht expandiert, d.h. die Suche erfolgt nur in den ausgeschriebenen Namensformen und nicht in Namensformen, die mit einer abweichenden Wortendung angegeben sind. In einem zweiten Schritt wollten wir dann den Teil der durch die MGH-Datenbank referenzierten Orte auf einer Karte abtragen. Dabei mussten wir feststellen, dass es hierfür kein geeignetes historisches Kartenmaterial in digitalisierter Form vorhanden ist. Soweit wir beurteilen können, gibt es keine mit Open Access verfügbaren Karten für Mitteleuropa, welche die unterschiedlichen historische Zeitstufen der Grenzen der weltlichen und kirchlichen Entitäten abbilden. Die meisten Studien nutzen entweder moderne Google Maps-Karten oder Scans von historischen Atlanten.

Posted on

29 Aufbau einer integrierten Datenbank zu familiären Beziehungen

< Back to problem stories

In unserem familienkundlichen Verein wird seit den 1990er Jahren immer wieder der Wunsch laut, dass eine gemeinsame Familiendatenbank aufgebaut wird, an der alle Mitglieder gleichzeitig mitarbeiten können. Ziel wäre es, dass eine Person jeweils nur einmal in der Datei auftaucht, und dass sowohl die Originalquellen (z.B. Kirchenbücher oder Volkszählungslisten) als auch die Kontaktdaten der Bearbeiter transparent angegeben werden. Grundlage wären nicht die laufenden, sondern die jeweils bereits abgeschlossenen Forschungen, wobei allerdings auch Datenbestände unterhalb der Ebene eines abgeschlossenen Ortsfamilienbuchs genutzt werden sollen. Gesucht werden erstens Verfahren der eindeutigen Identifikation von Personen über Normdaten, zweitens Verfahren und Standards der Datenkuratierung, drittens Techniken der Programmierung von Webinterfaces, die eine niederschwellige Pflege und Abfrage der Daten ermöglichen. Eine andere Variante dieser Problematik stellt sich dort, wo verschiedene regionale Familiendatenbanken bereits existieren und nicht von einem "Schwarm", sondern von Einzelnen verantwortet werden. Einer der beteiligten regionalen Vereine hat z.B. eine Familiendatenbank mit etwa einer halben Million Personendatensätzen erstellt, die ungefähr den Raum eines ganzen Bundeslandes für die Zeit ab ca. 1700 erfasst. Ein anderer Verein strebt an, einen an das niederländische (dort von einem Verbund von Archiven getragene) Portal https://www.wiewaswie.nl/en/ angelehnten Verbund aus bereits publizierten Ortsfamilienbüchern zu schaffen. Ein langfristiges Ziel des Vereins für Computergenealogie besteht darin, die für etwa 800 Orte separat geführten Online-Ortsfamilienbücher mit zusammen über 10 Millionen historischen Personendatensätzen untereinander zu verknüpfen. In jedem Fall stellt die Verknüpfung über Normdaten ein Problem dar, weil personenbezogene Normdaten erst über Verfahren der Record Linkage hergestellt werden müssen. Hier käme es darauf an, dass eine Best Practice zur Konstruktion personenbezogener Normdaten erarbeitet würde.

Posted on