Task area

47 Kyrillisches Wiki mit historischen Informationen, Wörterbuch und Quellen zu Leben und Kultur des Adels

< Back to problem stories

Ein Forschender möchte Informationen, ein einschlägiges Wörterbuch und historische Quellen (Bilder und Text) zu Leben und Kultur des Adels im Internet zugänglich zu machen. Sowohl die Quellen als auch die Präsentationsansicht sollen in kyrillischer Sprache sein. Der Forschende entscheidet sich für die technische Lösung des Wikis.Zur Umsetzung seines Forschungsvorhabens muss der Forschende einige problematische Aspekte klären: • Er muss zunächst einmal eine geeignete technische Plattform für das Wiki finden, die sowohl die kyrillische Schrift als auch die Bereitstellung eines Wörterbuchs unterstützt. • Zudem ist zu klären, was er für die Erstellung des Wikis tun muss und welche Kosten damit verbunden sind. • Schließlich möchte der Forschende dafür sorgen, dass das Wiki langfristig verfügbar ist. Hier stellt sich für ihn die Frage, wie dies sichergestellt werden kann.

Posted on

46 Adlige Identitäten und Repräsentationskulturen im Königlichen Preußen des 17. und 18. Jahrhunderts

< Back to problem stories

Eine Forschende untersucht Regionalität und Regionsbildung aus interdisziplinärer (genauer gesagt historischer und kunsthistorischer) Perspektive mit Blick auf die Identitäten und Repräsentationskultur des Adels im 17. und 18. Jahrhundert. Zu diesem Zweck sind Werke der bildenden und angewandten Künste sowie der Architektur zu untersuchen. Hierzu zählen unter anderem Adelssitze mit ihrer künstlerischen Ausstattung, Kirchen, Grabmäler, Stiftungen, Sammlungen usw. Untersucht werden entweder die Objekte selbst oder – im Falle ihres Verlustes – die Spuren, die sie in Inventaren, Briefen, Beschreibungen etc. hinterlassen haben. Es sollen sowohl Digitalisate der untersuchten Quellen als auch die Ergebnisse der Forschung virtuell präsentiert und gesichert werden. Die Forschende stößt bei ihrem Forschungsvorhaben auf folgende Probleme: • Die für die Forschung relevanten Quellen sind örtlich stark verteilt und umfassen unterschiedliche Objekttypen, unter anderem Texte, Bildmaterial, Architektur, Objekte des Kunsthandwerks, etc. Dies erschwert die Schaffung eines einheitlichen Quellenkorpus. • Die Objekttypen weisen jeweils verschiedene mediale Charakteristika auf, die für ihre Erfassung und Beschreibung wichtig sind. Dies macht die Gestaltung einheitlicher Metadaten schwierig, auch weil die Forschende mit den unterschiedlichen Daten- und Metadatenstandards nicht vertraut ist. • Die Website soll eine virtuelle Ansicht der Digitalisate der Quellen erlauben. Dafür müssen die Quellen digitalisiert werden. Doch mit dem Prozess der digitalen Erfassung, insbesondere von Objekten, ist die Forschende nur rudimentär vertraut. • Dies alles führt zu Problemen bei der Auswahl eines geeigneten technischen Systems für die Internetpräsenz. • Auch die Frage, wie die langfristige Verfügbarkeit der Internetpräsenz und der darauf befindlichen Digitalisate gewährleistet werden kann, bereit der Forschenden Schwierigkeiten.

Posted on

45 Städtetourismus aus historischer Perspektive

< Back to problem stories

Ein Forschender möchte die Rolle des kommerziellen Städtetourismus für die historische Sinnbildung untersuchen. Zu diesem Zweck sollen einerseits städtetouristische Angebote erfasst sowie typologisiert und andererseits Interviews mit StadtführerInnen und ReiseveranstalterInnen in verschiedenen Sprachen durchgeführt werden. Das Material umfasst sowohl lateinischschriftliche als auch nicht lateinischschriftliche Quellen. Der Forschende ist dabei mit verschiedenen Problemen konfrontiert: • Er muss digitale und analog vorliegende Reiseangebote sammeln, zusammenführen und kategorisieren. Der Forschende weiß jedoch nicht, welche technischen Hilfsmittel sich dafür eignen und welche Standards und Richtlinien dafür notwendig und sinnvoll sind. • Weiterhin muss der Forschende eine technische Lösung finden, um die unterschiedlichen Arten der von ihm untersuchten Quellen (Texte und Bilder in gedruckter und digitaler Form, audiovisuelle Interviews und die dazugehörigen Transkriptionen) zu verwalten, zu publizieren und langfristig zu sichern. • Unklarheit besteht auch bezüglich datenschutzrechtlicher sowie persönlichkeitsrechtlicher Aspekte vor allem bei der Behandlung von Daten aus aktuellen kommerziellen Dienstleistungen (Städtereisen). Erschwerend kommt hinzu, dass einige der Quellen und Angebote aus dem Ausland stammen und somit möglicherweise nicht nach deutschem Recht lizenziert werden können.

Posted on

44 Netzwerkforschung aus prosopographischer Perspektive

< Back to problem stories

Eine Forschende möchte prosopographische Netzwerke in Europa ermitteln und veranschaulichen. Zu diesem Zweck muss sie Quellen in unterschiedlichen lateinischen und nicht lateinischen Schriften sammeln, erfassen und analysieren. Anschließend sollen die Daten interaktiv visualisiert werden. Die Forschende muss unter anderem die nachfolgenden Probleme bewältigen: • Die zu untersuchenden Quellen müssen gesammelt, zusammengeführt und in normierter Form erfasst werden. Dafür mangelt es an einer geeigneten technischen Lösung. Zudem ist unklar, welche Anforderungen notwendig sind, um ein solches System auszuwählen; ebenso, welche Arbeitsaufwände und Kosten es erzeugt. • Zudem herrscht Unklarheit hinsichtlich der Frage, wie man die in unterschiedlichen Sprachen und Schriften vorliegenden Quellen so erfassen und auswerten kann, dass man möglichst ohne großen Aufwand die gesuchten Netzwerke herausarbeiten und visualisieren kann. • Des Weiteren ist nicht klar, ob bzw. wie man digitale Methoden und Werkzeuge zur Netzwerkanalyse einsetzen kann bzw. wobei diese helfen können. Daher sind auch die mit derartigen Methoden verbundenen Standards nicht bewusst. • Schließlich ist unklar, wie Netzwerkanalysen angemessen präsentiert und publiziert werden können. Hierfür fehlt eine passende Publikationsumgebung. Außerdem ist nicht klar, wie die Netzwerkanalysen und Quellen langfristig gesichert werden können und was dafür erforderlich ist.

Posted on

43 Retrodigitalisierung und Volltexterkennung von Handschriften in nicht lateinischer Schrift

< Back to problem stories

Ein Forschender möchte einige historische Handschriften in nicht lateinischer Schrift retrodigitalisieren und eine Volltexterkennung durchführen. Dabei steht er vor dem Problem, dass die ihm bekannten Tools zur Retrodigitalisierung auf lateinischschriftliche Druckschriften ausgelegt sind und deshalb entweder nicht funktionieren oder schlechte Ergebnisse liefern. Zudem sind die Handschriften an unterschiedlichen Orten zu finden, sodass eine zentral zu verwaltende, aber ortsverteilt durchführbare Lösung wünschenswert ist. Sowohl retrodigitalisierte Bilder als auch Texte sollen nachhaltig gesichert werden. Dem Forschenden stellen sich daher einige Fragen: • Welche Hard- und Software sind für die Retrodigitalisierung und Volltexterkennung von Handschriften in nicht lateinischer Schrift notwendig? • Welche Richtlinien und Standards sind bei der Digitalisierung und Volltexterkennung von handschriftlichen Dokumenten in nicht lateinischer Schrift zu beachten? • Wie lässt sich ein solcher Digitalisierungsprozess als Workflow ortsverteilt gestalten und koordinieren? • Was für Daten entstehen bei einem solchen Digitalisierungsprozess und wie können diese nachhaltig gesichert werden?

Posted on

42 Normdaten

< Back to problem stories

Ich bin SozialhistorikerIn des spätosmanischen Nahen Ostens und habe in meinen Quellen eine große Anzahl Personen, Orte, und Institutionen identifiziert. Diese unter großem Zeitaufwand erstellten Rohdaten historischer Forschung möchte ich zur Nachnutzung als Linked Open Data im Semantic Web veröffentlichen. Existierende Normdatensätze und Plattformen zur deren Auffindung, wie z.B. Wikidata, VIAF, OCLC oder PeriodO decken mein Forschungsgebiet nur sehr mangelhaft ab, was auch daran liegt, dass die für mein Forschungsgebiet relevanten Sprachen (Arabisch, Persisch, Osmanisch) und Kalender (islamischer Mondkalender, julianischer Kalender, osmanischer Finanzkalender etc.) nur unzureichend oder gar nicht unterstützt werden. So lassen sich Namen z.B. nur in einer sehr spezifischen Transkription auffinden, aber nicht in der Schrift, Sprache und Form der Quellen. Gazeteers für das Georeferencing von Toponymen sind ebenso wie Shapefiles praktisch inexistent.

Posted on

41 Erfassung kultureller Artefakte des Globalen Südens

< Back to problem stories

Ich befasse mich mit der Geistesgeschichte des Nahen Ostens im langen 19. Jahrhundert. Dafür möchte ich den sprachlichen Wandel durch distant reading großer Korpora untersuchen. Weltweit ist eine große Anzahl von Bilddigitalisaten schriftlicher Quellen verfügbar. Allerdings ist die automatische Texterkennung auch bei sehr teuren kommerziellen Plattformen so schlecht, dass diese nicht für meine Zwecke benutzt werden können. Es gibt offene, auf maschinellem Lernen basierende und sprachagnostische Werkzeuge, wie z.B. Kraken und Tesseract, jedoch verfüge ich weder über den technischen Sachverstand noch die notwendige Rechenkapazität, um Modelle zu trainieren und dann auf potentiell hunderttausende Seiten Faksimiles anzuwenden.

Posted on

40 Software und Datenmodelle

< Back to problem stories

Ich befasse mich mit den kulturellen Artefakten außereuropäischer Gesellschaften und benötige dafür digitale Werkzeuge, die nicht schon bei der Erfassung der Daten erfordern, diese mit Modellen des Globalen Nordens im frühen 21. Jahrhundert zu beschreiben. Zur Beschreibung meines Forschungsgegenstands muss die Möglichkeit der Vielsprachigkeit und Vielschriftlichkeit gegeben sein, ohne dass eine der Sprachen Präzedenz über die anderen hat. Voller Unicodesupport auf allen Ebenen der digitalen Datenverarbeitung ist hierbei notwendig, aber nicht ausreichend (und leider auch momentan keinesfalls gegeben). Personennamen müssen jenseits von Vor- und Nachnamen beschrieben werden können. Ereignisse müssen sich jenseits des gregorianischen Kalenders mit 24 equinoctalen Stunden und einem Tagesbeginn um Mitternacht in der Zeit verorten lassen. Normalisierung ist wichtig, kann aber nicht schon bei der Datenerfassung geleistet werden, da damit eine epistemische Gewalt einhergeht, deren Auswirkungen aus den Forschungsdaten selbst nicht mehr rekonstruiert werden können.

Posted on

39 Wissen entgrenzen

< Back to problem stories

Mehrere Forschende arbeiten über verschiedene Standorte international verteilt an ihren Projekten, die einem gemeinsamen Metathema verpflichtet sind. Der Austausch mit den Projektbeteiligten an den anderen Standorten ist von zentraler Bedeutung. Ungeachtet der räumlichen, sprachlichen und fachdisziplinären Diversität benötigen alle eine gemeinsame Infrastruktur, mit der sie untereinander kommunizieren, Befunde teilen und gemeinsame Ergebnisse präsentieren können. Dazu soll auch eine multimediale Datenbank in verschiedenen Sprachen (Arabisch, Persisch und Russisch) gehören. Die Forschenden stehen vor folgenden Problemen: • Die Beteiligten der Projektgruppen sind sich unsicher, welche Kommunikationskanäle ihnen stabile Nutzungsbedingungen bieten können, zumal sie in Regionen mit unterschiedlichen, vor allem aber schwachen technischen Standards arbeiten. • Unklar ist für sie ebenso, wie sie bei der Nutzung dieser Services vor dem Verlust von Forschungsdaten gefeit sind. • Erst recht gilt dies für den Datenschutz, auf den einige von ihnen aufgrund ihrer Forschungsarbeit in politisch brisanten Regionen besonders angewiesen sind. Die Gruppe wünscht sich daher eine Forschungsumgebung, die ausfallsichere Kommunikationswege aufweist. Wichtig ist für sie die Möglichkeit, erhobene Forschungsdaten und Forschungsergebnisse ausfallsicher hinterlegen und auch untereinander austauschen zu können. Zu den Anforderungen an das Speichersystem gehört auch, dass multilinguale Texte und verschiedene Dateiformate sicher hinterlegt werden können, von Textdateien über Bildformate bis hin zu Audio- und Videomaterial. Die Gewährleistung der Datenschutzanforderungen verschiedener Jurisdiktionen ist eine besondere Anforderung.

Posted on

38 Integration von verschiedenen Datensets mit externen Werkzeugen

< Back to problem stories

Forscher_innen aus den Bereichen Geowissenschaften, Biodiversität, Archäologie, Soziologie und Geschichte befassen sich mit der Landschaftsgeschichte des Libanon über einen langen Zeitraum hinweg. Dafür möchten diese Forscher_innen ein gemeinsames Geografisches Informationssystem (GIS) aufbauen und sowohl mit Geodaten, Shapefiles als auch anderen Datenbanken als Forschungstool nutzen. Da es die für GIS notwendigen geographische Lexika (Gazetteer), die Orte mit Namen, Verwaltungseinheiten und, im besten Fall, Geodaten, für den Nahen Osten nur sehr eingeschränkt gibt, funktioniert automatisches geo-referencing häufig nicht, und Toponyme werden nur unzureichend gefunden. Die Forscher_innen aus verschiedenen Disziplinen können die überwiegende Mehrheit aller Entities von internationalen Normdatensätzen nicht gebrauchen und müssen diese erst als Grundlage definieren. Notwendig wäre daher, dass • Server-basierte Plattformen zur allgemeinen Nutzung durch Forschende zur Verfügung gestellt werden; • die erlaubten Standards nicht vordefinieren, sondern volle Anpassung an die Bedürfnisse der Nutzer_innen bei gleichzeitiger Validierung der Daten erlauben; • bei der Entwicklung und Aushandlung von Standards (in der Form von z.B. Community Standards oder Best Practices) Hilfe geboten wird.

Posted on