Task Area 4

55 Digitale Textanalyse in internationalen historischen Zeitungen

< Back to problem stories

Eine Gruppe von Forschenden möchte den sprachlichen Wandel rund um das Thema “Politikverdrossenheit” in internationalen historischen Zeitungen des 19. und 20. Jahrhunderts untersuchen. Die Zeitungen liegen in Teilen digitalisiert vor, allerdings auf unterschiedlichen, internationalen Plattformen. Nicht alle sind im Volltext erfasst. In Teilen gibt es sie nur gedruckt. Die Gruppe steht vor folgenden Problemen: • Wie kann sie die großen Mengen an Zeitungsartikeln unterschiedlicher Herkunft mit wenig Aufwand und unter Einhaltung des jeweiligen Urheberrechts zu einem Corpus zusammenfügen? • Wie kann sie das Corpus für die digitale Analyse vorbereiten und mit internationalen Normdaten anreichern? • Wie kann sie eine digitale Analyse des Corpus vornehmen? • Wo und wie können die Daten anschließend gespeichert werden, so dass die erarbeiteten Forschungsergebnisse nachvollziehbar sind?

Posted on

51 Ortsverteilte Digitalisierung und virtuelle Präsentation nicht lateinschriftlicher Archivakten

< Back to problem stories

Im Zuge eines geförderten Projekts sollen mehrere Millionen Blatt Akten in lateinischer und nicht lateinischer Schrift aus der ersten Hälfte des 20. Jahrhunderts digitalisiert und im Internet mehrsprachig präsentiert werden. Die Aktenbestände befinden sich in unterschiedlichen Archiven im In- und Ausland und weisen unterschiedliche Arten sowie Grade der Erschließung auf. Die Projektmitarbeiter*innen stehen vor dem Problem, einen koordinierten, aber dezentral organisierten Workflow zur Retrodigitialisierung und Erschließung der Akten zu entwickeln. Hierbei stellt sich zunächst die organisatorische und gleichsam diplomatische Frage, wie man am besten mit den betreffenden Archiven in Kontakt treten und die Arbeiten organisieren kann. Dann bestehen urheber- und datenschutzrechtliche Zweifel, insbesondere vor dem Hintergrund, dass viele der Akten in Archiven außerhalb Europas aufbewahrt werden. Dazu zählen auch veröffentlichungsrechtliche Fragen, etwa, inwieweit und in welcher Form man digitalisiertes Schriftgut aus nicht deutschen Archiven überhaupt virtuell publizieren darf. Ferner besteht die Schwierigkeit, ein aussagekräftiges, aber nicht zu kompliziertes Metadatenschema in mehreren (auch nicht lateinischen) Schriften zu entwickeln, das sowohl historischen als auch archivwissenschaftlichen Ansprüchen genügt. Hierbei besteht zudem der Wunsch, bereits in den Archiven vorliegende Metadaten mit dem projekteigenen Metadatenset zu harmonisieren und somit für die Projektarbeit nachzunutzen. Schlussendlich stellt sich das Problem, eine passende technische Grundlage zu finden, um nicht nur den Projektworkflow zu unterstützen, sondern die digitalisierten und mit Metadaten angereicherten Akten auch in rechtlich zulässiger Form im Internet verfügbar zu machen.

Posted on

50 Dezentrale Digitalisierung und virtuelle Präsentation von historischen Interviews in nicht lateinischen Schriften

< Back to problem stories

Im Zuge eines internationalen Projektes sollen mehrere hundert Interviews in nicht lateinischer Schrift digitalisiert, mit Metadaten versehen und im Internet präsentiert werden. Die Interviews wurden in der ersten Hälfte des 20. Jahrhunderts verschriftlicht und befinden sich in verschiedenen Archiven im nicht europäischen Ausland. Einige der Materialien wurden bereits retrodigitalisiert. Die Projektmitarbeiter*innen sind mit folgenden Problemen konfrontiert: • Rechtliche Unsicherheiten: Es herrschen urheber- und datenschutzrechtliche Unklarheiten, unter anderem hinsichtlich der möglichen Verarbeitung personenbezogener Daten. Daher stellt sich die Frage, welche Maßnahmen zum Schutz dieser Daten getroffen werden müssen und wie sie umgesetzt werden können. Hierzu zählen unter anderem Anonymisierungskonzepte und -standards, aber auch die Frage, ob und in welcher Form derartige Materialien veröffentlicht werden dürfen. • Metadaten: Unklar ist, welche Metadaten für das Projekt notwendig sind und inwiefern bereits in den Archiven vorhandene Metadaten nachnutzbar sind. Des Weiteren herrscht Unklarheit darüber, wie man die Metadaten so gestaltet, dass sie die historischen, bibliothekarischen und archivwissenschaftlichen Anforderungen in mehreren Sprachen erfüllen. • Standards für Textdaten: Es besteht Unklarheit, welche Standards für die Veröffentlichung von Textdaten existieren und welche in dem vorliegenden Fall wie anzuwenden sind. • Technische Plattform: Es wird eine technische Lösung gesucht, um die Metadaten dezentral in mehreren lateinischen und nicht lateinischen Schriften erfassen und präsentieren zu können. Darüber hinaus soll eine Volltextsuche in den Interviews möglich sein. Die Visualisierung von Standorten auf interaktiven Karten soll ebenfalls unterstützt werden. Die technische Lösung soll des Weiteren anschlussfähig für Systeme zur digitalen Langzeitarchivierung für die dauerhafte Speicherung sein. • Workflow: Es besteht die Schwierigkeit, einen Arbeitsablauf zu organisieren, der die unterschiedlichen dezentral stattfindenden Arbeitsschritte koordiniert und dokumentiert.

Posted on

49 Digitale Quellenedition historischer Berichte

< Back to problem stories

Ein Forschender möchte eine digitale Edition historischer Berichte aus dem 17. und 18. Jahrhunderts im Internet veröffentlichen. Die Dokumente liegen in unterschiedlichen Sprachen in lateinischer Schrift in verschiedenen europäischen Archiven vor. Die Edition soll ein Verzeichnis der Berichte und verschiedene Register umfassen. Es soll zudem Verknüpfungen mit unterschiedlichen Arten von Normdaten (unter anderem GND, VIAF) geben. Eine erweiterte Suche soll die Recherche im Dokumentenbestand erleichtern. So soll beispielsweise nach Fundort, Titel, Absender*in, Empfänger*in, Absendeort und Empfängerdatum gesucht werden können. Der Forschende muss für sein Projekt folgende Probleme lösen: • Zunächst müssen die in verschiedenen europäischen Archiven vorhandenenhistorischen Berichten transkribiert werden. Dem Forschenden sind mit Blick auf digitale Editionen jedoch weder einschlägige Standards noch Richtlinien bekannt. • Zudem fehlt es ihm an persönlichen Kontakten in den unterschiedlichen Archiven mit ihren jeweiligen Nationalsprachen. • Der Forschende ist ferner nur rudimentär mit digitalen Editionen vertraut und kennt deren editionswissenschaftliche Gepflogenheiten und Möglichkeiten nicht. • Obwohl er eine klare Vorstellung davon hat, welche Metadaten aus Perspektive der Geschichtswissenschaft relevant sind, weiß er nicht, ob diese für digitale historische Editionen ausreichend bzw. passend sind. • Darüber hinaus ist ihm nicht bekannt, welche technische Plattform man für ein solches Vorhaben benötigt und welche Kosten damit verbunden sind. • Des Weiteren weiß der Forschende nicht, ob bzw. wie seine Edition langfristig gesichert werden kann und was dafür zu tun ist.

Posted on

46 Adlige Identitäten und Repräsentationskulturen im Königlichen Preußen des 17. und 18. Jahrhunderts

< Back to problem stories

Eine Forschende untersucht Regionalität und Regionsbildung aus interdisziplinärer (genauer gesagt historischer und kunsthistorischer) Perspektive mit Blick auf die Identitäten und Repräsentationskultur des Adels im 17. und 18. Jahrhundert. Zu diesem Zweck sind Werke der bildenden und angewandten Künste sowie der Architektur zu untersuchen. Hierzu zählen unter anderem Adelssitze mit ihrer künstlerischen Ausstattung, Kirchen, Grabmäler, Stiftungen, Sammlungen usw. Untersucht werden entweder die Objekte selbst oder – im Falle ihres Verlustes – die Spuren, die sie in Inventaren, Briefen, Beschreibungen etc. hinterlassen haben. Es sollen sowohl Digitalisate der untersuchten Quellen als auch die Ergebnisse der Forschung virtuell präsentiert und gesichert werden. Die Forschende stößt bei ihrem Forschungsvorhaben auf folgende Probleme: • Die für die Forschung relevanten Quellen sind örtlich stark verteilt und umfassen unterschiedliche Objekttypen, unter anderem Texte, Bildmaterial, Architektur, Objekte des Kunsthandwerks, etc. Dies erschwert die Schaffung eines einheitlichen Quellenkorpus. • Die Objekttypen weisen jeweils verschiedene mediale Charakteristika auf, die für ihre Erfassung und Beschreibung wichtig sind. Dies macht die Gestaltung einheitlicher Metadaten schwierig, auch weil die Forschende mit den unterschiedlichen Daten- und Metadatenstandards nicht vertraut ist. • Die Website soll eine virtuelle Ansicht der Digitalisate der Quellen erlauben. Dafür müssen die Quellen digitalisiert werden. Doch mit dem Prozess der digitalen Erfassung, insbesondere von Objekten, ist die Forschende nur rudimentär vertraut. • Dies alles führt zu Problemen bei der Auswahl eines geeigneten technischen Systems für die Internetpräsenz. • Auch die Frage, wie die langfristige Verfügbarkeit der Internetpräsenz und der darauf befindlichen Digitalisate gewährleistet werden kann, bereit der Forschenden Schwierigkeiten.

Posted on

45 Städtetourismus aus historischer Perspektive

< Back to problem stories

Ein Forschender möchte die Rolle des kommerziellen Städtetourismus für die historische Sinnbildung untersuchen. Zu diesem Zweck sollen einerseits städtetouristische Angebote erfasst sowie typologisiert und andererseits Interviews mit StadtführerInnen und ReiseveranstalterInnen in verschiedenen Sprachen durchgeführt werden. Das Material umfasst sowohl lateinischschriftliche als auch nicht lateinischschriftliche Quellen. Der Forschende ist dabei mit verschiedenen Problemen konfrontiert: • Er muss digitale und analog vorliegende Reiseangebote sammeln, zusammenführen und kategorisieren. Der Forschende weiß jedoch nicht, welche technischen Hilfsmittel sich dafür eignen und welche Standards und Richtlinien dafür notwendig und sinnvoll sind. • Weiterhin muss der Forschende eine technische Lösung finden, um die unterschiedlichen Arten der von ihm untersuchten Quellen (Texte und Bilder in gedruckter und digitaler Form, audiovisuelle Interviews und die dazugehörigen Transkriptionen) zu verwalten, zu publizieren und langfristig zu sichern. • Unklarheit besteht auch bezüglich datenschutzrechtlicher sowie persönlichkeitsrechtlicher Aspekte vor allem bei der Behandlung von Daten aus aktuellen kommerziellen Dienstleistungen (Städtereisen). Erschwerend kommt hinzu, dass einige der Quellen und Angebote aus dem Ausland stammen und somit möglicherweise nicht nach deutschem Recht lizenziert werden können.

Posted on

44 Netzwerkforschung aus prosopographischer Perspektive

< Back to problem stories

Eine Forschende möchte prosopographische Netzwerke in Europa ermitteln und veranschaulichen. Zu diesem Zweck muss sie Quellen in unterschiedlichen lateinischen und nicht lateinischen Schriften sammeln, erfassen und analysieren. Anschließend sollen die Daten interaktiv visualisiert werden. Die Forschende muss unter anderem die nachfolgenden Probleme bewältigen: • Die zu untersuchenden Quellen müssen gesammelt, zusammengeführt und in normierter Form erfasst werden. Dafür mangelt es an einer geeigneten technischen Lösung. Zudem ist unklar, welche Anforderungen notwendig sind, um ein solches System auszuwählen; ebenso, welche Arbeitsaufwände und Kosten es erzeugt. • Zudem herrscht Unklarheit hinsichtlich der Frage, wie man die in unterschiedlichen Sprachen und Schriften vorliegenden Quellen so erfassen und auswerten kann, dass man möglichst ohne großen Aufwand die gesuchten Netzwerke herausarbeiten und visualisieren kann. • Des Weiteren ist nicht klar, ob bzw. wie man digitale Methoden und Werkzeuge zur Netzwerkanalyse einsetzen kann bzw. wobei diese helfen können. Daher sind auch die mit derartigen Methoden verbundenen Standards nicht bewusst. • Schließlich ist unklar, wie Netzwerkanalysen angemessen präsentiert und publiziert werden können. Hierfür fehlt eine passende Publikationsumgebung. Außerdem ist nicht klar, wie die Netzwerkanalysen und Quellen langfristig gesichert werden können und was dafür erforderlich ist.

Posted on

41 Erfassung kultureller Artefakte des Globalen Südens

< Back to problem stories

Ich befasse mich mit der Geistesgeschichte des Nahen Ostens im langen 19. Jahrhundert. Dafür möchte ich den sprachlichen Wandel durch distant reading großer Korpora untersuchen. Weltweit ist eine große Anzahl von Bilddigitalisaten schriftlicher Quellen verfügbar. Allerdings ist die automatische Texterkennung auch bei sehr teuren kommerziellen Plattformen so schlecht, dass diese nicht für meine Zwecke benutzt werden können. Es gibt offene, auf maschinellem Lernen basierende und sprachagnostische Werkzeuge, wie z.B. Kraken und Tesseract, jedoch verfüge ich weder über den technischen Sachverstand noch die notwendige Rechenkapazität, um Modelle zu trainieren und dann auf potentiell hunderttausende Seiten Faksimiles anzuwenden.

Posted on

39 Wissen entgrenzen

< Back to problem stories

Mehrere Forschende arbeiten über verschiedene Standorte international verteilt an ihren Projekten, die einem gemeinsamen Metathema verpflichtet sind. Der Austausch mit den Projektbeteiligten an den anderen Standorten ist von zentraler Bedeutung. Ungeachtet der räumlichen, sprachlichen und fachdisziplinären Diversität benötigen alle eine gemeinsame Infrastruktur, mit der sie untereinander kommunizieren, Befunde teilen und gemeinsame Ergebnisse präsentieren können. Dazu soll auch eine multimediale Datenbank in verschiedenen Sprachen (Arabisch, Persisch und Russisch) gehören. Die Forschenden stehen vor folgenden Problemen: • Die Beteiligten der Projektgruppen sind sich unsicher, welche Kommunikationskanäle ihnen stabile Nutzungsbedingungen bieten können, zumal sie in Regionen mit unterschiedlichen, vor allem aber schwachen technischen Standards arbeiten. • Unklar ist für sie ebenso, wie sie bei der Nutzung dieser Services vor dem Verlust von Forschungsdaten gefeit sind. • Erst recht gilt dies für den Datenschutz, auf den einige von ihnen aufgrund ihrer Forschungsarbeit in politisch brisanten Regionen besonders angewiesen sind. Die Gruppe wünscht sich daher eine Forschungsumgebung, die ausfallsichere Kommunikationswege aufweist. Wichtig ist für sie die Möglichkeit, erhobene Forschungsdaten und Forschungsergebnisse ausfallsicher hinterlegen und auch untereinander austauschen zu können. Zu den Anforderungen an das Speichersystem gehört auch, dass multilinguale Texte und verschiedene Dateiformate sicher hinterlegt werden können, von Textdateien über Bildformate bis hin zu Audio- und Videomaterial. Die Gewährleistung der Datenschutzanforderungen verschiedener Jurisdiktionen ist eine besondere Anforderung.

Posted on

37 Internationale und interdisziplinäre Publikation von Forschungsdaten

< Back to problem stories

Eine Wissenschaftlerin möchte ihre Forschungsergebnisse publizieren. Da Quellen aus unterschiedlichen Ländern in Europa und darüber hinaus Gegenstand ihrer Forschung sind, möchte die Forschende eine internationale Zielgruppe ansprechen. Zudem bietet ihre Forschung Anknüpfungspunkte für nicht historische Disziplinen, sodass sie auch für nicht historisch arbeitende Wissenschaften sichtbar sein soll. Die Publikation soll frei im Internet verfügbar sein. Gemeinsam mit ihrer Veröffentlichung möchte die Forscherin zudem einige von ihr transkribierte Quellen publizieren. Allerdings steht für die Forschende nur eine kostenlose Lösung zur Debatte, da ihr keine finanziellen Mittel für eine Publikation zur Verfügung stehen. Die Forscherin ist mit folgenden Problemen konfrontiert: • Der Wissenschaftlerin ist nicht bekannt, wie sie die gewünschte internationale und interdisziplinäre Sichtbarkeit ihrer Forschung erreichen kann. • Sie kennt das internationale Publikationswesen und die damit verbundenen Stakeholder und Communities kaum. • Auch mit den organisatorischen, technischen und informationswissenschaftlichen Hintergründen des Publizierens ist sie wenig vertraut. • Daher sind der Wissenschaftlerin weder die unterschiedlichen Formate des wissenschaftlichen Publizierens noch die dazugehörigen Standards bekannt. • Sie hat auch keine Idee, wie sich eine internationale und interdisziplinäre Sichtbarkeit ihrer Forschung sowohl organisatorisch als auch technisch umsetzten lässt. • All dies macht es der Forscherin unmöglich, eine zu ihren Anforderungen passende Publikationsstrategie zu entwickeln. Die Wissenschaftlerin wünscht sich deshalb eine zentrale Plattform, die ihr dabei hilft, eine bedarfsgerechte Veröffentlichungsstrategie zu entwickeln. Von dieser Infrastruktur wünscht sich die Forscherin nicht nur Beratung zu den verschiedenen Formen und Formaten der internationalen Wissenschaftskommunikation, sondern auch zu den organisatorischen, technischen und informationswissenschaftlichen Werkzeugen, um ihre Forschung international und interdisziplinär sichtbar zu machen. Die Wissenschaftlerin wünscht sich des Weiteren, dass die Infrastruktur ihr nationale und internationale Kontakte vermittelt, die ihr beim Erreichen ihres Zieles behilflich sein können.

Posted on