datacollection

39 Wissen entgrenzen

< Back to problem stories

Mehrere Forschende arbeiten über verschiedene Standorte international verteilt an ihren Projekten, die einem gemeinsamen Metathema verpflichtet sind. Der Austausch mit den Projektbeteiligten an den anderen Standorten ist von zentraler Bedeutung. Ungeachtet der räumlichen, sprachlichen und fachdisziplinären Diversität benötigen alle eine gemeinsame Infrastruktur, mit der sie untereinander kommunizieren, Befunde teilen und gemeinsame Ergebnisse präsentieren können. Dazu soll auch eine multimediale Datenbank in verschiedenen Sprachen (Arabisch, Persisch und Russisch) gehören. Die Forschenden stehen vor folgenden Problemen: • Die Beteiligten der Projektgruppen sind sich unsicher, welche Kommunikationskanäle ihnen stabile Nutzungsbedingungen bieten können, zumal sie in Regionen mit unterschiedlichen, vor allem aber schwachen technischen Standards arbeiten. • Unklar ist für sie ebenso, wie sie bei der Nutzung dieser Services vor dem Verlust von Forschungsdaten gefeit sind. • Erst recht gilt dies für den Datenschutz, auf den einige von ihnen aufgrund ihrer Forschungsarbeit in politisch brisanten Regionen besonders angewiesen sind. Die Gruppe wünscht sich daher eine Forschungsumgebung, die ausfallsichere Kommunikationswege aufweist. Wichtig ist für sie die Möglichkeit, erhobene Forschungsdaten und Forschungsergebnisse ausfallsicher hinterlegen und auch untereinander austauschen zu können. Zu den Anforderungen an das Speichersystem gehört auch, dass multilinguale Texte und verschiedene Dateiformate sicher hinterlegt werden können, von Textdateien über Bildformate bis hin zu Audio- und Videomaterial. Die Gewährleistung der Datenschutzanforderungen verschiedener Jurisdiktionen ist eine besondere Anforderung.

Posted on

38 Integration von verschiedenen Datensets mit externen Werkzeugen

< Back to problem stories

Forscher_innen aus den Bereichen Geowissenschaften, Biodiversität, Archäologie, Soziologie und Geschichte befassen sich mit der Landschaftsgeschichte des Libanon über einen langen Zeitraum hinweg. Dafür möchten diese Forscher_innen ein gemeinsames Geografisches Informationssystem (GIS) aufbauen und sowohl mit Geodaten, Shapefiles als auch anderen Datenbanken als Forschungstool nutzen. Da es die für GIS notwendigen geographische Lexika (Gazetteer), die Orte mit Namen, Verwaltungseinheiten und, im besten Fall, Geodaten, für den Nahen Osten nur sehr eingeschränkt gibt, funktioniert automatisches geo-referencing häufig nicht, und Toponyme werden nur unzureichend gefunden. Die Forscher_innen aus verschiedenen Disziplinen können die überwiegende Mehrheit aller Entities von internationalen Normdatensätzen nicht gebrauchen und müssen diese erst als Grundlage definieren. Notwendig wäre daher, dass • Server-basierte Plattformen zur allgemeinen Nutzung durch Forschende zur Verfügung gestellt werden; • die erlaubten Standards nicht vordefinieren, sondern volle Anpassung an die Bedürfnisse der Nutzer_innen bei gleichzeitiger Validierung der Daten erlauben; • bei der Entwicklung und Aushandlung von Standards (in der Form von z.B. Community Standards oder Best Practices) Hilfe geboten wird.

Posted on

37 Internationale und interdisziplinäre Publikation von Forschungsdaten

< Back to problem stories

Eine Wissenschaftlerin möchte ihre Forschungsergebnisse publizieren. Da Quellen aus unterschiedlichen Ländern in Europa und darüber hinaus Gegenstand ihrer Forschung sind, möchte die Forschende eine internationale Zielgruppe ansprechen. Zudem bietet ihre Forschung Anknüpfungspunkte für nicht historische Disziplinen, sodass sie auch für nicht historisch arbeitende Wissenschaften sichtbar sein soll. Die Publikation soll frei im Internet verfügbar sein. Gemeinsam mit ihrer Veröffentlichung möchte die Forscherin zudem einige von ihr transkribierte Quellen publizieren. Allerdings steht für die Forschende nur eine kostenlose Lösung zur Debatte, da ihr keine finanziellen Mittel für eine Publikation zur Verfügung stehen. Die Forscherin ist mit folgenden Problemen konfrontiert: • Der Wissenschaftlerin ist nicht bekannt, wie sie die gewünschte internationale und interdisziplinäre Sichtbarkeit ihrer Forschung erreichen kann. • Sie kennt das internationale Publikationswesen und die damit verbundenen Stakeholder und Communities kaum. • Auch mit den organisatorischen, technischen und informationswissenschaftlichen Hintergründen des Publizierens ist sie wenig vertraut. • Daher sind der Wissenschaftlerin weder die unterschiedlichen Formate des wissenschaftlichen Publizierens noch die dazugehörigen Standards bekannt. • Sie hat auch keine Idee, wie sich eine internationale und interdisziplinäre Sichtbarkeit ihrer Forschung sowohl organisatorisch als auch technisch umsetzten lässt. • All dies macht es der Forscherin unmöglich, eine zu ihren Anforderungen passende Publikationsstrategie zu entwickeln. Die Wissenschaftlerin wünscht sich deshalb eine zentrale Plattform, die ihr dabei hilft, eine bedarfsgerechte Veröffentlichungsstrategie zu entwickeln. Von dieser Infrastruktur wünscht sich die Forscherin nicht nur Beratung zu den verschiedenen Formen und Formaten der internationalen Wissenschaftskommunikation, sondern auch zu den organisatorischen, technischen und informationswissenschaftlichen Werkzeugen, um ihre Forschung international und interdisziplinär sichtbar zu machen. Die Wissenschaftlerin wünscht sich des Weiteren, dass die Infrastruktur ihr nationale und internationale Kontakte vermittelt, die ihr beim Erreichen ihres Zieles behilflich sein können.

Posted on

36 Publizieren im Open Access

< Back to problem stories

Ein Nachwuchswissenschaftler möchte die gesammelten Beiträge einer von ihm organisierten internationalen Konferenz publizieren. Er hat leider keine finanziellen Mittel zur Verfügung, sodass er eine kostenfreie Lösung benötigt. Da die Beiträge von Forschenden aus vielen verschiedenen Ländern mit jeweils eigenen Publikationsmärkten stammen, strebt der Nachwuchswissenschaftler eine Veröffentlichung im Internet an. Diese Publikation soll weltweit kostenfrei zum Download verfügbar sein. Wichtig ist dem Forschenden auch eine redaktionelle Betreuung, da er darin ein Qualitätsmerkmal von Publikationen sieht, das seiner wissenschaftlichen Karriere zuträglich ist. Gleiches gilt für die regelkonforme Erschließung des Bandes nach den gängigen bibliothekarischen Standards und dessen langfristige Erreichbarkeit und Zitierbarkeit. Der Nachwuchswissenschaftler ist jedoch weder mit bibliothekarischen Standards, noch mit den unterschiedlichen Formaten von Veröffentlichungen und Wissenschaftskommunikation im Open Access vertraut. Aufgrund dessen wünscht sich der Nachwuchswissenschaftler eine Publikationsplattform, über die er die gesammelten Beiträge online im Open Access publizieren kann. Diese Plattform soll eine eigene Redaktion besitzen, und umfassende Metadaten aufweisen, die einsehbar und downloadbar sind. Die Redaktion soll den Nachwuchswissenschaftler außerdem zu den unterschiedlichen Formen wissenschaftlicher Dissemination und Publikation sowie den dazugehörigen technischen und informationswissenschaftlichen Hintergründen beraten. Jeder einzelne Beitrag des Sammelbandes soll durch persistente Identifikatoren dauerhaft zitierbar und durch backup-Systeme und digitale Langzeitarchivierung auch langfristig erreichbar sein.

Posted on

35 Bildungs- und Armutsgeschichte im außereuropaeischen Raum

< Back to problem stories

Die Erforschung der Geschichte des betreffenden Landes steht vor grundsätzlichen Problemen hinsichtlich der Quellenlage. Zu nennen ist hier eine langjährige Vernachlässigung der einschlägigen Archivbestände, dann eine unzureichende Finanzierunggrundlage für die Sammlung, sachgerechte Unterbringung und vor allem systematische Katalogisierung und archivarische Erschließung von Quellen. Diese Probleme haben der Geschichtsforschung zu diesem Land nicht nur in Deutschland, sondern weltweit erhebliche Schwierigkeiten bereitet. Um diesem unhaltbaren Zustand in ersten Schritten abzuhelfen, hat ein Pilotprojekt verschiedenes Material gesammelt und dabei einen thematischen Schwerpunkt auf die Bildungsgeschichte gelegt. Dieses Quellenmaterial wurde in einer Zotero basierten Datenbank erschlossen. Des Weiteren ist ein Korpus von Audiomaterial entstanden, das Oral History Interviews zusammenführt. Zu den Tonaufnahmen gibt es auch entsprechende Transkriptionen. Diese Bestände sind in einem Forschungsinstitut aufbewahrt, können dort auf Anfrage kostenlos benutzt werden, was auch regelmäßig und intensiv geschieht. Der Erfolg des Pilotprojekts, in dem wertvolle Datenbestände erschlossen wurden, zeigt sich nicht zuletzt in der intensiven Nachnutzung der erschlossenen Materialien. Daraus leiten sich allerdings weitere Fragen für die fortdauernde Verfügbarkeit der Daten für die Wissenschaft ab: • Wie können die Datenbestände angesichts der intensiven Nutzung besser aufbereitet werden? Und welche Vorkehrungen muss man treffen, um einen erweiterten Nutzerkreis sowohl in Deutschland als auch international zu erreichen? • Welche Maßnahmen sind für eine langfristige Verfügbarkeit und dauerhafte Bereitstellung der Bestände zu ergreifen? • Welche Datenformate kommen hierfür infrage? Müssen also die derzeit vorhandenen Daten nochmals bearbeitet, transformiert und migriert werden? Gibt es für ein solches Szenario musterhafte Workflows? Dies auch, da das Projekt abgeschlossen ist und keine weitere Finanzierung dafür in Aussicht steht?

Posted on

34 Arbeitsgeschichte: Prozess und Alltag in historischer Perspektive

< Back to problem stories

Ein internationales Projekt mit starker außereuropäischer Beteiligung untersucht die Geschichte der Arbeit eines außereuropäischen Landes seit dem 20. Jahrhundert als Prozess- und Erfahrungsgeschichte. Zum einen beinhaltet dies die Untersuchung des Wandels von Arbeitsprozessen, Arbeitswissen und betrieblicher Arbeitsorganisation seit den Anfängen des industriellen Kapitalismus. Zum anderen liegt ein Forschungsschwerpunkt auf der Alltagsgeschichte der modernen Arbeit anhand oraler und schriftlicher Selbstzeugnisse. Da auch die Quellengrundlage auch auf vielen außereuropäischen, nichtlateinischen Sprachen basiert, entsteht im Rahmen des Projekts ein in seiner Art einzigartiger, vielsprachiger Archivbestand. Er soll nicht nur die Projektarbeit dokumentieren, sondern auch der wissenschaftlichen Öffentlichkeit als Ressource zu weiteren Forschungen Open Access zur Verfügung gestellt werden. Das wissenschaftliche Design des Projekts ist fixiert. Doch es gibt offene Fragen im Hinblick auf die Aufnahme, Erschließung und Bereitstellung des mehrsprachigen Archivbestands für eine frei verfügbare digitale Präsentation: • Welche technischen Werkzeuge sind für die Erstellung und Publikation der Daten notwendig? • Gibt es hierfür Standards und Formate, die sich besonders dafür eignen? • Wie kann das Projekt mit Fragen des Datenschutzes bei personenbezogenen Daten umgehen? Hat dies Auswirkungen auf die Lizenzierung, gerade weil eine freie Verfügbarkeit der Daten angestrebt wird? • Was muss man im Projekt beachten, damit die Daten für eine langfristige Zugänglichkeit und eine nachhaltige Speicherung aufbereitet werden?

Posted on

29 Aufbau einer integrierten Datenbank zu familiären Beziehungen

< Back to problem stories

In unserem familienkundlichen Verein wird seit den 1990er Jahren immer wieder der Wunsch laut, dass eine gemeinsame Familiendatenbank aufgebaut wird, an der alle Mitglieder gleichzeitig mitarbeiten können. Ziel wäre es, dass eine Person jeweils nur einmal in der Datei auftaucht, und dass sowohl die Originalquellen (z.B. Kirchenbücher oder Volkszählungslisten) als auch die Kontaktdaten der Bearbeiter transparent angegeben werden. Grundlage wären nicht die laufenden, sondern die jeweils bereits abgeschlossenen Forschungen, wobei allerdings auch Datenbestände unterhalb der Ebene eines abgeschlossenen Ortsfamilienbuchs genutzt werden sollen. Gesucht werden erstens Verfahren der eindeutigen Identifikation von Personen über Normdaten, zweitens Verfahren und Standards der Datenkuratierung, drittens Techniken der Programmierung von Webinterfaces, die eine niederschwellige Pflege und Abfrage der Daten ermöglichen. Eine andere Variante dieser Problematik stellt sich dort, wo verschiedene regionale Familiendatenbanken bereits existieren und nicht von einem "Schwarm", sondern von Einzelnen verantwortet werden. Einer der beteiligten regionalen Vereine hat z.B. eine Familiendatenbank mit etwa einer halben Million Personendatensätzen erstellt, die ungefähr den Raum eines ganzen Bundeslandes für die Zeit ab ca. 1700 erfasst. Ein anderer Verein strebt an, einen an das niederländische (dort von einem Verbund von Archiven getragene) Portal https://www.wiewaswie.nl/en/ angelehnten Verbund aus bereits publizierten Ortsfamilienbüchern zu schaffen. Ein langfristiges Ziel des Vereins für Computergenealogie besteht darin, die für etwa 800 Orte separat geführten Online-Ortsfamilienbücher mit zusammen über 10 Millionen historischen Personendatensätzen untereinander zu verknüpfen. In jedem Fall stellt die Verknüpfung über Normdaten ein Problem dar, weil personenbezogene Normdaten erst über Verfahren der Record Linkage hergestellt werden müssen. Hier käme es darauf an, dass eine Best Practice zur Konstruktion personenbezogener Normdaten erarbeitet würde.

Posted on

28 Gibt es wissenschaftliche Standards für die Ahnenforschung?

< Back to problem stories

Ich steige als Privatmann gerade in die Ahnenforschung ein. Ich sehe die Ahnenforschung allerdings nicht nur als Selbstbeschäftigung, auch andere sollen etwas von den Forschungsergebnissen (und -Wegen) haben und sie bestmöglich selbst vollständig nachvollziehen können. Gibt es wissenschaftliche Standards die ich anwenden kann, um dies zu garantieren? Könnte das Forschungsdatenmanagement nicht nur die Forschungsdaten managen, sondern über den gesamten Prozess, wie man solche Daten – z.B. eben über die Vorfahren – zusammenstellt, so klar informiert, schult und berät, dass auch Anfänger den verstehen?

Posted on

21 Georeferenzierung innovativer Regionen in den deutschen Staaten

< Back to problem stories

In einer Forschergruppe erheben wir Informationen zu den in den Deutschen Staaten erteilten Patenten im Zeitraum 1840-1877. Die Daten erhalten reichhaltige Informationen zur patentierten Technologie, den Berufen der Patentinhaber und deren Wohnorten. Letztere ermöglichen eine Landkarte innovativer Orte/Regionen über einen langen Zeitraum zu zeichnen und beispielsweise Fragen der Persistenz zu adressieren. Als Blocker erweist sich dabei, dass wir uns mühsam die Geodaten der erfassten Orte beschaffen müssen, erschwerend kommt außerdem hinzu das viele kleine Orte mittlerweile eingemeindet wurden oder - in den östlichen preußischen Provinzen - Ortsnamen gewechselt haben. Eine historische Datenbank, die Gebietsveränderungen über die Zeit nachvollzieht und den Orten Geodaten zuordnet wäre hier sehr hilfreich.

Posted on

18 Erfassung, Geo-Lokalisierung und Visualisierung von handschriftlich verfassten Massendaten

< Back to problem stories

Seit einiger Zeit arbeite ich mit einer kleinen Gruppe an der Zusammenstellung von Glockengussdaten. Dabei handelt es sich um Informationen, die 1940/41 anlässlich der bevorstehenden Einschmelzung der Glocken auf Karteikarten gesammelt wurden, insgesamt etwa 20.000. Für uns von Interesse sind Standort der Glocke (1940/41) und Zeitpunkt des Glockengusses (z.T. zurück bis ins 11. Jh.). Da Glocken fast nie den Standort wechseln, soll im Endergebnis eine Art dynamische Heatmap über die Jahrhunderte gezeigt werden, wann wo besonders viele oder wenig Glocken gegossen wurden. In Ermangelung wirtschaftsstatistischer Daten wäre das eine Art Proxy-Variable für wirtschaftliche Konjunkturen (das ist jetzt alles sehr grob vereinfacht). Alle Karteikarten liegen in digitalisierter Form vor. Unser erstes Problem betrifft die Übertragung der relevanten Daten (v.a. Standort und Glockengussdatum) von der handgeschriebenen Karteikarte in eine Tabelle. Wo finden wir Informationen darüber, welche Software sich für das Einlesen relativ standardisierter, aber eben handgeschriebener Daten eignet? Wieviel Nachkorrekturen sind ungefähr nötig? Um zweitens eine Glocke mit vertretbarem Aufwand georeferenzieren zu können, benötigen wir eine Zuordnung des Ortsnamens von 1940/41 zu einer Geo-Position. Wo finden wir eine Übersicht über entsprechende Datenbanken? Erschwerend kommt hinzu, dass 1940/41 selbständige Gemeinden heute nur noch Stadtteile oder unselbständige Teilgemeinden sind. Drittens schließlich stellt sich die Frage der Visualisierung. Die politischen Grenzen haben sich vom 11. Jahrhundert bis 1941 immer wieder geändert. Gibt es historische Karten, die es erlauben würden, auf der dynamischen heatmap die korrekten jeweiligen Grenzverläufe zu visualisieren (etwa in 50-Jahres-Abständen)?

Posted on