1. Was sind Forschungsdaten?

Als 'Forschungsdaten' bezeichnet man kontextualisierte Daten, die während des Forschungsprozesses anfallen. Sie sind damit nicht nur laufendes Ergebnis wissenschaftlichen Arbeitens, sondern eine ständige und wesentliche Grundlage. Formen und Formate richten sich dabei nach Design, Fragen, Methoden und Traditionen des jeweiligen Vorhabens und Erkenntnisinteresses, also nach dem Forschungsdatenlebenszyklus und Nutzungsszenarien. Forschungsdaten können Messdaten, Interviews, Bilder, Sammlungsgegenstände als auch ein weites Spektrum audiovisueller Informationen umfassen. Ihre langfristige Sicherung und Bereitstellung soll dabei nicht nur die wissenschaftliche Nachvollziehbarkeit gewährleisten, sondern auch Austausch, Synergien und gemeinsame nachhaltige Nutzung von geteilten und öffentlich finanzierten Ressourcen befördern.

Forschungsdatenlebenszyklus

Der Forschungsdatenlebenszyklus beschreibt jene Phasen, die Forschungsdaten von ihrer Entstehung bis zur Publikation oder Löschung durchlaufen. Die Darstellung eines Lebenszyklus kann sich je nach Forschungsvorhaben unterscheiden und teils deutlich ausdifferenziertere Phasen abbilden.

Einen ersten Überblick zum Umgang mit Forschungsdaten bietet u. a. die DFG.

In den Kunst-, Kultur- und Geisteswissenschaften entstehen Forschungsdaten vornehmlich bei der Sammlung, Erfassung, Erschließung und Analyse von Primärquellen und Forschungsprimärdaten. Dabei handelt es sich um digitale sowie digitalisierte Datensätze, die materielle und immaterielle Kulturgüter aus unterschiedlichen Quellen und Beständen repräsentieren können. Für die Forschungsdatenpraxis in den Kunst-, Kultur- und Geisteswissenschaften resultiert daraus eine große Breite unterschiedlicher Medientypen, etwa Film, Video, Audiomaterial, Musiknotation, Digitalisate bildender Kunst, Buch- und Kunstdrucke, Handschriften, Interviews, Fotos, Objektdateien, Software und viele mehr; konkretere Beispiele wären etwa die philologische Nachlassforschung oder auch die sozialwissenschaftlich geprägte Stadtforschung, die sich mitunter aus medial sehr heterogenem Material sowie Metadaten speisen.

Digitalisate

Sind Digitalisate musikalischer, filmischer und ähnlicher Quellen eigentlich schon Forschungsdaten? Es sind doch nur Abbildungen ... Die Herstellung dieser digitalen Repräsentationen ist eine Transformation (Originalgröße, Farben, etc.). Diese Transformation sollte in den Metadaten des Digitalisats dokumentiert werden. Durch diese Metadaten und die Kontextualisierung der Digitalisate entstehen Forschungsdaten – erst recht, wenn ihnen zudem editorische Texte oder textkritische Annotationen beigegeben sind. Vgl. die Infoseiten der Staatsbibliothek zu Berlin und der Bayerischen Staatsbibliothek.

Metadaten

Metadaten sind strukturierte Beschreibungen anderer Daten bzw. digitaler Objekte. Metadaten können ein Objekt identifizieren (durch Angabe einer URL, von Urheber:in, Titel, Entstehungsdatum des Objekts u. a. mehr), sie können administrative (Wer hat das Objekt digitalisiert?), rechtliche (Welche Lizenz ist damit verbunden?), inhaltliche (Verschlagwortung) oder technische (In welchem Formt liegt das Objekt vor?) und weitere Aspekte oder Merkmale betreffen. Je nach Einsatzgebiet und Gegenstand muss zwischen verschiedenen Metadaten-Standards gewählt werden.

Ausprägungen fachspezifischer Metadaten

Forschungsdaten können bei der Erstellung von Digitalisaten entstehen, aber auch Annotationen derselben darstellen. Besonderes Augenmerk verdienen 'nachgenutzte' Daten aus früheren Forschungsprozessen. Sie umfassen nicht zuletzt die Neustrukturierung oder Überführung in neue Zusammenhänge/Ontologien, durch die Materialien überhaupt erst beschrieben und mit anderen Wissensbeständen verknüpft und in diesen integriert werden (Semantic Web). Im Allgemeinen sind dies also selbst erhobene oder damit auch 'vorstrukturierte Rohdaten' bis hin zu Forschungsergebnissen im Sinne von Publikationen, die in diesem Prozess systematisiert, operationalisierbar oder überhaupt erst maschinenlesbar und dadurch anschlussfähig gemacht werden.

Semantic Web

Das Semantic Web erlaubt den Austausch und die automatisierte Auswertung von strukturierten Daten im Internet. Durch den Einsatz von Identifikatoren, kontrolliertem Vokabular, formalen Schemata und weiteren Standards werden ansonsten unstrukturiert vorliegende Elemente einer Webseite kontextualisiert und für Maschinen verstehbar und semantisch auswertbar.