Als 'Forschungsdaten' bezeichnet man kontextualisierte Daten, die während des Forschungsprozesses anfallen. Sie sind damit nicht nur laufendes Ergebnis wissenschaftlichen Arbeitens, sondern eine ständige und wesentliche Grundlage. Formen und Formate richten sich dabei nach Design, Fragen, Methoden und Traditionen des jeweiligen Vorhabens und Erkenntnisinteresses, also nach dem Forschungsdatenlebenszyklus und Nutzungsszenarien. Forschungsdaten können Messdaten, Interviews, Bilder, Sammlungsgegenstände als auch ein weites Spektrum audiovisueller Informationen umfassen. Ihre langfristige Sicherung und Bereitstellung soll dabei nicht nur die wissenschaftliche Nachvollziehbarkeit gewährleisten, sondern auch Austausch, Synergien und gemeinsame nachhaltige Nutzung von geteilten und öffentlich finanzierten Ressourcen befördern.
Der Forschungsdatenlebenszyklus beschreibt jene Phasen, die Forschungsdaten von ihrer Entstehung bis zur Publikation oder Löschung durchlaufen. Die Darstellung eines Lebenszyklus kann sich je nach Forschungsvorhaben unterscheiden und teils deutlich ausdifferenziertere Phasen abbilden.
Einen ersten Überblick zum Umgang mit Forschungsdaten bietet u. a. die DFG.
In den Kunst-, Kultur- und Geisteswissenschaften entstehen Forschungsdaten vornehmlich bei der Sammlung, Erfassung, Erschließung und Analyse von Primärquellen und Forschungsprimärdaten. Dabei handelt es sich um digitale sowie digitalisierte Datensätze, die materielle und immaterielle Kulturgüter aus unterschiedlichen Quellen und Beständen repräsentieren können. Für die Forschungsdatenpraxis in den Kunst-, Kultur- und Geisteswissenschaften resultiert daraus eine große Breite unterschiedlicher Medientypen, etwa Film, Video, Audiomaterial, Musiknotation, Digitalisate bildender Kunst, Buch- und Kunstdrucke, Handschriften, Interviews, Fotos, Objektdateien, Software und viele mehr; konkretere Beispiele wären etwa die philologische Nachlassforschung oder auch die sozialwissenschaftlich geprägte Stadtforschung, die sich mitunter aus medial sehr heterogenem Material sowie Metadaten speisen.
Sind Digitalisate musikalischer, filmischer und ähnlicher Quellen eigentlich schon Forschungsdaten? Es sind doch nur Abbildungen ... Die Herstellung dieser digitalen Repräsentationen ist eine Transformation (Originalgröße, Farben, etc.). Diese Transformation sollte in den Metadaten des Digitalisats dokumentiert werden. Durch diese Metadaten und die Kontextualisierung der Digitalisate entstehen Forschungsdaten – erst recht, wenn ihnen zudem editorische Texte oder textkritische Annotationen beigegeben sind. Vgl. die Infoseiten der Staatsbibliothek zu Berlin und der Bayerischen Staatsbibliothek.
Metadaten sind strukturierte Beschreibungen anderer Daten bzw. digitaler Objekte. Metadaten können ein Objekt identifizieren (durch Angabe einer URL, von Urheber:in, Titel, Entstehungsdatum des Objekts u. a. mehr), sie können administrative (Wer hat das Objekt digitalisiert?), rechtliche (Welche Lizenz ist damit verbunden?), inhaltliche (Verschlagwortung) oder technische (In welchem Formt liegt das Objekt vor?) und weitere Aspekte oder Merkmale betreffen. Je nach Einsatzgebiet und Gegenstand muss zwischen verschiedenen Metadaten-Standards gewählt werden.
Ausprägungen fachspezifischer Metadaten
Es gibt eine Vielzahl unterschiedlicher Metadaten im Bereich der Musikwissenschaft, je nach dem ob es sich um museale, bibliothekarische, performative oder editorische Kontexte handelt.
Nicht zuletzt aufgrund der weitgehenden Möglichkeiten, Metadaten zum codierten Werk im Header der MEI-Datei zu erfassen, gilt MEI als Codierung für digitale musikalische Editionen aus wissenschaftlicher Perspektive als der vermutlich wichtigste Standard für Noten- bzw. Werktexte (bspw. Informationen zum Werk, den Quellen, der edierten Fassung etc.). Informationen dazu werden fortlaufend in dem entsprechenden Abschnitt der MEI-Guidelines dokumentiert und beschrieben.
Für audiovisuelle Medien herrscht bezüglich der Erfassung von Metadaten aktuell noch eine heterogene Situation mit verschiedenen methodischen Ansätzen im Hinblick auf Struktur und Transparenz.
Vgl. die Sonderreihe Forschungsdaten im Blog Open Media Studies
Die Kunstgeschichte arbeitet mit diversen Datenformaten, bisher wurde kein einheitlicher Metadaten-Standard festgelegt, der die Bedürfnisse der kunsthistorischen Forschung wie auch des musealen Betriebs abdeckt. Das Fachkomitee für Dokumentation des Internationalen Museumsbundes (ICOM), CIDOC, arbeitet seit einiger Zeit daran das LIDO-Format (Lightweight Information Describing Objects) weiterzuentwickeln und zu verbessern, ein Austauschformat für objektbezogene Daten des materiellen Kulturerbes. Die internationale Arbeitsgruppe arbeitet an der Weiterentwicklung und Optimierung dieses Formates, welches europäische und amerikanische Formate zusammenführen soll und auf dem CIDOC-CRM basiert, einer Referenzontologie für den Kulturerbebereich.
In der Architektur spielen Dokumentationsstandards eine entscheidende, konstitutive wie buchstäblich konstruktive Rolle: im Entwurfsprozess und der Bauausführung sowie in der Baustellenaufnahme, Denkmalpflege und Rekonstruktion. Forschungsdaten sind sowohl die Grundlage für die Entwicklung neuer Bau- und Planungskonzepte als auch der historischen Bauforschung. Somit werden Bauwerksinformationen in einer Vielzahl von Typen und Formen gerade auch benachbarter Wissenschaften einbezogen: Normen, Erhebungen, Objekt- und Materialeigenschaften, (historische) GIS, Fotografien, Schnitte, Grundrisse, Ansichten, Modelle und viele mehr begleiten ein Bauwerk.
Forschungsdaten können bei der Erstellung von Digitalisaten entstehen, aber auch Annotationen derselben darstellen. Besonderes Augenmerk verdienen 'nachgenutzte' Daten aus früheren Forschungsprozessen. Sie umfassen nicht zuletzt die Neustrukturierung oder Überführung in neue Zusammenhänge/Ontologien, durch die Materialien überhaupt erst beschrieben und mit anderen Wissensbeständen verknüpft und in diesen integriert werden (Semantic Web). Im Allgemeinen sind dies also selbst erhobene oder damit auch 'vorstrukturierte Rohdaten' bis hin zu Forschungsergebnissen im Sinne von Publikationen, die in diesem Prozess systematisiert, operationalisierbar oder überhaupt erst maschinenlesbar und dadurch anschlussfähig gemacht werden.
Das Semantic Web erlaubt den Austausch und die automatisierte Auswertung von strukturierten Daten im Internet. Durch den Einsatz von Identifikatoren, kontrolliertem Vokabular, formalen Schemata und weiteren Standards werden ansonsten unstrukturiert vorliegende Elemente einer Webseite kontextualisiert und für Maschinen verstehbar und semantisch auswertbar.