Von der Erhebung, Auswertung bis hin zur Publikation und Überprüfung, Archivierung und Nachnutzung durchlaufen Forschungprojekte sowie Daten einige Phasen, die es zu planen gilt – vor allem aus Gründen der Qualitätssicherung, Transparenz und Rechtssicherheit, aber nicht zuletzt auch, weil Förderinstitutionen wie etwa die Deutsche Forschungsgemeinschaft oder der European Research Council bei der Beantragung von Drittmittelprojekten einen Datenmanagementplan von den Antragstellenden fordern. Somit sind nicht nur forschungsimmanente Fragen und Erkenntnisinteressen im Vorfeld zu klären, sondern auch technische, ethische und rechtliche Regularien und Bedingungen.
Ein Datenmanagementplan (DMP) beschreibt den Umgang mit Forschungsdaten, die in einem Projekt produziert oder genutzt werden, während der Projektlaufzeit und darüber hinaus. Der DMP enthält Regelungen, die innerhalb des Projektteams vereinbart und angewendet werden. Er hilft, das Datenmanagement systematisch zu planen und transparent umzusetzen. Er dokumentiert die Speicherung, Verzeichnung, Pflege und Verarbeitung der Daten. Der Datenmanagementplan ist wichtig, um Daten für Dritte interpretierbar und nachnutzbar zu machen.
Es ist empfehlenswert, bereits vor Projektbeginn anhand systematischer Fragen zur Beschaffenheit der Daten zu klären, welche Verantwortlichkeiten im Umgang mit den Daten vorliegen. Ein systematisches Werkzeug, anhand solcher Fragen einen DMP zu erstellen, bietet das Open-Source-Tool Research Data Management Organiser (RDMO), das Wissenschaftler:innen bei der Erstellung von Datenmanagementplänen unterstützt und es ihnen erlaubt, diese Pläne im Verlauf des Forschungsprozesses laufend anzupassen (vgl. Erstellen eines Datenmanagementplans)
Eines der wichtigsten Argumente für das Publizieren und Archivieren von Forschungsdaten sind Qualitätssicherung, Nachvollziehbarkeit und Nachnutzbarkeit als Kernpunkte guter wissenschaftlicher Praxis (siehe den Abschnitt zu den FAIR-Prinzipien). Daher sollten schon in der Antragsphase Datenrichtlinien und Strategien entwickelt werden, welche Daten erhoben und verarbeitet und wie sie für mindestens zehn Jahre zu sichern und zu pflegen sind sowie zugänglich und anschlussfähig gemacht werden können. Die während des Forschungsprozesses gesammelten Daten sollten also dahingehend bestimmt werden, wie sie digital transformiert, prozessiert, selektiert und gespeichert werden. Bestenfalls sollen sie großzügig durch Metadaten beschrieben werden, so dass sowohl das eigene Forschungsprojekt als auch folgende die gesammelten Daten verstehen und daran anknüpfen können. Hierbei sollten vor allem offene Standards Verwendung finden und die Forschungsdaten strukturiert erschlossen und gesichert werden. Gemeinsame Datenstandards (ggf. Normdaten), Repositorien und freie Nutzungsangebote (Open Access, Creative Commons etc.) fördern und gewährleisten dabei die Interoperabilität und Sichtbarkeit, also auch die internationale wie interdisziplinäre Vernetzung unabhängig von den jeweiligen Fachpublikationen.
Die Standardisierung von Daten hilft dabei, verschiedene Datensätze miteinander in Beziehung zu setzen und auch über Institutions-, Sprach- und Disziplingrenzen hinweg auffindbar und verständlich zu machen. Um die Interoperabilität, d. h. die Verknüpfung und gemeinsame Bearbeitung, bspw. von Metadaten zu gewährleisten, wurden für bestimmte Zwecke Metadatenstandards geschaffen. Sie dienen einer inhaltlich als auch strukturell gleichförmigen Beschreibung von ähnlichen Daten.
Normdaten dienen dazu Personen, Orte, Institutionen etc. eindeutig identifizieren zu können. Mit ihrer Hilfe kann automatisiert unterschieden werden, ob die Zeichenfolge 'Paris' sich auf die Hauptstadt Frankreichs, eine Stadt im US-Bundesstaat Idaho oder einen griechischen Heros und Verteiler von Äpfeln handelt. Wichtige Ressourcen für Normdaten sind die Gemeinsame Normdatei (GND) der Deutschen Nationalbibliothek, das Virtual International Authority File (VIAF) und Wikidata.
Ein Repositorium kann als eine spezielle Form des Archivs betrachtet werden. Im digitalen Zeitalter wird unter dem Begriff Repositorium ein verwalteter Speicherort für digitale Objekte (Publikationen, Digitalisate, Forschungsdaten o. ä.) verstanden. Repositorien können den Output einer Institution (Universität, Forschungseinrichtung) aufnehmen oder auch einem fachspezifischen, thematischen Profil sammeln. Eine Übersicht von Repositorien im Kulturbereich bietet das NFDI4Culture-Portal.
Open Access stellt eine zentrales Element der Open-Science-Bewegung dar und zielt auf den kostenlosen und möglichst barrierefreien Zugang zu Forschungsdaten und -ergebnissen. Dieser kann bspw. aufgrund urheberrechtlicher Vorgaben mittels Lizenzierung – etwa mit Creative Commons-Lizenzen – eingeschränkt bzw. unterschiedlich geregelt werden. (Fragen zu Urheberrecht und Lizenzierung im Forschungskontext beantwortet übrigens der Helpdesk von NFDI4Culture.)
Ein systematischer Umgang mit Forschungsdaten hilft nicht nur dabei, das eigene Vorgehen und die Ergebnisse zu konturieren und nachvollziehbar zu machen, sondern auch, anderen Forscher:innen zu ermöglichen, die erhobenen wie strukturierten Daten als Basis oder Baustein eigener Fragestellungen zu nutzen und damit die Vernetzung der Wissenschaft über Fächergrenzen hinaus voranzutreiben. Zudem verstehen Förderinstitutionen wie die DFG einen systematischen und nachhaltigen Umgang mit Forschungsdaten mittlerweile als zentralen Bestandteil förderungswürdiger Forschungsprojekte, wodurch Kenntnisse im Umgang mit Forschungsdaten inzwischen ein essenzieller Bestandteil wissenschaftlichen Arbeitens sowie der erfolgreichen Beantragung von Forschungsprojekten geworden sind.
Um einen Überblick über alle relevanten Aspekte zu gewinnen, bietet sich eine Orientierung am bereits erwähnten Datenlebenszyklus an: Ein Forschungsvorhaben wird geplant, Daten werden erhoben, strukturiert, analysiert, und zur Qualitätssicherung wie Nachnutzung publiziert, archiviert und geteilt.
Der systematische Umgang mit Forschungsdaten fängt also im Kleinen und beim Einzelnen an: mit der Definition, was im Verlauf des eigenen Vorhabens überhaupt Forschungsdaten sind. Dies setzt sich über grundsätzliche Aspekte wie die Benennung und Ablage von Daten fort bis hin zu großen Fragen wie der längerfristigen Archivierung und Nachnutzung. Neben Datenrichtlinien und Angaben über Datenkuration und Datenmanagement, sind rechtliche Schranken und Rechte Dritter, vor allem des Datenschutzes und Urheberrechts zu beachten. Für die Lizenzierung von Forschungsergebnissen und Publikationen bieten sich die Creative Commons Urheberrechtslizenzen an, um so eine rechtssichere Weiternutzung der Daten durch Dritte zu ermöglichen.