9.3 Aktives Projektmanagement mit dem Datenmanagementplan

Datenmanagementpläne (DMP) sind ein Schlüsselelement eines guten Datenmanagements. Ein DMP beschreibt den Lebenszyklus der Daten. Er macht Aussagen über den Umgang mit Forschungsdaten während und nach dem Ende des Projekts. Dazu gehört, welche Daten gesammelt, verarbeitet und/oder erzeugt werden, welche Methoden und Standards angewandt werden, zu welchen Konditionen Daten genutzt werden können und wie die Daten kuratiert und aufbewahrt werden, auch nach Projektende. Er unterstützt Sie bei der Identifikation aller an einem Projekt Beteiligten und bei der realistischen Kalkulation der notwendigen Aufwände in Bezug auf Personal, Zeit, Fachexpertise und finanzieller Mittel.

Tipps zum Umgang mit dem Datenmanagementplan

Schreiben Sie bereits in der Planungsphase einen Datenmanagementplan. Er ist Ihre wichtigste Planungsunterlage und die Richtschnur für die tatsächliche Handhabung der Daten. Tun Sie das nicht nur dann, wenn Ihre Daten in einem Drittmittelprojekt mit einer definierten Zielsetzung und einer zeitlichen Begrenzung entstehen und kuratiert werden, sondern auch, wenn Sie mit dynamischen Daten befasst sind, deren Aktualisierung und Fortschreibung eine Daueraufgabe ist. Dies ist z. B. bei Bestandsdaten in Kulturerbe-Institutionen der Fall.

  • Beginnen Sie bei der konkreten Planung mit der Datenlebenszyklus-Stufe der Nachnutzung, da von ihr viele Prioritätensetzungen für die anderen Stufen abhängen.
  • Beginnen Sie mit einem Grobkonzept und verfeinern Sie Ihren DMP schrittweise. Konzipieren Sie alle Schritte so, dass sie im Projektalltag realistisch umsetzbar sind.
  • Planen Sie genau, welche Personen und Institutionen Sie zur Umsetzung bestimmter Ziele konsultieren oder beteiligen müssen. Diese gehören evtl. nicht zu Ihrem Projektteam oder Ihrer Institution. Planen Sie auch Ressourcen für diese Kommunikationsprozesse ein.
  • Planen Sie auch beigeordnete Arbeitspakete innerhalb des Projekts sorgfältig, da sie aufwändiger sein können als zunächst angenommen. Dies gilt z. B. für das Ausheben eines Bestands vor der Digitalisierung oder für die Rechteklärung.
  • Halten Sie den DMP während des Projekts aktuell. Passen Sie ihn an die tatsächlichen Gegebenheiten und Herausforderungen an, sodass er auch im Projektverlauf eine realistische Planungsgrundlage bleibt.
  • Auch wenn ein DMP von Ihrer Förderinstitution oder Ihrem Vorgesetzten nicht verlangt wird, sollten Sie einen anfertigen und für Ihr Projekt als verbindlich ansehen.
  • Machen Sie den DMP für alle Projektmitarbeitenden und ggf. weitere relevante Projektbeteiligte offen zugänglich und erinnern Sie Ihr Team regelmäßig daran, diesen zu konsultieren und ggf. zu aktualisieren.
  • Ermutigen Sie Ihr Team, sich abzeichnende Schwierigkeiten in der Umsetzung des DMP frühzeitig zur Sprache zu bringen. So kann man zeitnah eine Lösungsmöglichkeit suchen, bevor das Problem gravierender wird.
  • Nutzen Sie ein webbasiertes Softwaretool zur Erstellung und Pflege Ihres DMP. Es unterstützt sie durch seine Fragebogenstruktur und passende Begleitinformationen.

Beispiel: Datenmanagementplan mit FAIR-Schwerpunkt im EU-Programm Horizon 2020

Mehr Informationen zu Datenmanagementplänen

Forschungsdaten.info

Webbasiertes Tool: An vielen deutschen Hochschulen ist der Research Data Management Organiser (RDMO) für Institutionsangehörige verfügbar. Je nach Institution sind unterschiedliche Templates für Datenmanagementpläne hinterlegt, die man für das eigene Vorhaben anpassen kann.

Tipps zur konkreten Projektplanung

  • Identifizieren Sie die Zielgruppen, die Ihnen besonders wichtig sind.
  • Identifizieren Sie die Objektbestände, die Gegenstand des Projekts sind.
  • Identifizieren Sie die Informationen, die für das Auffinden Ihrer Daten besonders relevant sind.
  • Machen Sie eine Bestandsaufnahme: Erstellen Sie einen Überblick über
    • alle Sammlungen der Einrichtung sowie über alle Datenbanken, Repositorien und Systeme, in denen die im Projektkontext relevanten Sammlungen beschrieben und präsentiert werden,
    • die existierenden Rechtsgrundlagen, Vereinbarungen und Verträge, die in Bezug auf das Rechtemanagement der physischen Objekte, ihrer Abbildungen und der Metadaten relevant sind
    • den aktuellen Umsetzungsstand der FAIR-Prinzipien
  • Welche digitalen Objekte sind in Ihrem Datenbestand identifizierbar? Legen Sie fest, welche Schichten „Daten“ sind, welche „Metadaten“ und welche Einheiten durch einen gemeinsamen Identifikator adressiert werden müssen.
  • Legen Sie anhand der geplanten Nachnutzungskontexte fest, bis zu welcher Granularitätsstufe identifizierbare digitale Objekte adressierbar sein sollen. Im Archiv könnte dies ein Konvolut mit Hunderten zugehöriger Schriftstücke sein. Sind diese allerdings einzeln verzeichnet und vorhandene Digitalisate entsprechend zugeordnet, wäre es möglich, jedes als digitales Objekt anzusprechen.
  • Legen Sie fest, welche Metadaten-Elemente Ihrer Daten Sie benötigen, um Ihre Daten gegen die Kriterien der FAIR-Prinzipien prüfen zu können. Eine sehr konkret gehaltene Checkliste für die FAIRness von Daten, die gut in einen Anforderungskatalog für einen FAIR-Entwicklungsplan integrierbar ist, bietet das FAIR Data Maturity Model.
  • Nicht alle notwendigen Informationen befinden sich in den Projektdaten selbst. Klären Sie, woher Sie ggf. die Informationen beziehen können, die Sie zur Bereitstellung aussagekräftiger Metadaten benötigen, z. B. in Bezug auf die Datenprovenienz oder auf die begleitende Dokumentation von Metadatenschemata oder Software.
  • Legen Sie im DMP die zu Ihrem Projekt passenden Kriterien für die Umsetzung der FAIR-Prinzipien fest, notieren Sie Klärungsbedarf und anstehende Aufgaben.
  • Wahrscheinlich wird es nicht möglich sein, alle Kriterien für FAIRness gleich schnell umzusetzen. Skalieren Sie, setzen Sie Prioritäten.
  • Erstellen Sie für alle Datenlebenszyklus-Stufen Kriterienkataloge. Hier sammeln Sie die Kriterien, die Ihre Daten aufweisen oder die beteiligten Akteure (Personen und Infrastrukturen) erfüllen müssen, um die verschiedenen FAIR-Aspekte umsetzbar zu machen. Listen Sie die Konsequenzen auf, die bestimmte Maßnahmen in späteren Phasen des Datenlebenszyklus haben. Dadurch werden wechselseitige Bedingtheiten klarer, die notwendigen Arbeiten lassen sich besser planen.
Beispiel: Integration von Normdatenreferenzen in einen Datenbestand

Ein Datenbestand einer Sammlung soll mit GND-Normdatenreferenzen für die erwähnten Personen, für Sachschlagworte und Geografika ausgestattet werden. Große zu bearbeitende Mengen bewältigt man effektiv mit Hilfe von Tools wie OpenRefine in separaten Arbeitsgängen im Rahmen der Datenkuratierung. Sollen zahlreiche Referenzen während der fortlaufenden Erschließung ermittelt werden, lohnt sich die Integration von Software-Funktionen, die den Katalogisierenden die schnelle Identifizierung und Verknüpfung des richtigen Normdatensatzes im Alltagsbetrieb erleichtern. Bei kleineren Mengen kann ein händisch-intellektuelles Verfahren das effektivste sein, da es einen vergleichsweise geringen Änderungsbedarf an anderen Stellen erzeugt. Die involvierten Mitarbeiter:innen müssen die einschlägigen Kompetenzen für das durchzuführende Datenmatching aufweisen oder erwerben. Änderungen an der Konfiguration der Datenbanksoftware oder des Metadatenschemas sind erforderlich. Korrektheit, Konsistenz und Abdeckung der eingetragenen Referenzen sind zu prüfen. Vor der Bereitstellung der Daten für die Publikation ist zu berücksichtigen, dass die Einträge korrekt und vollständig in das Bereitstellungsformat (z. B. MARC, LIDO, EAD) übernommen werden, die Datentransformationsskripte müssen ggf. angepasst werden.

Mit dem Betreibenden der Publikationsplattform ist ggf. abzustimmen, ob und wie die neuen Normdatenreferenzen die Funktionalitäten der Plattform unterstützen oder ob sie sogar verbesserte Linked-Data-Funktionen ermöglichen. Unkritisch ist es, falls die von Ihnen bereitgestellten Daten bereits Normdatenreferenzen enthalten, die die Plattform aktuell noch nicht verarbeitet. Die Plattformen arbeiten kontinuierlich am Qualitätsausbau ihrer Angebote und analysieren dazu die eingehenden Daten auf neue Nutzungspotentiale.

Wählen Sie eine vertrauenswürdige Datenplattform

Machen Sie Ihre Daten über ein vertrauenswürdiges Repositorium zugänglich. Prüfen Sie schon früh verschiedene Repositorien, ob und in welcher Weise diese Sie bei der Umsetzung von FAIR unterstützen. Ein zertifiziertes Repositorium bietet einen vertrauenswürdigen Speicherort für Datensätze. Die Zertifizierung ist eine Garantie dafür, dass die Daten sicher gespeichert werden und langfristig verfügbar, auffindbar und zugänglich sind. Beispiele für Zertifizierungsstandards sind CoreTrustSeal, das nestor-Siegel für vertrauenswürdige digitale Langzeitarchive und ISO 16363-Zertifizierung. Der Zertifizierungsgrad sollte auf der Webseite des Repositoriums deutlich angegeben sein. Wenn es (noch) nicht zertifiziert ist, sollte es klare Aussagen bereitstellen, wie Verfügbarkeit, Zugänglichkeit und Wiederverwendbarkeit der (Meta-)Daten über einen definierten Zeitraum sichergestellt werden. Fragen Sie nach, wenn Ihnen Informationen fehlen oder die Umsetzung der beschriebenen Konditionen nicht klar ist. Erkundigen Sie sich auch nach eventuell anfallenden Kosten für die Speicherung und die damit verbundenen Bedingungen.

Richten Sie Ihre Datenhaltung auf die Konditionen des Repositoriums aus. Wenn Sie darüber hinaus die Standards des Repositoriums befolgen (bevorzugte Dateiformate, Metadatenschemata usw.), können Sie sicherstellen, dass alle Anforderungen für die Bereitstellung der Daten erfüllt sind.

Zur Publikation von Daten aus Bibliotheken, Archiven und Museen kommen neben den bibliothekarischen Online Public Access Catalogues (OPACs), dem Archivinformationssystem Arcinsys und von einzelnen Museen oder Verbünden getragene Webdatenbanken auch Fachportale oder Kulturerbe-Portale wie die Deutsche Digitale Bibliothek (DDB) infrage, die als Aggregatoren für Europeana fungieren. DDB und Europeana unterstützen beratend das lokale Qualitätsmanagement, bereiten Daten auf und präsentieren diese nicht nur in den Portalen, sondern auch über Schnittstellen zur weiteren Nachnutzung.

Beispielhafte Darstellungen der FAIR-Policy von Repositorien

Crosas, Mercè: The FAIR Guiding Principles: Implementation in Dataverse, 2019

Zenodo Best Effort Principles: Abschnitte "FAIR Principles", "Self-assessment against the Plan S requirements for Open Access Repositories", "Strongly recommended additional criteria"