1. Einleitung

Ein zentrales Ziel von NFDI4Culture ist es, ein qualitativ hochwertiges Angebot an Forschungsdaten und Forschungsinformationen seiner Konsortialpartner bereitzustellen, bei gleichzeitig größtmöglicher Offenheit für alle Datenangebote aus den im Konsortium vertretenen Domänen. Diese Angebote sollten auch Informationen über ihre Herkunft, ihre Eigenschaften und ihre Datenqualität vermitteln, um die Anschlussfähigkeit der darin enthaltenen Daten für die Nutzenden zu garantieren. Hierzu ist sowohl ein strukturiertes als auch transparentes Qualitätsmanagement erforderlich.

Zielsetzung des Konsortiums in seiner ersten Förderphase (2020–2025) war es zunächst, innerhalb des Culture Information Portals ein Forschungsinformationssystem (Academy Current Research Information System, CRIS) aufzubauen, das es erlaubt, die vielseitigen Datenangebote der Partner fächerübergreifend zu beschreiben und in ein gemeinsames Dienste-Portfolio zu integrieren. Die Metadaten des Portals bilden gleichzeitig auch die Grundlage für die Aufnahme externer Datenangebote in den Culture Knowledge Graph. Beide Strukturen, das CRIS wie auch der Culture Knowledge Graph, wurden in der ersten Phase von NFDI4Culture Schritt für Schritt entwickelt, wobei der Aufbau dieser technischen Infrastruktur und die Integration von ersten Datenangeboten Hand in Hand liefen (vgl. Kapitel 8.1).

Parallel dazu erarbeiteten wir ein Konzept zur Bewertung der Datenqualität, was sich in konkreten Definitionen, in der Sondierung von Methoden, Arbeitsschritten und bereits bewährten Maßnahmen innerhalb unserer Domänen niedergeschlagen hat. Daneben ging es auch um Sensibilisierung der beteiligten Communities. Datenqualität ist daher in diesem Kontext auch als Prozess der Auseinandersetzung zu verstehen (vgl. Kapitel 6 bis Kapitel 8).

Der vorliegende Report fasst unsere Überlegungen und den Prozess der Einrichtung eines effizienten, speziell zugeschnittenen Qualitätsmanagements zum Abschluss der ersten Förderphase zusammen und gibt einen kurzen Ausblick auf die daraus resultierenden anvisierten Maßnahmen zur Bewertung und Sicherung der Datenqualität im Rahmen der zweiten Phase. Er wendet sich vor allem an folgende Zielgruppen oder Stakeholder, die mit Forschungsdaten umgehen:

  • Für Nutzende (v. a. digital Forschende) erhöht sich die Transparenz der Angebote. Sie können besser und schneller beurteilen, ob Daten gebrauchstauglich und für den intendierten Zweck brauchbar sind. Die Reproduzierbarkeit von Forschungsergebnissen wird durch eine standardgebundene hohe Datenqualität verbessert. Die Nutzenden sind häufig auch Datenproduzierende, weshalb auch für sie die Vorgaben für Datenanbieter relevant sind.
  • Datenanbieter (v. a. aus GLAM-Einrichtungen) erhalten konkrete Unterstützung bei der Aufgabe, die Nachhaltigkeit, Anschluss- und Zukunftsfähigkeit der Repositorien und Datenplattformen zu sichern und sich dabei an den Interessen der Nutzenden in den zunehmend interdisziplinär und international vernetzten Forschungsdatenräumen zu orientieren. Sie können außerdem die Qualitätsanforderungen an die Datenproduzierenden vermitteln, so dass sie bereits in den ersten Stadien des Datenlebenszyklus berücksichtigt werden können. Kann eine Institution ein qualitativ hochwertiges Angebot und passende Datenmanagement-Kompetenzen vorweisen, erhöht das die Förderfähigkeit bei der Einwerbung von zusätzlichen Mitteln.
  • Förderinstitutionen können beurteilen, wie die Datensammlungen einzuordnen sind. Die übergreifende Darstellung des Qualitätsniveaus in ganzen Communities kann Anlass für die Entwicklung bestimmter Förderlinien sein. Außerdem können sie die Ergebnisse geförderter Projekte leichter gegen die ursprünglichen Projektziele oder Datenmanagementpläne abgleichen.

Der Report vermittelt transparent die erfolgten Arbeitsschritte, indem er ...

  • den Handlungsrahmen und die Leitlinien sowie die Relevanz und die Dimensionen von Datenqualität im Forschungskontext beschreibt (vgl. Kapitel 2 bis Kapitel 4),
  • die spezifischen Datenangebote in NFDI4Culture charakterisiert (vgl. Kapitel 6),
  • Referenzmodelle zur Messung von Datenqualität erläutert (vgl. Kapitel 7),
  • die technischen Voraussetzungen für qualitativ hochwertige Daten im Culture Information Portal und im Culture Knowledge Graph vorstellt (vgl. Kapitel 8.1),
  • eine erste erfolgte FAIR-Makro-Analyse der Datenangebote und deren Ergebnisse schildert (vgl. Kapitel 8.2 und 8.2.1),
  • einen Workflow zur Aufnahme von Datenangeboten entwickelt (vgl. Kapitel 8.2.2) und
  • einen kurzen Ausblick auf die daraus resultierenden anvisierten Maßnahmen zur Bewertung und Sicherung der Datenqualität im Rahmen der zweiten Förderphase gibt (vgl. Kapitel 8.3 bis Kapitel 9).