9. Ausblick und zukünftige Entwicklung

Der vorliegende Report stellt den von NFDI4Culture konzipierten Ansatz zur Datenqualitätsbewertung und den bisher erreichten Umsetzungsstand in der ersten Projektphase dar. Mit Blick auf das zu verstetigende Serviceangebot von NFDI4Culture wird es darum gehen, die FAIR-Prüfkriterien weiter zu verfeinern, zu priorisieren und zu gewichten. Um alle Arten von Datensammlungen ausgewogen zu berücksichtigen, wird zunächst ein Fragebogen entwickelt und technisch in das Portal integriert. Gleichzeitig soll auch der Culture Knowledge Graph als Werkzeug für die regelmäßige Qualitätsanalyse der bereits integrierten Angebote nutzbar gemacht werden.

Ein weiteres zukünftiges Handlungsfeld ist die möglichst standardisierte Bereitstellung von Informationen zur Datenprovenienz in unseren Domänen. Sie entspricht dem FAIR-Prinzip R 1.2. Die EOSC Task Force identifiziert einen vorrangigen Bedarf bei Forschenden nach Informationen zur Entstehung und Versionierung von Datensets, um die Eignung vorhandener Daten im eigenen Anwendungskontext beurteilen zu können. Während Repositorien hier an die etablierte Forschungsdatendokumentation mit dem Datacite-Metadatenschema anknüpfen können, gibt es für die Datenprovenienz-Dokumentation im Bereich der Datenportale und der in ihnen vorgehaltenen Daten aus Kulturgut-Sammlungen noch keine etablierte Praxis. Die Auseinandersetzung mit diesem Thema beginnt dort erst, und gewinnt im Kontext des Common European Data Space for Cultural Heritage an Bedeutung. NFDI4Culture will diese Entwicklungen unterstützen und bei der praktischen Umsetzung mitwirken.

Handlungsbedarf ergibt sich auch aus der Forderung der EOSC Task Force nach einer Metadokumentation zur inhaltlichen Korrektheit (Accuracy) oder der wissenschaftlichen Qualität der Daten, für die es in unseren Domänen ebenfalls keine etablierte Praxis gibt.

Unbestritten ist, dass die Qualität eines Datenangebots möglichst hoch sein sollte. Die Herausforderung liegt in dem daraus abzuleitenden Qualitätsmanagement und der Steuerung der jeweiligen Maßnahmen, Prioritäten und Verantwortlichkeiten im Rahmen der verfügbaren Ressourcen. Das Datenqualitätsmanagement ist in die Data Governance der beteiligten Institutionen und Datenpartner einzubetten. Mit ihr kann die Verwaltung und Nutzung ihrer Daten gesteuert werden. Sie legt auch Regeln dafür fest, wie Daten für einen bestimmten Zweck gesammelt, gespeichert, analysiert und verbreitet werden. Data Governance hilft dabei, die Transparenz von Daten und ihre Verfügbarkeit zu erhöhen, Datensysteme, Richtlinien und Verfahren zu standardisieren, Datenprobleme zu lösen und die Einhaltung gesetzlicher und organisatorischer Vorgaben zu gewährleisten.

Für Datenanbieter möchten wir eine Messung von Datenqualität als Instrument bereitstellen, das im Sinne eines Monitorings den Status und die Fortschritte bei der Verbesserung der Angebote transparent vermittelt. Ein nach Reifegraden skalierbares Bewertungstool soll sie bei der stufenweisen Verbesserung ihrer Daten unterstützen. Je nach verfügbaren Ressourcen möchten wir einen Service etablieren, der geeignete Methoden, Workflows und Werkzeuge vermittelt.

Neben einem transparenten Reporting und Monitoring wird NFDI4Culture auch eine Beratung für die Kuratierung von Datenbeständen anbieten, die auf jeweils geeignete Verfahren, Maßnahmen und Entscheidungswege (Roadmap) für die Verbesserung der Datenqualität hinweist. Wir planen die Bereitstellung generisch angelegter Kuratierungstools zur Unterstützung dieses Prozesses. Sie sollen, ggf. nach einfachen Anpassungen, für unterschiedliche Datenbestände und für lokale Anwendungen nutzbar sein und Checks sowie Aufgaben wie Datenbereinigung, -vorverarbeitung und -anreicherung erleichtern.

Die direkte Kuratierung von Daten kann aus Skalierungsgründen kein Service von NFDI4Culture sein, sondern die Datenanbieter und -produzenten müssen selbst aktiv werden. Im Umsetzungsprozess liegt der Fokus damit bei den beteiligten Partnern, die ihre Datenqualität an der Quelle verbessern und zur Integration ihrer Daten in den Culture Knowledge Graph befähigt werden. Ihre aktive Rolle in diesem Prozess unterstützt die weitere Verankerung des notwendigen Datenmanagement-Wissens in den Communities selbst. Dies unterstützt auch ihre Eigenverantwortlichkeit, denn die Entscheidung über die Priorisierung von Maßnahmen und die Verwendung von verfügbaren Ressourcen verbleibt bei den Anbietern.

Verwendete Quellen