2.2 Bewertung von Datenqualität

Die Bewertung der Datenqualität erfordert Standards, anhand derer die Daten geprüft werden können. Solche in den Fachgemeinschaften geteilten Standards, die die Bereitstellung und Nutzung von Daten gemäß den FAIR-Prinzipien erst ermöglichen, müssen identifiziert oder ggf. etabliert, erweitert und verstärkt werden. Die Task Force der EOSC empfiehlt zunächst die Entwicklung von Kriterien für eine Matrix (https://doi.org/10.5281/zenodo.7515816, S. 56), die den Reifegrad einer Community im Umgang mit Datenqualität misst. Daraus können passende Ansätze für die Verankerung von Datenqualitätsmanagement und -bewertung in der Community entwickelt werden, die an den Bedürfnissen der Nutzenden auszurichten sind.

Um die Qualität von Forschungsdaten beschreiben, messen und einordnen zu können, sind für die einzelnen Kriterien spezifische Indikatoren erforderlich, die sich auf inhaltliche, formale und technische Merkmale beziehen können und die im Voraus festgelegt werden müssen. Das ‚Messen‘ ist nützlich, um einen Gradmesser für die Tauglichkeit von Daten in Bezug auf beide Arten von Anforderungen – fit for use und fit for purpose – zu haben. Als ‚gut genug‘ wird empfunden, was einem bestimmten Qualitätslevel entspricht und damit in der Breite funktionsgerecht anwendbar ist. Ein Service für das Messen von Datenqualität zeigt demnach, wie weit die Merkmale von Daten von einer festgelegten Skala abweichen. Die Qualität von Daten wird somit quantifizierbar gemacht.

Eine gleichbleibend hohe Datenqualität gewährleistet, dass Ergebnisse reproduzierbar sind – ein zentrales Prinzip in der Wissenschaft. Außerdem sorgt sie für eine verbesserte interdisziplinäre Nutzung und Weitergabe von Daten, macht sie also zukunftsfähig. Wie wichtig das Thema mittlerweile für alle Sparten ist, zeigen die Ausführungen des Rates für Informationsinfrastrukturen (RfII) und der Deutschen Forschungsgemeinschaft (DFG), die auch digitale Bestände von Museen und Sammlungen ausdrücklich als Forschungsdaten auffassen, die demnach in die Prozesse der Qualitätssicherung einzubeziehen seien.

Empfehlungen EOSC, RfII und DFG & weitere Literatur
  • Lacagnina, Carlo / David, Romain / Nikiforova, Anastasija et al.: TOWARDS A DATA QUALITY FRAMEWORK FOR EOSC (1.0.0) 2023, Zenodo https://doi.org/10.5281/zenodo.7515816
  • Rat für Informationsinfrastrukturen: Bestandsbezogene Forschung gestalten: zukunftsfähige Verschränkungen von „digital“ und „analog“. Ein Diskussionsimpuls zur wissenschaftlichen, wissenschaftsnahen und kulturellen Nutzbarkeit von Sammlungen, Göttingen 2021, https://rfii.de/?p=7339.
  • Rat für Informationsinfrastrukturen: Sammlungen als multimodale Infrastrukturen. Analog und digital für die verknüpfte Nutzung erschließen, Göttingen 2024, https://rfii.de/?p=11282.
  • Deutsche Forschungsgemeinschaft: Leitlinien zum Umgang mit Forschungsdaten, 2015, https://www.dfg.de/resource/blob/172112/leitlinien-forschungsdaten.pdf.

Relevant für unsere Communities: