8.3.3 Anbieterfragebogen und Datenanalyse über den Culture Knowledge Graph

Eine differenzierte Bewertung unserer vielfältigen Datenangebote gemäß einem Stufen- oder Reifegradmodell erfordert mehr Informationen.

Für eine Reihe von Prüfmerkmalen ist es zusätzlich wichtig, nicht nur ihr Vorhandensein, sondern auch ihren jeweiligen prozentualen Abdeckungsgrad im Vergleich zum Gesamtbestand des Angebots einschätzen zu können. Dies gilt z. B. für die URI-Referenzierung auf Normdaten und kontrollierte Vokabulare, die nach bestimmten Entitäten differenziert prozentual angegeben werden sollte. Ein weiteres Beispiel sind Rechteangaben, die sich auf kulturelle Objekte selbst, ihre digitalen Repräsentationen oder die zugehörigen Metadaten beziehen können und daher für diese Bereiche differenziert ausgewertet werden sollten.

Einen Großteil der dafür notwendigen Analysen kann man über den Culture Knowledge Graph durchführen. Für Bestände, die dort bereits integriert sind, wird es dafür technisch automatisierte Prüfroutinen geben. Auf absehbare Zeit werden jedoch nicht alle Datenangebote in gleichem Umfang in den Graph integriert werden können. Um die Gesamtheit unserer Angebote aussagekräftig und ausgewogen beurteilen und allen Anbietern gleichermaßen Unterstützung bei einem aktiven Qualitätsmanagement bieten zu können, darf daher die Culture Knowledge Graph-Integration nicht die Voraussetzung für die Datenqualitätsbewertung sein.

Bei den Datenanbietern liegen die benötigten Informationen meist vor, oder sie können mit lokalen Datenanalysen ermittelt werden. Daher wollen wir über einen Online-Fragebogen die für die Prüfmerkmale relevanten Aussagen durch Selbstauskunft der Datenanbieter erheben. Etwas Ähnliches wurde bereits mit dem Formular umgesetzt, das zur Anmeldung von Software für die NFDI4Culture-Registry dient.

Der Fragebogen ist so angelegt, dass er Indikatoren aus beiden von uns favorisierten Stufenmodellen (FAIR Data Maturity Model, Europeana Publishing Framework) berücksichtigt und so mit einer großen Bandbreite von Kriterien und Prüfmerkmalen Anknüpfungspunkte für alle Arten von Repositorien und Datenplattformen bietet. Auf diese Weise erlaubt er differenzierte Aussagen, auch zu Aspekten, die über eine Abfrage des Culture Knowledge Graphs allein aufwendig zu ermitteln wären (z. B. inhaltliche Charakterisierung der Datensatztypen, zusätzliche Angebote bestimmter Daten- und Metadatenformate). Als Formular bleibt der Fragebogen für die Datenanbieter online zugänglich, so dass sie die Angaben selbst aktuell halten und Fortschritte im Qualitätsmanagement zeitnah berichten können. Die Auswertung des Formulars kann über die Erweiterung der Tools erfolgen, die bereits jetzt für die Ermittlung der DFG-Kennzahlen aus OpenProject eingesetzt werden.