8.3.2 Erweiterung der Prüfmerkmale (Defined Terms)
Ein erster, bereits begonnener Schritt zum Ausbau und der Verfeinerung der Analyse der Datenqualität ist die Erweiterung der Prüfmerkmale (Listen mit Defined Terms aus Kapitel 8.2) für das jeweilige FAIR-Kriterium (vgl. Tabs). Diese Erweiterung der Defined Terms zur Qualitätsbeschreibung der Angebote ermöglicht zunächst einmal den Nachweis des Vorhandenseins bestimmter Prüfmerkmale in einem Angebot und macht die Beschreibung der Angebote für Nutzende aussagekräftiger. In einem nächsten Schritt sollen die Prüfkriterien parametrisiert werden, um über eine Priorisierung und Gewichtung messbare und differenzierte Aussagen über die FAIRness des Angebots treffen zu können.
Neben dem Vorhandensein eines persistenten Identifiers dient auch der Nachweis des Angebots in einer übergeordneten Registry oder – besonders bei Daten aus Kulturerbe-Einrichtungen – die Weitergabe von Daten an übergeordnete Aggregatoren der Verbesserung der Auffindbarkeit. Die Auswahl einer oder mehrerer Elemente sagt aus, dass die Daten, Teile davon oder die Datenquelle selbst in einer entsprechenden Registry erfasst sind. Damit mögliche Dubletten erkannt werden, sollten entsprechende Datenangebote, Nachweissysteme oder aggregierende Portale parallel herangezogen werden.
Verbreitete Nachweissysteme für Forschungsdatenangebote in unseren Domänen sind:
DRIS (Directory of Research Information Systems)
GEPRIS (Geförderte Projekte der Deutschen Forschungsgemeinschaft)
GERiT (German Research Institutions)
OpenAIRE (Open Access Infrastructure for Research in Europe)
re3data (Registry of Research Data Repositories)
ROAR (Registry of Open Access Repositories)
SSHOC (Social Sciences & Humanities Open Cloud)
Aggregierende Portale in unseren Domänen sind:
DDB (Deutsche Digitale Bibliothek)
Europeana
Im Bereich der Zugänglichkeit haben wir die Prüfmerkmale durch eine weitere Schnittstellenspezifikation ergänzt:
OpenAPI
Für das FAIR-Kriterium der Interoperabilität haben wir die Prüfkriterien für mehrere Kategorien ergänzt. Die Kategorie der Datenformate kommt neu dazu, um der Diversität der Daten in unseren Domänen Rechnung zu tragen. Für Nutzende hat die Information, welche Datenformate ein Datenangebot enthält, einen erheblichen Mehrwert. Die Datenformate werden gemäß Medientypen differenziert:
Auch im Bereich der Normdaten haben wir weitere Anpassungen vorgenommen:
Die Vokabulare der Bibliothèque nationale de France werden differenziert in:
BNF Rameau
BNF Relators
BNF Authorities
iDAI.gazetteer
iDAI.thesaurus
iDAI.chrontology
ISIL (International Standard Identifier for Libraries and related Organizations)
ISNI (International Standard Name Identifier)
Die Vokabulare der Library of Congress werden differenziert in:
LCSH (Library of Congress Subject Headings)
LC MARC Relators,
LCNAF (Library of Congress Name Authority File)
ORCID (Open Researcher and Contributor ID)
Pleiades
Ringgold ID
ROR (Research Organization Registry)
TGN (Getty Thesaurus of Geographic Names)
ULAN (Getty Union List of Artist Names)
Die Verwendung etablierter und standardisierter Terminologien und Vokabulare spielt ebenfalls eine wichtige Rolle, um Daten interoperabel zu machen:
Catalogue of Life
DDC (Dewey-Dezimalklassifikation)
GBIF (Global Biodiversity Information Facility)
Iconclass
LIDO-Terminologie
MIMO Thesaurus of musical instrument names
Unesco Thesaurus
Gefördert wird die Interoperabilität auch durch die Verwendung von Sprachencodes nach dem ISO-Standard und dem ISO-Standard für Datierungen und Zeitangaben:
ISO 639-2
ISO 639-3
ISO 8601
Mit Blick auf die Wiederverwendbarkeit haben wir weitere Community Standards im Bereich der Metadatenformate ergänzt:
ABCD (Access to Biological Collection Data)
CARARE (Connecting Archaeology and Architecture in Europeana) Metadata Schema
CGIF (Culture Graph Interchange Format)
Dublin Core wird differenziert in:
DCMI Metadata Terms
DCMES
IIIF (International Image Interoperability Framework) Manifest
JSON (JavaScript Object Notation)
JSON-LD (JavaScript Object Notation-Linked Data)
MusicXML
Eine wesentliche Rolle für die Wiederverwendbarkeit von Daten spielen auch die Lizenzen und Rechteauszeichnungen. Da für manche Versionen der CC-Lizenzen länderspezifische Anpassungen vorliegen, sollten die Versionen genau benannt werden können:
Common Development and Distribution License version 1.0
Creative Commons: CC BY 3.0, CC BY 4.0, CC BY-NC 3.0, CC BY-NC 4.0, CC BY-NC-ND .0, CC BY-NC-ND 4.0, CC BY-NC-SA 3.0, CC BY-NC-SA 4.0, CC BY-ND 3.0, CC BY-ND 4.0, CC BY-SA 3.0, CC BY-SA 4.0, CC0 1.0, Public Domain Marc
Eclipse Public License 2.0
GNU Licenses: AGPLv3, GNU General Public License version 2.0, GNU GPLv3, GNU Lesser General Public License version 2.1, GNU Lesser General Public License version 3.0, GNU Libary General Public License version 2.0
MIT
MPL-2.0
Open Data Commons: ODbL 1.0, ODC-BY 1.0, PDDL 1.0
Right Statements: CNE, InC, InC-EDU, InC-NC, InC-OW-EU, InC-RUU, NKC, NoC-NC, NoC-OKLR, UND