FAIRe Forschungsdaten

Forschungsdaten sollen laut der GO FAIR-Initiative „FAIR“ sein. FAIR steht für „Findable, Accessible, Interoperable und Reusable“ und zielt darauf ab, die Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit von Forschungsdaten und digitalen Publikationen sicherzustellen. Die Herausforderung liegt in der konsequenten Umsetzung der „Maschinentauglichkeit“ der Daten, denn es gilt, diese auch ohne oder mit nur minimalem menschlichem Eingriff zu finden, darauf zuzugreifen, sie zu interpretieren, zu integrieren und in computergestützten Analysen wiederzuverwenden.

Ziel der Anwendung der FAIR-Prinzipien ist es, Forschungsdaten und digitale Publikationen effizienter und nachhaltiger nutzbar zu machen. Dies fördert die Zusammenarbeit zwischen verschiedenen Forschungsgruppen, ermöglicht die Verifizierung wissenschaftlicher Ergebnisse und erleichtert den Wissensaustausch innerhalb der Forschungsgemeinschaft und darüber hinaus.

FAIRe Forschungsdaten sollten mit eindeutigen, persistenten Identifikatoren (→siehe Abschnitt Persistente Identifikatoren) versehen und in einer durchsuchbaren Ressource auffindbar sein. Bei einem Dark Archive mit eingeschränktem Benutzerzugang (→siehe Abschnitt Digitale Langzeitarchive und Repositorien) würde es ausreichen zu wissen, dass sich Forschungsdaten in einem Verzeichnis im Archiv befinden. Dann können Nutzende zumindest Kontakt aufnehmen. Dies gilt auch für sensible Daten, die vielleicht nicht unmittelbar zugänglich sind. Metadaten, die Informationen über die Daten enthalten, sollten in standardisierter Form bereitgestellt werden, um ihre Auffindbarkeit zu verbessern. Durch die Anwendung offener Standards und Protokolle werden die Interoperabilität und Integration von Daten aus verschiedenen Quellen gefördert. Schließlich sollten Forschungsdaten und digitale Publikationen mit möglichst offenen Lizenzen versehen werden.

Für die Archive ist eine regelmäßige Überprüfung und Aktualisierung der Dateiformate notwendig, um sicherzustellen, dass die Daten auch in Zukunft zugänglich bleiben. Dafür müssen geeignete technische Infrastrukturen und Systeme bereitgestellt werden. Metadaten spielen auch hier eine entscheidende Rolle, da sie Informationen über den Kontext und die Interpretation der Daten liefern und somit ihre Wiederverwendbarkeit unterstützen. Darüber hinaus sollten geeignete Sicherheits- und Datenschutzmaßnahmen getroffen werden, um die Integrität und – bei Bedarf – Vertraulichkeit der archivierten Daten zu gewährleisten.

Als Hilfestellung für die Einschätzung der FAIRness eigener Daten bzw. der unterstützenden Leistungen eines Repositoriums bei ihrer Verfügbarmachung wurde das FAIR Maturity Model entwickelt.

Es gibt erste Tools zur Bewertung der FAIRness von Forschungsdaten. Darunter Selbstevaluierungswerkzeuge, mit dem Benutzer ihre Forschungsdaten eher grundlegend anhand eines kurzen Fragenkataloges bewerten können. Ein bekanntes Beispiel ist das ARDC FAIR Data Self Assessment Tool, bei dem Benutzer eine Punktzahl anhand ihrer gemachten Multiple-Choice-Angaben erhalten. Ein neueres Beispiel ist der NFDI4Culture FAIR Check, bei dem Nutzer zusätzlich auch differenzierte Angaben über Kommentarfelder geben und anschließend optional in einem individuellen Gespräch mit NFDI4Culture-Mitarbeitern Fragen klären können. Eine andere Art sind automatisierte Evaluierungswerkzeuge wie z. B. F-UJI, bei dem Nutzer nach Eingabe einer URL eine Bewertung in Form einer Punktzahl erhalten. Diese sind jedoch oft auf spezifische Plattformen abgestimmt, wobei es für Forschungsdaten aus kulturspezifischen Domänen daher meist noch schwierig ist, aussagekräftige Bewertungsergebnisse zu erhalten.

Weiterführende Informationen

Übersicht über die FAIR-Prinzipien:

Zu FAIR im Kontext von NFDI4Culture:

Zu Forschungsdaten und Lizenzen:

Überblick von FAIR-Tools: