Datenpublikation und Langzeitarchivierung

Im Bereich des kulturellen Erbes stehen sowohl Repositorienbetreibende als auch Forschende aller Disziplinen vor wachsenden Herausforderungen bei der Speicherung, Veröffentlichung und Langzeitarchivierung von Forschungsergebnissen. Die zunehmende Komplexität des Datenmanagements erfordert eine Verbesserung bestehender Standards und die Optimierung von Diensten in den Disziplinen Kunstgeschichte und Architektur, Musikwissenschaft, Darstellende Kunst und Film- und Medienwissenschaften. In enger Zusammenarbeit mit der Community schließen wir im Aufgabenbereich Datenpublikation und Langzeitarchivierung Lücken in der bestehenden Forschungsdateninfrastruktur und etablieren nachhaltige und zuverlässige Dienste.

Community-Building: Datenpublikation und Archivierung

Die Forumsveranstaltungen unseres Aufgabenbereiches richteten sich jeweils an verschiedene Zielgruppen und dienten dazu, zu unterschiedlichen Schwerpunktthemen Fachwissen auszutauschen und Erfahrungen zu teilen. In offenen Diskussionsrunden wurden Anforderungen und Bedarfe aus der Community zu bestehenden Infrastrukturen und Dienstleistungsangeboten identifiziert. Teilnehmende aus der Community haben über den NFDI4Culture Rocket.Chat sowie durch Mitgestaltung der offenen Treffen des Aufgabenbereichs die Möglichkeit, aktiv mitzuwirken. Die aus den Beiträgen und Diskussionen gewonnenen Erkenntnisse werden nun in die Arbeitspakete einfließen. Aus der Community heraus sind erste konkrete Arbeitsgruppen gebildet worden, in denen in den nächsten Monaten an Lösungen gearbeitet werden soll.

Forum Datenpublikation und -archivierung #1: Kick-off für Repositorienbetreibende

Das erste Forum am 12. März 2021 richtete sich an einen geschlossenen Kreis bereits aktiver Betreiber:innen etablierter Repositorien, die ihre die Publikations- und Archivierungsdienste für Forschungsdaten im Bereich der materiellen und immateriellen Kulturgüter institutionsunabhängig anbieten. Ziel war es, in zunächst kleiner Runde ein erstes Kennenlernen der verschiedenen Dienstanbieter:innen und deren Services zu ermöglichen und eine gemeinsame Diskussionsgrundlage zu Erwartungen und Herausforderungen im NFDI-Umfeld zu schaffen. Als zentrale Herausforderungen für die Repositorienbetreibenden kristallisierten sich verschiedene Themen heraus. Für die Repositorienbetreibenden standen dabei folgende Themen im Fokus: Betriebsmodelle bzw. nachhaltige Geschäftsmodelle, technische Umsetzung von Spezialfunktionen für z. B. die Suche, der Umgang mit sehr heterogenen Daten und Objekten, die wachsenden Ansprüche der Fachcommunities und deren Informationskompetenz, Datenkuratierung und Qualitätssicherung, Langzeitarchivierung, Lizenzfragen, Zertifizierungen und die Nachnutzung bzw. Verknüpfung mit externen Ressourcen.

Forum Datenpublikation und -archivierung #2: Thema Langzeitarchivierung

Nach dem gelungenen Kennenlernen im ersten Forum zeichnete sich im Gespräch mit den teilnehmenden Repositorienbetreibenden im zweiten Forum am 15. Juni 2021 ab, dass besonders die nachhaltige Aufbewahrung von Forschungsdaten sowie der dauerhafte Erhalt von digitalem Kulturgut ein zentrales Anliegen sind und einer ausführlichen Diskussion bedürfen. Mit der zweiten Forumsveranstaltung wurden deshalb Einblicke in die Grundlagen der Langzeitarchivierung gegeben und anschließend nach individuellen Erwartungen und disziplinspezifischen Herausforderungen bzw. Bedarfen der Teilnehmenden gefragt. Hierbei wurde deutlich, dass die dauerhafte Archivierung im Bereich materieller und immaterieller Kulturgüter von herausgehobener Relevanz ist und ein konkreter Bedarf an umfangreichen Beratungsangeboten besteht. Insbesondere Fragen zu Urheberrecht allgemein bzw. zu Rechtebeschreibungen von Archivpaketen rückten in den Vordergrund.

Forum Datenpublikation und Datenarchivierung #3: Use Cases – Wie archivieren und publizieren Sie Ihre Forschungsdaten?

Das dritte Forum am 15. September 2021 richtete sich offen an die ganze NFDI4Culture-Community. Es sollten die Bedarfe der Fachcommunities präzisiert werden, um in den nächsten vier Jahren für genau diese Themen Lösungen (weiter) zu entwickeln. Anhand konkreter Anwendungsfälle, die im Vorfeld über einen öffentlichen Aufruf eingeworben wurden, konnten Überlegungen und Vorgehen bei der Publikation und Archivierung von Forschungsdaten präsentiert und diskutiert werden. Unter anderem wurden auch Bedarfe bei der Publikation und Archivierung von Arbeiten mit verschiedenen Datentypen (Enhanced Publication) und bei der Vernetzung von publizierten Forschungsdaten mit Datensammlungen geschildert. Zudem wurde die Notwendigkeit erläutert, Forschungsdaten einzelner Communities über Standards zusammenzuführen, um ihre Auffindbarkeit zu garantieren und übergreifende Suchen zu ermöglichen. Die Synergien aus der Diskussion der Themen gaben erste Impulse für Gespräche und Ideen, welche in weiteren Treffen konkretisiert werden sollen.

Beratung

Die NFDI4Culture Teams unseres Aufgabenbereichs in Dresden und Heidelberg beraten individuell bei Anfragen der Fachcommunity zu Publikations- und Archivierungsprozessen sowie in Kooperation mit den themenspezifischen Beratungsstellen des NFDI4Culture Helpdesks, unter anderem mit dem Legal Helpdesk bei Fragen zu Bildrechten. Die Beratung richtet sich sowohl an Forschende, inklusive Projekte im Kontext von Drittmittelanträgen, als auch Repositorienbetreibende und umfasst Unterstützung bei Anfragen rund um Publikation bzw. Langzeitarchivierung verschiedener Datenformate sowie die Nutzung von Dienstleistungen der Fachinformationsdienste arthistoricum.net und musiconn.

Speicherung, Veröffentlichung und Langzeitarchivierung von Forschungsdaten

Ein wichtiger Schritt im ersten Projektjahr war für uns die Identifikation von Bedarfen innerhalb der Fachcommunities von NFDI4Culture, welche mithilfe der Repositorienkartierung und den Gespächen während den ersten drei Foren ermittelt wurden. Basierend auf diesen Ergebnissen haben wir die die Arbeit an folgenden Themen begonnen:

Kartierung von Repositorien

Wir haben eine „Kartierung“ von Repositorien erstellt, um einen Überblick über die bereits vorhandenen Angebote im Bereich Datenpublikation und Datenarchivierung zu gewinnen, die für die von NFDI4Culture vertretenen Communities relevant sind. Die recherchierten Informationen zu Disziplin, Zweck, Datenmanagement, Rechten und Lizenzen etc. zum jeweiligen Dienst werden kontinuierlich vervollständigt, vor allem durch entsprechende Abfragen bei den anbietenden Institutionen. Die erhobenen Daten werden in die von Aufgabenbereich Forschungswerkzeuge und Datendienste entwickelte Registry einfließen. Ausgehend von der Kartierung werden weitere communityspezifische Bedarfe an Tools, Normdatenvokabularen und Metadatenschemata ermittelt und diese verfeinert. Damit sollen Best Practices als auch Angebotslücken (vor allem hinsichtlich Interoperabilität, Anpassungsfähigkeit und Rechtemanagement) identifiziert und in der Folge Empfehlungen für nachnutzbare Referenzimplementierungen ausgesprochen werden können.

Für die von Aufgabenbereich Forschungswerkzeuge und Datendienste geplante Registry wurden die erhobenen Informationen zu Repositorien weitergegeben.

Handreichungen

Ausgehend von den in den Foren geäußerten Bedarfe haben wir mit der Erarbeitung von Handreichungen zum Thema Langzeitarchivierung begonnen. Um die verschiedenen Aspekte möglichst gut an die verschiedenen Nutzergruppen der Handreichungen zu vermitteln, haben wir unterschiedliche Vermittlungsformate getestet.

Konzept-Entwicklung zu Enhanced Publications

Auf Basis einer Paper-Recherche haben wir eine Definition zu Enhanced Publications für NFDI4Culture-Disziplinen gefunden und zugehörige Anwendungsfälle betrachtet. Nach Abstimmung mit anderen NFDI4Culture-Aufgabenbereichen zu Handreichungen und Standards zu Enhanced Publications und FAIR kann ein zugehöriges Konzept für Langzeitarchivierung mit Referenzimplementierung entwickelt werden.
Unsere Aktivitäten im Bereich Semantic Publishing haben sich auf zwei Ziele konzentriert: Erstens die Entwicklung einer Open-Source-Pipeline (als Prototyp) für kollaboratives Schreiben und Single-Source-Multiformat-Publishing. Zweitens soll untersucht werden, welche internationalen Webstandards für Buchpublikationen und Multiformat-Publishing verwendet werden können. Beide Ziele werden durch die Erstellung von Prototypen in Form von experimentellen Veröffentlichungen erforscht.

WissKI (Optimierung hinsichtlich FAIR-Prinzipien in Kooperation mit dem Germanischen Nationalmuseum in Nürnberg)

Für die als Open Source zur Verfügung stehende virtuelle Forschungsumgebung WissKI (Wissenschaftliche KommuniktionsInfrastruktur) wird zum einen ein Renewal der Website erstellt. Neben einer kompletten Erneuerung der Dokumentation wird die Benutzbarkeit für die Fachcommunity durch Installationshilfen für verschiedene Systeme (Linux, Windows, MacOS) und Szenarien (lokale Entwicklungsumgebung, produktive Serverumgebung) gesteigert. Bestehende Anlaufstellen (Drupal-Codeseite, Drupal-Projektseite, Netzwerkseite bei arthistoricum.net, Informationssystem „WissKI-Community“ inkl. FAQ, Slack-Channel) werden besser vernetzt, redundante Inhalte und Funktionen zusammengeführt bzw. überführt. Zum anderen werden in Absprache mit WissKI-Anwender:innen identifizierte Desiderate z. B. hinsichtlich Zitierfähigkeit (DOI) und Versionierung bearbeitet.

Repositorien-Statistik

Zur Überprüfung der Leistungen in Hinblick auf die Ziele unseres Aufgabenbereichs (1. Aus- und Aufbau von Infrastrukturen für sichtbare, nachhaltige und zitierfähige Datenpublikationen; 2. niederschwelliger Zugriff auf dauerhaft verfügbare Forschungsdaten; 3. Konzeption und Weiterentwicklung von Publikationsinfrastrukturen und Systemen für Langzeitverfügbarkeit mit den Fachcommunities) haben wir erste Kennzahlen von Repositorien mit Diensten und Angeboten für Dritte und Relevanz für die Kulturwissenschaften ermittelt. Diese dienen als Ausgangswerte, um den Erfolg der Aktivitäten über den Förderzeitraum von NFDI4Culture zu messen.

RADAR4Culture

Mit „RADAR4Culture“ soll eine niedrigschwellige, einfach handzuhabende, generische Archivierungs- und Publikationsoption für die Culture-Community erarbeitet werden. Das Dienstleistungsangebot basiert auf dem etablierten Cloud-Service RADAR von FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur. Es zielt auf Forschende und Forschungsprojekte, die aktuell durch keines der existierenden, vorrangig disziplinspezifischen Repository-Lösungen im Kulturbereich bedient werden. Aktuell erarbeiten wir Konzepte und Workflows und klären finanzielle sowie rechtliche Fragen.

Zertifizierung

Wir wollen im Rahmen unserer Arbeit Repositorienbetreibende dabei unterstützen, FAIRe, nachhaltige und vertrauenswürdige Dienste für ihre Communities anzubieten und dies anhand geeigneter Zertifizierungen zu dokumentieren. Hier haben wir das Core Trust Seal (CTS) als für diese Zwecke am besten geeignetes Instrument identifiziert und die Zertifizierungskriterien im Hinblick auf Anforderungen an geisteswissenschaftliche Fachrepositorien gesichtet. Im weiteren Verlauf sollen ausgewählte Referenzdienste den CTS-Zertifizierungsprozess durchlaufen und auf dieser Grundlage Empfehlungen und Best Practices für weitere Anbieter aus dem NFDI4Culture-Bereich bereitgestellt werden.

Dissemination und Outreach

Die Mitglieder unseres Aufgabenbereichs waren auf verschiedenen externen Veranstaltungen präsent, um NFDI4Culture vorzustellen und die Rolle des Konsortiums speziell für die Thematik der Open Access-Publikationen aufzuzeigen.

Vorträge

Ausblick

Für das Jahr 2022 planen wir das Forum Datenpublikation und -archivierung mit neuen thematischen Schwerpunkten fortzusetzen, um auf die spezifischen Bedarfe der Community und der Repositorienbetreibenden einzugehen. Weiterhin ist geplant, basierend auf der vorangegangen Kartierung, eine Liste von geeigneten Repositorien für die Community auf dem NFDI4Culture Portal zu veröffentlichen. Die Übersicht soll mittels Schlagworte und kurzen Beschreibungstexten einen Überblick über fachspezifische und generische Repositorien geben und die Recherche für Forscher:innen erleichtern.