Unser Team im Aufgabenbereich Datenpublikation und Langzeitarchivierung beschäftigt sich mit den Herausforderungen, die bei der Speicherung, Veröffentlichung und Langzeitarchivierung von Forschungsdaten auftreten. Vor dem Hintergrund der zunehmenden Komplexität des Datenmanagements arbeiten wir zusammen mit der Community und Repositorienbetreibenden daran, bestehende Standards und Dienste zu verbessern und Lücken in der derzeitigen Forschungsdateninfrastruktur zu schließen.
Der regelmäßige Austausch mit der Community zu verschiedenen Schwerpunktthemen im Bereich der Publikation und Archivierung von Forschungsdaten ist ein wichtiger Bestandteil für die Arbeit unseres Aufgabenbereichs. Die vergangenen Forumsveranstaltungen richteten sich an eine möglichst breite Community, um individuelles Fachwissen auszutauschen und Probleme sowie Herausforderungen zu diskutieren. Die aus den Beiträgen gewonnen Erkenntnisse wurden von uns ausgewertet und ins Arbeitsprogramm, beispielsweise in Form von geplanten Handreichungen, aufgenommen.
Beim Umgang mit komplexen Datentypen, wie beispielsweise 3D-Daten, ist es wichtig, bereits bei der Datenerhebung bzw. -erzeugung den jeweiligen Zweck der Publikation und Archivierung der Daten mitzudenken. Deshalb haben wir das Forum gemeinsam mit dem Aufgabenbereich Digitalisierung und Anreicherung veranstaltet. Folgende Themen wurden vorgestellt und diskutiert: Digitalisierung, Modellierung und Annotation von 3D-Daten, Grundlagen der Langzeitarchivierung, Möglichkeiten zur Darstellung von 3D-Modellen sowie deren Speicherung und der aktuelle Stand der Archivierungsmöglichkeiten aus der Perspektive ausgewählter Repositorien. Ein ausführlicher Bericht, weiterführende Informationen zu 3D-Digitalisierung und -archivierung stehen auf dem Portal zur Verfügung.
Das Forum widmete sich der Frage, welche Identifikatoren für die Repositorien, Datendienste und Bildarchive geeignet sind und wie eine gute Praxis für die Transparenz nach außen entstehen kann. Die etablierten Anbieter und Initiativen stellten in Impulsvorträgen ihre Lösungen vor: DOI (Digital Object Identifier), ePIC Handle, URN (Uniform Resource Name) und der sich im Aufbau befindende da|ra Service. In der Diskussion wurde deutlich, dass es je nach Bedarf bereits gut funktionierende digitale Lösungen zur dauerhaften Identifizierung, Sicherung und Auffindung von Forschungsdaten, -objekten und -ergebnissen gibt. Allerdings besteht weiterer Handlungsbedarf, um die Standardisierung sowie Verbreitung von PIDs voranzutreiben und forschungsrelevante Daten gemäß der FAIR-Kriterien verfügbar zu halten. Der Bericht sowie die Präsentationen der Vortragenden sind auf dem Portal zu finden.
Das Treffen, das wir gemeinsam mit dem Germanischen Nationalmuseum in Nürnberg organisiert haben, diente dem Austausch von Forscher:innen und Entwickler:innen, die Projekte mit der Open-Source-Software „Wissenschaftliche KommunkationsInfrastruktur (WissKI)“ umsetzen bzw. diese weiterentwickeln. Mit der virtuellen Forschungsumgebung „WissKI“ können semantisch ausgezeichnete Daten des Kulturerbes nachhaltig publiziert werden. Neben Forschungsprojekten (wie duerer.online, PropylaeumVITAE und das African Multiple Cluster) wurden neu entwickelte Erweiterungen und Verbesserungen des WissKI-Moduls (wie z.B. DOI-Einbindung, Docker-Installationen) den Anwender:innen vorgestellt.
Auch im Jahr 2022 führten unsere NFDI4Culture Teams in Dresden und Heidelberg zahlreiche individuelle Beratungen zu Anfragen aus der Fachcommunity zu Publikations- und Archivierungsprozessen durch. Diese ergaben sich häufig aus den Themen der durchgeführten Foren, wie zum Beispiel nach dem Umgang mit 3D-Daten und deren Langzeitarchivierung oder zum Einsatz von PIDs. Zudem umfasste die Beratung auch die Unterstützung bei Anfragen rund um die Nutzung von Dienstleistungen der Fachinformationsdienste arthistoricum.net und musiconn.
Ein wesentlicher Bestandteil des Arbeitsprogramms besteht darin, Materialien zum Thema Datenpublikation und Langzeitarchivierung für Forschende, Institutionen und Dienstbetreibende bereitzustellen, beispielweise in Form von Handreichungen, die über die NFDI4Culture Knowledge Base auffindbar sein werden, oder als kuratierte Übersichten als Ressourcen auf unserem Portal.
Durch die 2021 erfolgte „Kartierung“ der Repositorien konnten Dienste identifiziert werden, die Forschungsergebnisse und Forschungsdaten aus der Culture-Community nachhaltig publizieren und / oder archivieren. Ein Überblick empfehlenswerter, fachspezifischer und generischer Publikations- und Archivierungsdienste für Kulturdaten in verschiedenen Medienformaten wurde auf dem Portal als unterstützende Informationsressource veröffentlicht.
Im Fokus für die Erstellung der Handreichung zum Thema Grundlagen der Langzeitarchivierung stand die inhaltliche Abstimmung mit der Community und Expert:innen – insbesondere der Kooperationspartner (SLUB Dresden, TIB Hannover, FIZ Karlsruhe und UB Heidelberg) – zu Konzepten und Begriffen der Grundlagen der digitalen Langzeitarchivierung. In einem nächsten Schritt soll diese Handreichung in der NFDI4Culture Knowledge Base veröffentlicht werden.
2022 wurden drei Umfragen durchgeführt, die sich gezielt an Wissenschaftler:innen / Forschende richteten. Die Ergebnisse bieten einen Einblick in den derzeitigen Stand und das Bewusstsein hinsichtlich der Veröffentlichung und Archivierung von forschungsrelevanten Daten. Auf dieser Basis können die Handlungsfelder unseres Aufgabenbereiches konkretisiert und somit besser auf die Bedürfnisse der Community ausgerichtet werden. Die Umfragen umfassten folgende Themen:
Innerhalb von NFDI4Culture unterstützen wir sowohl Repositorienbetreibende als auch Forschende aller in NFDI4Culture vertretenen Disziplinen und Fachcommunities bei der Speicherung, Veröffentlichung und Langzeitarchivierung von Forschungsergebnissen. Viele Angebote zur Publikation von Forschungsdaten sind bisher stark institutions- und disziplinabhängig. Kernaufgabe unseres Aufgabenbereichs ist es, bestehende Standards und Dienste zu optimieren sowie Lücken in der bestehenden Forschungsdateninfrastruktur zu identifizieren und zu schließen.
Mit RADAR4Culture wird seit März 2022 eine niedrigschwellige, einfach zu handhabende und nachhaltige Option zur Publikation und Sicherung kulturwissenschaftlicher Forschungsdaten angeboten. Der Dienst basiert auf dem etablierten Forschungsdatenrepository RADAR von FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur, das auch die Kosten für RADAR4Culture (Beratung, Administration, DOI-Registrierung, Datenspeicher etc.) übernimmt. RADAR4Culture ergänzt das bereits existierende Portfolio an Fachrepositorys im Bereich der Kulturgüter und kann von Forschenden kostenfrei und unabhängig von der institutionellen Zugehörigkeit genutzt werden. Es ermöglicht die Veröffentlichung beliebiger Datentypen und -formate gemäß den FAIR-Kriterien und erlaubt damit vielfältige Einsatzszenarien. Im Jahr 2022 fanden 10 Beratungen zu RADAR4Culture statt und es wurden 29 Datenpakete publiziert. Der Dienst diente auch der Bereitstellung gut dokumentierter Datenpakete für die Teilnehmenden des 3D Hackathons 2022 „Creating New Dimensions“. Seit Dezember 2022 können bei RADAR4Culture (und RADAR) im Schlagwortfeld Normdatensätze aus der Gemeinsamen Normdatei (GND) hinterlegt werden. Diese verbesserte Metadatenannotationsoption wurde insbesondere von den Bedürfnissen geisteswissenschaftlicher Communities getrieben.
Im Bereich Semantic Publishing konnte die Open-Source-Publishing-Pipeline (ADA Publishing Pipeline), die ein kollaboratives Schreiben und Single-Source-Multiformat-Publishing ermöglicht, weiterentwickelt werden. Es wurde ein Proof of Concept erstellt, um die Pipeline mit Jupyter Notebooks zu verbinden sowie LOD-Beispieldaten und -medien (wie z.B. Wikidata, ORCID, Wikibase, 3D-Modelle und TIB AV-Portal Video) anzuzeigen. In den nächsten Schritten soll die Pipeline an das NFDI4Culture Single-Sign-On angeschlossen werden, um es für die Community zu öffnen. Außerdem sollen anhand von konkreten Publikationen weitere Tools getestet werden, um 3D-Daten und Python-Quellcode mit Jupyter Notebooks/Books in der Publikation rendern zu können.
Im Rahmen der Arbeit unseres Aufgabenbereichs sollen Repositorienbetreibende dabei unterstützt werden, FAIRe, nachhaltige und vertrauenswürdige Dienste für ihre Communities anzubieten und dies anhand geeigneter Zertifizierungen zu dokumentieren. Hier wurde das Core Trust Seal (CTS) als für diese Zwecke am besten geeignete Instrument identifiziert und die Zertifizierungskriterien im Hinblick auf Anforderungen an kulturwissenschaftliche Fachrepositorien gesichtet. Das SLUBArchiv.digital wurde 2022 als erster Referenzdienst innerhalb NDFI4Culture mit dem CoreTrustSeal zertifiziert (siehe dazu Pressemitteilung der SLUB).
Das Treffen auf der AG3D am 7. Dezember 2022 diente zum einen der Diskussion zu Use Cases musealer Objekte in NFDI4Culture als Ausgangspunkt für eine weitere Handreichung „Erhaltung musealer Gegenstände mittels digitaler Modelle“. Von der Community wurde eine Handreichung zum Thema als sinnvoll und notwendig erachtet und erste Use Cases genannt. Eine unserem Team erstellte Übersicht gängiger 3D-Formate (3D-Formatdatenbank) wurde vorgestellt, um gesammeltes Wissen zu teilen und Feedback zur Bewertung der Langzeitarchivfähigkeit zu erhalten. Die Teilnehmenden schlugen vor, 3D-Formate stärker nach deren Zweck (CAD, volumenbasierte 3D-Modelle) bei der Langzeitarchivierung zu unterscheiden und zu bewerten.
Die Arbeitsgruppe „Digitale Publikationen und Daten“ unseres Aufgabenbereichs untersuchte in der oben erwähnten Umfrage das breite Spektrum an digitalen Publikationen, das von konventionellen wissenschaftlichen Arbeiten und Monographien bis hin zu multimodalen Projekten oder angereicherten Datenbanken reicht. Die Ergebnisse der Umfrage wurden publiziert:
Arnold, Matthias / Büttner, Alexandra / Heseler, Jörg / Worthington, Simon: Digitale Publikationen im Kulturbereich: Beispiele und Eigenschaften – Umfrageergebnisse aus der NFDI4Culture Community, Version 1.0, 2022, https://tibhannover.github.io/digitale-publikationen-im-kulturbereich-umfrageergebnisse
Für das Jahr 2023 plant unser Team das Forum Datenpublikation und -archivierung mit neuen thematischen Schwerpunkten fortzusetzen, um auf die spezifischen Bedarfe der Community und der Repositorienbetreiber:innen einzugehen. In den vergangenen Foren wurde deutlich, dass die Forscher:innen in den verschiedenen Fachdisziplinen häufig Probleme bei der Publikation ihrer Forschungsdaten haben. Im Zuge dessen ist unter anderem Handreichung geplant, die die Nutzung und Auswahl von geeigneten Repositorien übersichtlich erläutern soll.