Übergreifende technische Aktivitäten

Im Aufgabenbereich Übergreifende technische Aktivitäten konnten wir 2022 zahlreiche neue technische Dienste entwickeln und veröffentlichen. Neben unserem kontinuierlichen Engagement im Bereich Linked Open Data (LOD) gehört hierzu vor allem der Release der ersten Version des Culture Knowledge Graphs, die Implementierung einer Schreib- und Publikations-Pipeline für Handreichungen und Berichte in offenen und versionskontrollierten Ausgangsformaten sowie die Weiterentwicklung von Wikibase als Werkzeug zur kollaborativen Erfassung und Publikation kultureller Forschungsdaten als Linked Open Data.

Community-Building und Vernetzung

Eine der wichtigsten Aktivitäten in unserem Aufgabenbereich besteht darin, Wissen in unseren Communities aufzubauen und dabei Anreize zur Verwendung von Knowledge Graphs und Linked Data-Technologien zu entwickeln und zu koordinieren. Während im vergangenen Jahr insbesondere Fragen zur Datenmodellierung, zum Ontologie-Mapping und zur Harmonisierung von Daten im Mittelpunkt unserer Community-Building-Bemühungen standen, lag der diesjährige Schwerpunkt auf der Durchführung von Workshops mit internationalen Gästen, um einen möglichst breiten und länderübergreifenden Austausch zu Methoden und Verfahren im Bereich LOD zu initiieren. Darüber hinaus beteiligten wir uns aktiv an den NFDI-weiten Aktivitäten der Sektion (Meta)daten, Terminologien, Provenienz in mehreren Arbeitsgruppen und übernahmen dabei auch die Koordination der Themen Knowledge Graphs, Ontology Mapping, Harmonization sowie Terminology Services.

LOD Working Group

Zu unseren wichtigsten internationalen Gästen in der von der TIB Hannover koordinierten LOD Working Group zählten Vertreter:innen der Projekte OpenRefine, Linked Art und Triply. Zudem organisierten wir im Rahmen der Working Group auch eine Untergruppe, die sich einem funktionsbezogenen Vergleich aktueller LOD-Software-Tools widmete. Unsere Ergebnisse haben wir in Form einer detaillierten Vergleichstabelle veröffentlicht, die gemeinsam zwischen Anbietern und Nutzer:innen der jeweiligen Tools verfasst wurde. Unseren Befund planen wir auch im Rahmen eines Papers für die DHd2023 Konferenz in Trier zu präsentieren.

Föderierte technische Infrastruktur

Die föderierte Infrastruktur des Konsortiums wurde durch die Anbindung weiterer Dienste, wie beispielsweise ein Event-Management-System und eine Publikations-Pipeline für Handreichungen, an das föderierte Identity und Access Management (IAM) erweitert. Das Team unseres Aufgabenbereiches arbeitetet eng mit dem Technical Coordination Office (TCO) zusammen, das die Anbindung von Diensten konsortiumsweit koordiniert, dokumentiert und das Rechtemanagement für die Infrastruktur weiterentwickelt. Insgesamt wurden 2022 über 300 User Accounts in der föderierten Infrastruktur verwaltet, die Zugriff auf sieben angeschlossene Dienste haben. Eine ausführliche Darstellung der Aktivitäten findet sich im Berichtsteil zur Culture Collaboration Cloud. Darüber hinaus haben wir an der Schreibgruppe zu Basisdiensten (Base4NFDI) mitgewirkt und uns dabei insbesondere auf die Entwicklung eines künftigen, NFDI-weiten Identity- und Access Managements konzentriert.

Culture Information Portal

Kollaboration, Vernetzung und Integration prägten auch die Weiterentwicklung des Culture Information Portals im Jahr 2022. Unter Federführung des Teams der Akademie der Wissenschaften und der Literatur | Mainz konnten wir das Portal in enger Zusammenarbeit allen Aufgabenbereichen und Querschnittsteams des Konsortiums als zentralen Einstiegspunkt für die 4Culture Communities in alle Forschungsinformationen, Ressourcen und Dienste des Konsortiums weiter etablieren. Neben seiner Funktion als Plattform für die Kommunikation von Veranstaltungen und Neuigkeiten wurde in Austausch mit Team Guidelines die Culture Knowledge Base als zentraler Ort für alle Handreichungen, Spezifikationen und Linkempfehlungen zum Forschungsdatenmanagement im Bereich materieller und immaterieller Kulturgüter geschaffen. In Zusammenarbeit mit Team Knowledge Graph wurde die NFDI4Culture Ontology in das Portal implementiert und die erste Version des Culture Knowledge Graphs über einen in das Portal integrierten SPARQL-Endpoint bereitgestellt. Eine detaillierte Beschreibung der Entwicklung des Culture Information Portals im Jahr 2022 findet sich im Abschnitt Portal.

Markdown-basierte Schreib- und Publikationsumgebung

Die Erstellung und Veröffentlichung von Guidelines, Spezifikationen, Berichten und Open Educational Resources (OER) in offenen und nachhaltigen Formaten entlang der FAIR-Kriterien gehört zu den wichtigsten Zielen von NFDI4Culture. Nachdem wir im vergangenen Jahr die technische Grundlagen für eine markdown-basierte, kollaborative Schreib- und Publikationsumgebung gelegt hatten, konnte unser Portal-Entwicklungsteam an der Akademie der Wissenschaften und Literatur in Mainz in Zusammenarbeit mit Team Guidelines die erste Produktivumgebung der Pipline unter Verwendung leistungsstarker und zukunftssicherer Open Source Komponenten implementieren.

Die Inhalte von NFDI4Culture Handreichungen und Spezifikationen werden dabei im offenen Reintext-Format Markdown verfasst. In Markdown verfasste Ressourcen können von vielen Softwaresystemen gelesen und neben der Publikation im Web auch in zahlreiche weitere Zielformate konvertiert werden. Alle Markdown-Dateien werden dabei transparent unter Versionskontrolle gestellt, was ein zentrales Kriterium für die wissenschaftliche Nachvollziehbarkeit der erarbeiteten Handreichungen und Spezifikationen darstellt.

Zum Einsatz kommt das Versionkontrollsystem Git und die Open Source Plattform GitLab, über die automatisierte Workflows zur Publikation der Handreichungen realisiert werden. Für die webasierte, kollaborative Bearbeitung der Texte kommt das leistungsstarke Flat File CMS Grav und ein speziell für NFDI4Culture entwickeltes Template zum Einsatz, das um zusätzliche Funktionalitäten ergänzt wurde (z. B. Erweiterungen der Markdown Syntax zur Erstellung textbasierter Diagramme, digitaler Notensatz u. v. m.).

In Einklang mit den FAIR-Prinzipien und dem übergreifenden Ziel einer nachhaltigen Publikation aller Ressourcen des Konsortiums besteht jede Handreichung aus drei Bestandteilen, die über die Publikations-Pipeline veröffentlicht werden:

  1. Einer Datenpublikation aller Ausgangsdateien (Markdown) und zugehörigen Materialien (Bilder, etc.) der jeweiligen Handreichung auf ZENODO. Alle Datenpublikation sind über eine versionsabhängige DOI dauerhaft referenzierbar.
  2. Einer Metadatenpublikation für jede Handreichung in der Culture Knowledge Base sowie im Culture Knowledge Graph (erfolgt automatisch bei Eintrag in der Knowledge Base), nachgewiesen über eine Culture IRI (diese verweist immer auf die aktuelle Metadatenpublikation einer Handreichung).
  3. Einer Onlinepublikation auf der Culture Publication Plattform, dauerhaft erreichbar über einen Culture Permalink/Shortlink (dieser verweist immer auf die aktuelle Onlinepublikation einer Handreichung).

Architektur der Culture Publication Pipeline, CC BY 4.0, Autor:in: Torsten Schrade

Mit der Culture Publikation Pipeline können somit alle Handreichungen und Berichte des Konsortiums konsequent in einschlägigen, quelloffenen Formaten erzeugt, mit allen Quell- und Ausgangsdaten zur Weiternutzung gebündelt und in unterschiedlichen Zielformaten nachhaltig publiziert werden. Mit dem Leitfaden zur nachhaltigen Entwicklung von Forschungssoftware sowie der Einführung in kulturwissenschaftliche Forschungsdaten wurden 2022 die ersten beiden Handreichungen auf Basis der Pipeline erstellt und publiziert.

Culture Knowledge Graph

Anfang des Jahres führten wir im Rahmen der LOD Working Group eine Erhebung zu Linked Data in der NFDI4Culture Community durch. Es wurden Datensätze, Dienste und Portale über die bereits bestehenden Beitragsbeschreibungen hinaus untersucht. Dabei wurden Anwendungsfälle gesammelt und der Datenstatus sowie Zugangsbeschränkungen beschrieben. Weiterhin wurde abgefragt, ob die Datensätze bereits als Linked Data zur Verfügung stehen und welche Lizenzen und Standards hierbei angewendet werden. Die Umfrage diente auch dazu, existierende Herausforderungen zu sammeln und zu ermitteln, in welcher Weise die Beteiligten von NFDI4Culture Unterstützung bei der Umwandlung ihrer Daten in LOD benötigen. In mehreren Strategie- und Entwicklungstreffen mit dem Team Portal legten wir in diesem Jahr die konzeptionelle und technische Grundlage für die Implementierung der ersten Version der Culture Ontology und des Culture Knowledge Grpahs in das Portal und erarbeiteten vor dem Hintergrund der Ergebnisse unserer Umfrage eine Spezifikation und einen schlanken und einfach umzusetzenden Workflow für die Integration von Datenressourcen, die noch nicht als LOD vorliegen. Eine detaillierte Beschreibung unserer Ergebnisse findet sich im Abschnitt zum Culture Knowledge Graph.

Wikibase4Research und zugehörige Dienste

Ein weiteres Aktivitätsfeld in unserem Aufgabenbereich stellt die Weiterentwicklung der Software Wikibase dar, die wir als nachhaltige Lösung für die kollaborative Erfassung und Publikation kulturellen Forschungsdaten als Linked (Open) Data allen Mitgliedern der NFDI4Culture-Community zur Verfügung stellen. Die Maßnahmen in diesem Feld werden vom Team der TIB Hannover koordiniert, die sich neben den Tätigkeiten in NFDI4Culture auch in der internationalen Wikibase Stakeholder Group für die nachhaltige Entwicklung der Software einsetzt. In diesem Jahr trieben wir die Entwicklung von Wikibase in drei Richtungen voran:

1. Wikibase als Dienst („Wikibase-as-a-service“)

Wir haben automatisierte Pipelines (sogenannte Continuous Integration / Continuous Delivery) auf der Basis virtueller Laufzeitumgebungen (Docker) für die Bereitstellung und Wartung von Wikibase-Instanzen entwickelt, die wir infrastrukturbereitstellenden Institutionen der 4Culture-Community für ein einfaches Wikibase-Hosting anbieten.

Eine Illustration der Deployment-Pipeline für Wikibase-Instanzen mit Ansible, CC BY 4.0, Autor:in: Lozana Rossenova

2.Wikibase RDF-Erweiterung

Dank einer Teilfinanzierung durch die NFDI4Culture FlexFunds des Aufgabenbereichs Forschungswerkzeuge und Datendienste konnten wir in Zusammenarbeit mit der Wikibase Stakeholder Group eine neue RDF Erweiterung für Wikibase entwickeln. Die Erweiterung ermöglicht das Mapping von Klassen und Eigenschaften aus Wikibase auf externe Standard-Ontologien und Vokabulare. Über die grafische Oberfläche von Wikibase können Benutzer:innen die Mappings setzen und bearbeiten, die dann auch in den Triplestore von Wikibase übertragen werden. Ziel dieser Erweiterung ist es, dass Benutzer:innen den Triplestore direkt mit Begriffen aus Standard-Ontologien abfragen können, ohne dass sie spezifische Wikibase-Klassen und -Eigenschaften kennen müssen.

3. Dienst für Terminologien und Annotationen

Das Open Science Lab der TIB arbeitete an einem neuen Annotations- und Terminologiedienst für die Culture Community. Dieser Dienst soll sowohl als eigenständiges Werkzeug als auch als integrierter Dienst in Wikibase und anderen Werkzeugen zur Verwaltung von Forschungsdaten genutzt werden können. Zunächst wurde eine Anforderungsspezifikation und eine technische Architektur ausgearbeitet. Hierzu fand ein Workshop zur Anforderungsanalyse mit Vertreter:innen verschiedener Aufgabenbereiche und der Community statt. Zum Jahresende wurde ein Prototyp des Dienstes veröffentlicht, der bereits eine Terminologiesuche sowie eine Entity-Erkennung in Wikidata, DBPedia und Iconclass bietet. Im kommenden Jahr werden weitere Ontologien und Terminologien integriert und eine erste Betaversion für die Community zur Verfügung gestellt.

Dissemination und Outreach

Voträge
Publikationen
  • Anders, Ivonne / Bailly, Kolja / Baum, Roman / Engel, Felix / Ernst, Felix / Ghiringhelli, Luca M. / Kailus, Angela / Karam, Naouel / Kett, Jürgen / Kraus, Florian / Löbe, Matthias / Moeller, Katrin / Patil, Akhil / Rossenova, Lozana / Voß, Jakob / Weiland, Claus / Özaslan, Mehtap: Terminology Services - Working Group Charter (NFDI section-metadata), Version 1.0, 2022, https://doi.org/10.5281/zenodo.6759325.
  • Anders, Ivonne / Arera-Rütenik, Tobias / Arndt, Susanne / Baum, Roman / Betancort, Noemi / Blümel, Ina / Busse, Christian / Daniel, Andreas / Engel, Felix / Ghiringelli, Luca / Hachinger, Stephan / Israel, Holger / Karam, Naouel / Kranz, Angela / Lenz, Richard / Linke, David / Petrenko, Taras / Rossenova, Lozana / Schulz, Daniela / Weiland, Claus / Widmann, Heinrich / Wiljes, Cord / Özaslan, Mehtap / Kockmann, Norbert. Ontology Harmonization and Mapping - Working Group Charter (NFDI section-metadata), Version 1.0, 2022, https://doi.org/10.5281/zenodo.6726519.
  • Duchesne, Paul: Wikidata and Wikibase as complementary research services for cultural heritage data, in: TIB Blog, 17.3.2022, https://blogs.tib.eu/wp/tib/2022/03/17/wikidata-and-wikibase-as-complementary-research-services-for-cultural-heritage-data/
  • Sohmen, Lucia / Rossenova, Lozana: Open refine to wikibase: a new data upload pipeline, in: Proceedings of the 22nd ACM/IEEE Joint Conference on Digital Libraries (JCDL '22). Association for Computing Machinery, New York, NY, 2022, Article 53, https://doi.org/10.1145/3529372.3530919.
  • Rossenova, Lozana: 2022. Examining Wikidata and Wikibase in the context of research data management applications, in: TIB Blog, 16.3.2022, https://blogs.tib.eu/wp/tib/2022/03/16/examining-wikidata-and-wikibase-in-the-context-of-research-data-management-applications/.
  • Rossenova, Lozana / Sohmen, Lucia / Bailly, Kolja: First User Research Workshop on Terminology Services in NFDI4Culture, 2022, https://doi.org/10.5281/zenodo.7100818.
  • Rossenova, Lozana / Duchesne, Paul / Blümel, Ina: Wikidata and Wikibase as complementary research data management services for cultural heritage data, in: Proceedings of the 3rd Wikidata Workshop 2022, co-located with the 21st International Semantic Web Conference (ISWC2022), Virtual Event, Hangzhou, China, Oktober 2022, https://ceur-ws.org/Vol-3262/paper15.pdf.
Querschnittsaktivitäten

Im Jahresverlauf haben wir eine Reihe von Querschnittsaktivitäten durchgeführt, um die Zusammenarbeit und Vernetzung in NFDI4Culture und mit anderen NFDI-Konsortien zu stärken. Lozana Rossenova engagierte sich als Teilnehmerin der NFDI-Sektion (Meta)daten, Terminologien, Provenienz und als Koordinatorin der Working Group Knowledge Graphs. Außerdem ist sie die NFDI4Culture Community Managerin für WikiBase. Kolja Bailly hat in Bezug auf den Terminologie Service die Zusammenarbeit mit dem Projekt iArt geplant und eingeleitet. Ina Blümel und Paul Duchesne haben im Projekt „Documenting Ukrainian Cultural Heritage“ eng mit dem Deutschen Dokumentationszentrum für Kunstgeschichte Bildarchiv Foto Marburg zusammengearbeitet. Ziel des Projekts ist die inhaltliche und fotografische Dokumentation kulturell bedeutsamer Bauwerke in der Ukraine sowie die Erstellung eines Wissensgraphs über diese Bauwerke in ihrem baukulturellen, örtlichen und zeitlichen Kontext. Der Wissensgraph wird in einer an der TIB gehosteten Wikibase-Instanz vorgehalten und kann dort exploriert werden.

Harald Sack, Sasha Bruhns, Tabea Tietz und Etienne Posthumus haben sich intensiv mit den NFDI-Konsortien MarDI, NFDI-MatWerk und NFDI4DataScience ausgetauscht, um gemeinsam an der Entwicklung einer übergreifenden NFDI Core-Ontologie voranzutreiben.

Julia Tolksdorf und Linnaea Söhn haben kontinuierlich im Querschnittsteam Portal mitgearbeitet, während Frodo Podschwadek als Mitglied der Redaktionsgruppe Guidelines zuständig für die technische Infrastruktur der Publikations-Pipeline war. Torsten Schrade hat als Mitglied der Konzeptions- und Redaktionsgruppe an der Erstellung und Einreichung des Base4NFDI-Antrags mitgewirkt.

Ausblick

Im kommenden Jahr werden wir uns im Bereich der föderierten technischen Infrastruktur auf den Culture Identity Provider konzentrieren, um unsere IAM-Infrastruktur frühzeitig auf das im Aufbau befindliche, NFDI-weite Identity und Access Management vorzubereiten. Darüber hinaus werden wir unsere Git/Grav-basierte Publikations-Pipeline für Open Educational Resources weiterentwickeln und optimieren. Ein Schwerpunkt im Bereich des Culture Knowledge Graphs wird die Veröffentlichung der Spezifikation des Culture Graph Interchange Formats darstellen auf deren Basis wird es möglich sein, nicht als Linked Open Data verfügbare Datenressourcen in einfacher Weise in den Culture Knowledge Graph zu integrieren. Eine weitere wichtige Maßnahme im Bereich Linked Data wird die Weiterentwicklung von Wikibase und die Integration von Wikibase-Ressourcen in den NFDI4Culture Knowledge Graph sein. Um sicherzustellen, dass unsere Aktivitäten den Bedürfnissen der Community entsprechen, werden wir die Arbeit der LOD Working Group fortsetzen und die Vergleichsmatrix für Linked Data Tools in der Anwendungsdomäne von NFDI4Culture veröffentlichen.