Übergreifende technische Aktivitäten

Im Aufgabenbereich übergreifende technische Aktivitäten arbeiten wir an einer nachhaltigen, konsortiumsweiten Föderation der technischen Infrastrukturen aller Partnerinstitutionen sowie an übergreifenden Diensten zur Gewährleistung der Auffindbarkeit, Zugänglichkeit, Interoperabilität und Nachnutzbarkeit aller Datensammlungen, Softwarewerkzeuge, Handreichungen und Forschungsprodukte von NFDI4Culture. Hierzu gehört die Entwicklung und der Betrieb eines konsortiumsweiten Identity und Access Managements und einer Open Source Kollaborations- und Kommunikationsumgebung ebenso wie die Konzeption, Entwicklung und Kuratierung des Culture Information Portals und des Culture Knowledge Graphs. In Zusammenarbeit mit internationalen Kulturerbe-Institutionen setzen wir einen besonderen Schwerpunkt bei der nachhaltigen Weiterentwicklung von Wikibase als quelloffener Lösung zur Erstellung und Kuratierung von Linked Open Data im Kulturbereich.

Community-Building: Kulturelle Forschungsdaten und Linked Data

Knowledge Graphs und Linked Data spielen eine wichtige Rolle, um kulturelle Forschungsdaten FAIR zu machen – insbesondere wenn es um Auffindbarkeit, Interoperabilität und Wiederverwendbarkeit geht. Auch wenn das Potenzial von Linked Data im Kulturbereich bereits anerkannt ist, gibt es nach wie vor viele zu diskutierende Punkte, von generellen Fragen nach dem Lernaufwand für Forschende, die mit Linked-Data-Softwareumgebungen noch nicht vertraut sind, bis hin zu spezifischen Fragen hinsichtlich der Abbildung von existierenden Metadatenstandards. Das Community-Building in unserem Aufgabenbereich ist von entscheidender Bedeutung, um unserer Community zu helfen, diese Fragen gemeinsam anzugehen. Aus diesem Grund haben wir 2021 eine Linked Open Data Arbeitsgruppe mit monatlichen Treffen und einer offenen Agenda eingerichtet, um die wichtigsten Fragen aus der Community zu diskutieren. Darüber hinaus haben wir praxisorientierte Veranstaltungen organisiert, um die Funktionen verschiedener Open-Source-Anwendungen gemeinsam zu erkunden. Ein Schwerpunkt liegt hierbei auf der Software Wikibase, die aufgrund ihrer benutzerfreundlichen Oberfläche und ihrer internationalen Verbreitung (dank der Verbindungen zur Wikimedia Foundation) eine vielversprechende Anwendung für Linked Data im Bereich materieller und immaterieller Kulturgüter darstellt.

Linked Open Data Working Group

Das erste Treffen der Linked Open Data (LOD) Working Group fand am 17. Juni 2021 statt. Seitdem trifft sich die Gruppe in regelmäßigen Abständen, um Erfahrungen über Linked Data auszutauschen und die Arbeit damit im Konsortium zu koordinieren. Außerdem berichtet unser Team hier regelmäßig über seine Arbeit. Die Arbeitstreffen finden zur Zeit nur mit Teilnehmenden aus dem Konsortium statt. In Zukunft soll dies auf externe Expert:innen und Interessierte ausgeweitet werden. Die Gruppe wird von der Technischen Informationsbibliothek Hannover koordiniert.

Wikibase für Forschungsdaten materieller und immaterieller Kulturgüter

Im Rahmen des Aufgabenbereiches koordiniert die Technische Informationsbibliothek Hannover (TIB) die Nutzung und Entwicklung der Software Wikibase als nachhaltige Lösung, die allen Mitgliedern der NFDI4Culture-Community zur Verfügung steht, wenn sie ihre kulturellen Forschungsdaten als Linked (Open) Data im Web veröffentlichen wollen. Wikibase und Wikidata sind zwei verwandte Softwarepakete aus der Wikimedia-Familie von Anwendungen. Sie ermöglichen die Speicherung und Verwaltung von strukturierten, maschinenlesbaren Daten und weisen darüber hinaus weitere gemeinsame Merkmale von Wikis auf, wie zum Beispiel Funktionen zur Zusammenarbeit und Versionskontrolle. Wikidata ist die öffentlich zugängliche Version der Software – eine Art Wikipedia für strukturierte Daten; sie wird von Wikimedia Deutschland gepflegt. Wikibase ist die Open-Source-Softwareumgebung, die für den Betrieb von Wikidata entwickelt wurde. Entscheidend ist, dass Wikibase unabhängig von Wikidata (und Wikimedia) eingesetzt werden kann und an die Bedürfnisse einzelner Wissensbereiche und Repositories angepasst werden kann.

Im Jahr 2021 hat das TIB-Team gemeinsam mit dem Team von FIZ Karlsruhe zwei Workshops für die Wikibase-Community organisiert.

NFDI4Culture Wikibase Workshops

Im Februar und Juli fanden Workshops statt, in denen wir Forschende und Datenmanager:innen der NFDI zu einem Austausch über Wikibase (eine Software zum Management und kollaborativen Bearbeiten von Linked Data, die auch hinter der Plattform Wikidata steht) und Knowledge Graphs im Allgemeinen einluden. Im ersten Workshop stellte Wikimedia Deutschland die Software Wikibase und ihre zukünftige Entwicklung vor. Da viele Anwesende noch unentschlossen im Hinblick auf ihre zu verwendende Software waren, konnten hier viele offene Fragen beantwortet werden. Es wurde aber auch deutlich, dass es aus dem NFDI-Bereich viele Anforderungen gibt, die Wikibase bisher nicht erfüllen kann. Aus diesem Grund haben wir im zweiten Workshop den Schwerpunkt darauf gelegt, die Anforderungen an Wikibase zu sammeln und strukturieren. Dafür wurden drei Gruppen gebildet, die über verschiedene Aspekte diskutierten: Die Installation, der Datenupload und das Datenmodell. Die hier gesammelten Anforderungen wurden von uns analysiert und an Wikimedia Deutschland weitergegeben. Ein White Paper, in dem dies beschrieben wird, ist zur Veröffentlichung geplant.

In beiden Workshops wurden außerdem bereits laufende Projekte mit Wikibase vorgestellt. Die Veranstaltungen wurden von der Technischen Informationsbibliothek und dem FIZ Karlsruhe geplant und moderiert. Ausführliche Berichte finden sich im Culture Information Portal:

Darüber hinaus kuratierte die an der TIB ansässige Wikibase-Community-Managerin für NFDI4Culture, Lozana Rossenova, einen Tag mit Wikibase-Präsentationen und -Veranstaltungen als Teil der WikidataCon 2021. Dabei handelt es sich um eine alle zwei Jahre stattfindende Konferenz, die sich mit der Nutzung von Linked Data in der globalen Wikimedia-Gemeinschaft befasst. Zudem ist die TIB eine führende Institution in der Wikibase Stakeholder Group. Dieser Gruppe gehören Mitglieder aus mehr als einem Dutzend großer internationaler Kulturerbe-Institutionen an. Die monatlichen Treffen der Gruppe werden von Lozana Rossenova koordiniert und umfassen Präsentationen von Anwendungsfällen aus der Community sowie die Planung und Erstellung neuer Erweiterungen für die Wikibase-Softwareumgebung. Das Ziel der Gruppe sowie der laufenden Arbeiten an der TIB ist es, Wikibase zu einer langfristigen, nachhaltigen Lösung zu machen, die einfach zu implementieren und zu nutzen ist und die den spezifischen Anforderungen der Veröffentlichung von FAIR-Forschungsdaten für die Kulturerbe- und Open-Science-Gemeinschaft gerecht wird.

Eine Visualisierung des Wikimedia Linked Open Data web, CC BY-SA 4.0, Autor:in: Dan Shick (WMDE)

Der Aufgabenbereich Digitalisierung und Anreicherung digitaler Kulturgüter arbeitet an einem Prototyp zur Annotation von 3D-Daten. Da dort ebenfalls mit Linked Data und Wikibase gearbeitet wird, besteht ein enger Austausch der beiden Aufgabenbereiche, z. B. hinsichtlich der Datentransformation und -modellierung. Die Zusammenarbeit wird ausführlicher im Berichtsteil des Aufgabenbereichs Digitalisierung und Anreicherung digitaler Kulturgüter beschrieben.

Konzeption des Culture Knowledge Graph

Der Culture Knowledge Graph hat zum Ziel, eine Verbindung zwischen allen Forschungsdaten herzustellen, die in den NFDI4Culture Fachgebieten erzeugt werden, um so die Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit von Kulturerbe-Daten innerhalb der 4Culture-Domäne zu verbessern. Er wird ein zentrales Bindeglied für alle Forschungsdatensammlungen, Software-Tools, Infrastrukturen und Dienste innerhalb des Konsortiums darstellen und die Ressourcen des Konsortiums entlang einschlägiger W3C-Standards als Linked Open Data unter Verwendung einer domänenspezifischen Ontologie beschreiben.

Um eine optimale und an den Bedarfen der in NFDI4Culture vereinten fünf Fachgemeinschaften Struktur aufzubauen, führte das Team von FIZ Karlsruhe im Jahr 2021 zunächst eine umfangreiche und detaillierte Bestandsaufnahme aller relevanten Ontologien im Bereich von Kulturerbe und (Forschungs-)infrastruktur durch. Grundlage waren die gemeinsam mit den Communities erarbeiteten User Stories sowie die während der Antragsphase erhobenen über 400 Beiträge der Co-Applicants und Participants zum Konsortium. Zur Verschränkung der Arbeiten an Normdaten und Vokabularen, die im Aufgabenbereich Datenstandards, Datenqualität und Kuratierung sowie der im Aufgabenbereich Forschungswerkzeuge und Datendienste in Entwicklung befindlichen Registry wurden mehrere gemeinsame Arbeits- und Vernetzungstreffen durchgeführt.

Bedarfsanalyse für den Knowledge Graph

Auf Basis der Erhebung von User Stories und Beiträgen erarbeitete das Team eine detaillierte Bedarfsanalyse für die Entwicklung des Knowledge Graphs entlang folgender Kernfragen:

  • Wer sind die Benutzer:innen (Entwickler:innen, Forschende, Bibliothekar:innen, Projekt- oder Institutionsleitungen) und was ist ihr fachlicher Hintergrund (Musikwissenschaft, Kunstgeschichte, Architektur, Darstellende Künste, Film- und Medienwissenschaft)
  • Was sind die genauen Ziele der Benutzer:innen?
  • Welche Daten benötigen die Benutzer:innen und/oder mit welchen Daten arbeiten/forschen sie?
  • Welche Standards sind erforderlich?
  • Welche Schritte im Datenlebenszyklus sind betroffen (Datenerstellung, -verarbeitung, -analyse) und was sind die Anforderungen in jedem Element des Datenlebenszyklus

Hieraus wurden folgende Kernmetadaten für den Knowledge Graph abgeleitet, die im kommenden Jahr im Rahmen einer Community-Umfrage evaluiert werden:

  • Projekt: Titel, Kontaktdaten, Förderung, Beschreibung, Fortschritt
  • Zugang: Portal/Website, API, Verfügbarkeit von Datendumps, Verfügbarkeit eines SPARQL Endpoints, Lizenzen
  • Standards: Verwendete Vokabulare und/oder Ontologien
  • Inhalt: Beschriebene Objekte

Föderierte technische Infrastruktur

Eine wesentliche Grundlage für eine effiziente digitale Zusammenarbeit in einem deutschlandweit verteilt arbeitenden Konsortium mit über 60 Partnerinstitutionen stellt eine föderierte Kollaborations und Kommunikationsplattform dar. Auf Basis einer umfangreichen Bedarfs- und Umfeldanalyse konnten wir gleich zu Beginn des Projektes (Entwicklungszeit: November 2020 bis Januar 2021) ein konsortiumsweites Identity und Accessmanagement sowie eine leistungsstarke Open Source Cloud-Plattform für alle Mitwirkenden von NFDI4Culture bereitstellen. Eine ausführliche Darstellung findet sich im Berichtsteil zur Culture Collaboration Cloud.

Culture Information Portal

Als zentraler Hub für alle Forschungsinformationen, Ressourcen und Dienste des Konsortiums konnten wir im Juli 2021 nach sechs Monaten Entwicklungszeit die erste Version des neuen Culture Information Portals veröffentlichen. In einem nutzerorientierten Entwicklungsprozess wurden ab Januar 2021 entwickelte das Team der Akademie der Wissenschaften und der Literatur | Mainz mit allen anderen Teams und Aufgabenbereichen sowie Vertreter:innen aus der Culture-Community gemeinsame User Stories. Unter Einbeziehung von UX-Spezialist:innen wurde das Portal im Anschluss konsequent in Einklang mit den Prinzipien von Linked Open Data (LOD) als modulares webbasiertes Forschungsinformationssystem entlang des CERIF Standards der euroCRIS entwickelt. Hierdurch lässt das Portal schon mit dem initialen Release eine Vernetzung mit der europäischen Infrastrukturlandschaft (z. B. mit der European Open Science Cloud und OpenAIRE) zu. Eine ausführliche Darstellung aller Funktionalitäten des Portals findet sich im Berichtsteil zu übergreifenden Diensten.

Dissemination und Outreach

Vorträge
  • 2021-06-07: Sack, Harald: „Die Welt ist klein und man trifft sich immer zweimal …“, Keynote für die GNDCon 2.0
  • 2021-11-17: Sohmen, Lucia / Rossenova, Lozana: „Bring Your Own Dataset Workshop – How to use Wikibase, OpenRefine and Linked Data“, Culture Community Plenary, online
Publikationen

Ausblick

Im kommenden Jahr werden wir die Entwicklung von Wikibase entlang der Bedarfe unserer Communities kontinuierlich vorantreiben, gleichzeitig streben wir die Integration einer ersten Version des Culture Knowledge Graphs in das Culture Information Portal an. Unseren Schwerpunkt auf dem Community-Building im Bereich von Linked Open Data in den Kunst- und Kulturwissenschaften werden wir durch regelmäßige Treffen weiter verstärken und eine gemeinsame Matrix zum Vergleich existierenden LOD-Werkzeuge in den Fachdomänen von NFDI4Culture erarbeiten. Weiterhin werden wir uns in enger Abstimmung mit unseren Partnern im NFDI-Verein und weiteren Konsortien in die bevorstehende Ausschreibung zu Basisdiensten einbringen.