Standards, Datenqualität und Kuratierung

Unser Ziel im Aufgabenbereich Datenstandards, Datenqualität und Kuratierung ist die Etablierung und Weiterentwicklung anerkannter Standards und Verfahren zur Qualitätssicherung von Forschungsdaten aus dem Bereich der materiellen und immateriellen Kulturgüter. Nach einer Aufbauphase bis zur vollständigen personellen Besetzung im Juli 2021 ging es im ersten Projektjahr vor allem um eine Standortbestimmung und Sondierung der Handlungsfelder in Bezug auf die genannten Schwerpunktthemen, außerdem standen Vernetzung und Community-Building im Vordergrund.

Community-Building: Standards für 4Culture-Daten

Für eine funktionierende Forschungsdateninfrastruktur ist die Vernetzung von und mit Akteur:innen aus dem Umfeld Wissenschaft, Kulturerbe, Bibliothek und Förderinstitutionen unabdingbar. Um Arbeitspakete konkreter ausrichten zu können, wollten wir zunächst Bedarfe aus der Community ermitteln und mit eigenen Veranstaltungen für das Thema Datenqualität sensibilisieren. Dazu fand am 3. Mai 2021 die erste Forumsveranstaltung unseres Aufgabenbereichs statt: Das ganztägige Online-Event unter dem Titel „Standards für 4Culture-Daten – Einladung zum Gespräch“ gliederte sich in jeweils ein Plenum zu Beginn und zum Ende, sowie sechs Workshops, die zu Beginn in Lightning Talks vorgestellt wurden. Dabei ging es inhaltlich von Weiterentwicklungen der Auszeichnungssprache MEI (Music Encoding Initiative) und des Harvestingformats LIDO (Lightweight Information Describing Objects) über die Möglichkeit, Ereignisdaten zu modellieren, Anforderungen an primäre Forschungsdaten der digitalen Bildwissenschaft, Vokabularentwicklung am Beispiel Berufsbezeichnungen bis zur komplexen Erschließung multimodaler Daten im Kontext von Nachlässen. Das in diesem Rahmen konstituierte Forum begrüßte am Ende die Idee einer jährlichen Wiederholung einer solchen Veranstaltung sowie begleitender kleinerer Formate während der Projektlaufzeit.

TA2_Forum_MiroBoard_fertig.JPG

Board der Gruppenarbeit der sechs Workshops bei der virtuellen Forumsveranstaltung im Mai 2021, CC BY 4.0, Autor:in: Angela Kailus

Darüber hinaus haben wir uns an zahlreichen weiteren Veranstaltungen mit Beiträgen, Referaten und eigenen Workshops beteiligt: zum Beispiel auf der Convention der Gemeinsamen Normdatei GNDCon 2.0, bei der Tagung „Sammlung trifft Forschung“, bei der Jahrestagung der Gesellschaft für Universitätssammlungen zum Thema „Digitales Kuratieren“ und bei der Tagung der Fachgruppe Dokumentation im Rahmen der Jahrestagung des Deutschen Museumsbunds „Digitale Sammlungsarbeit: Das Museum im Wandel“.

Die gesammelten Anregungen und Rückmeldungen wurden, wo möglich, in bereits existierende Arbeitspakete (z. B. zu MEI, LIDO und zu Werknormdaten) integriert. Es wurden aber auch neue Arbeitspakete entworfen, beispielsweise zu der Herausforderung, Ereignisdaten der Performing Arts, der Musik und Medienkunst in Datenmodellen abzubilden. Durch die Veranstaltungen konnte auch der Bereich der Vernetzung gewinnbringend vorangetrieben werden.

Zusammenarbeit mit der Gemeinsamen Normdatei (GND)

Wir moderieren aktuell verschiedene Prozesse mit Vertreter:innen der GND und dem DFG-Projekt GND für Kulturdaten(GND4C): Zum einen sollen die Culture-Fachcommunities besser am qualitativen und quantitativen Ausbau der GND beteiligt werden können (über Forschungsprojekte, Arbeitsgruppen, Interessensvertretungen äquivalent der AG Musik des Standardisierungsausschusses, GND-Agentur Bauwerke). Die Fachgebiete Performing Arts und auch Film- und Medienwissenschaft haben jeweils spezifische Bedarfe für Normdaten, die, wie sowohl von NFDI4Culture als auch von GND4C intendiert, in der GND aufgenommen werden sollten. Zum zweiten geht es bei der Vernetzung mit der GND darum, gemeinsame Interessen zu ermitteln, zu bündeln und in Kooperation beispielsweise Fortbildungsmaterialien in Form eines gemeinsamen Tutorials zur Nutzung von Normdaten bereit zu stellen. Einen dritten Aktivitätsstrang mit Bezug zur GND gibt es im Bereich musikalische Werknormdaten: Hier haben wir eine Arbeitsgruppe aus Vertreter:innen von GND und dem Internationalen musikalischen Quellenlexikon Répertoire International des Sources Musicales (RISM) ins Leben gerufen, deren Anliegen es ist, die Nachnutzbarkeit und Anbindung der Werknormdatensätze beider Datenhubs zu verbessern.

MEI (Music Encoding Initiative)

Im Bereich MEI (Music Encoding Initiative) findet eine rege Gremienarbeit unseres Aufgabenbereichs in den MEI Interest Groups zu Metadata and Cataloging, Linked Data und Digital Pedagogy sowie eine Begleitung der Themen ODD (One Document Does it all, das Dokument, das das Schema einer MEI-Anwendung definiert) und MerMEId (Metadata Editor and Repository for MEI Data) statt, um sowohl die aktuellen Entwicklungen inhaltlich zu begleiten als auch die Bedarfe aus der Culture-Community an die Entwickler:innen heranzutragen. Ziel ist es, den aktuellen Status von MEI als Standard für den Bereich der Musik-Codierung zu solidieren und gleichzeitig das Datenformat für neue Anwendungsbereiche zu rüsten. So wird momentan an einem Aufbau einer Arbeitsgruppe zur schrittweisen Erweiterung von MEI für audio-visuelle Medien/Werke gearbeitet. Die Kontakte und Expertisen, die sich aus den bisherigen Veranstaltungen ergeben haben, bilden hierfür die Basis.

Weiterentwicklung von LIDO

Das Teilprojekt zur Weiterentwicklung von LIDO arbeitet mit der LIDO AG (Fachgruppe Dokumentation, Deutscher Museumsbund) an der Integration der Dokumentationsanforderungen aus verschiedenen Anwendungskontexten in Kulturerbe-Einrichtungen und Forschung und von Datenaggregatoren. Eine weiterentwickelte Schemaversion 1.1. wurde im Dezember 2021 publiziert. Der Aufgabenbereich beteiligt sich außerdem an einer Arbeitsgruppe zur Erstellung eines Anwendungsprofils für Bildressourcen für das bibliothekarische Katalogisierungsregelwerk Resource Description and Access (RDA), angesiedelt beim Standardisierungsausschuss der Deutschen Nationalbibliothek. Auch hier nehmen wir die Anregungen und Bedarfe der Fachcommunities auf und vermitteln sie unter Berücksichtigung des Ziels der Interoperabilität von Daten aus verschiedenen Sparten in die RDA-AG Bild weiter.

Beratung

Ein wesentlicher Teil des Arbeitsprogramms ist die Beratung und Bereitstellung von Informationen und Unterstützungsangeboten in unterschiedlicher Form: von individuellen Angeboten für Projekte oder einzelne Forscher:innen im Rahmen des NFDI4Culture Helpdesks bis zu geplanten Leitfäden, Handreichungen oder Video-Tutorials für bestimmte Anwendungsgebiete. Dazu gehören auch Letters of Intent, die wir für unterschiedliche Projektvorhaben über den NFDI4Culture Kickstarter verfasst haben. Auf diese Weise werden relevante Projektpartner:innen in engem Austausch von Anfang an in das Konsortium eingebunden.
Mit dem Beginn von NFDI4Culture haben wir die Konzeption und den Aufbau des NFDI4Culture Helpdesks federführend vorangetrieben und regelmäßige Arbeitstreffen zur Abstimmung und zum Austausch etabliert. Eine ganze Reihe von Beratungen haben stattgefunden, darunter auch umfangreichere zur Unterstützung bei der Konzeption des Datenmanagements und zur Sicherung von Datenqualität bei geplanten Forschungsprojekten.

Handreichungen

Themen- und fächerspezifische Handreichungen und Guidelines sind derzeit in Planung oder in Arbeit, die Forschende dabei unterstützen sollen, bei der Konzeption, der konkreten Planung und der Umsetzung ihrer Forschungsvorhaben die Qualität und Nachnutzbarkeit ihrer Daten im Sinne der FAIR-Prinzipien (Findable, Accessible, Interoperable, Reusable) zu steigern. Dabei werden nicht nur die Forschenden als Datenproduzent:innen und Datennehmer:innen im Kontext ihrer fachspezifischen Ausgangssituation adressiert, sondern auch die Publikationsplattformen und Repositories als Datenanbieter:innen oder Datengeber:innen, die eine FAIRe Bereitstellung von Daten ermöglichen oder vereinfachen sollen. Die bereits begonnene Abstimmung und Erarbeitung gemeinsamer Grundlagen mit den Aufgabenbereichen Datenpublikation und Langzeitarchivierung und Übergreifende technische Infrastruktur soll in Zukunft verstärkt werden.

Neben konkret ausgearbeiteten Handreichungen zu FAIRen Daten stehen wir auch im Austausch zu den CARE-Prinzipien für die Handhabung indigener Forschungsdaten. Hier werden zum einen externe Expert:innen herangezogen und zum anderen mit den Kolleg:innen aus anderen Aufgabenbereichen diskutiert, wie man die CARE-Prinzipien in den 4Culture-Fächern bekannt machen kann. Ein weiteres Thema ist, wie generell datenethische Aspekte stärker Anwendung finden können. Im Rahmen des Netzwerks Koloniale Kontexte engagieren wir uns in der Arbeitsgruppe Thesauri, die die in der wissenschaftlichen Dokumentation von Kulturgütern aus kolonialen Kontexten verwendeten Vokabulare und Thesauri sammeln, vernetzen, harmonisieren und kritisch reflektieren möchte.

Steigerung der Datenqualität mit Normdaten und Fachvokabularen

Datenqualität wird stark über die FAIR-Prinzipien definiert und ein großer Schritt in Richtung FAIRe Daten kann in unseren Disziplinen über die Einbindung und Anreicherung von Normdaten erreicht werden. Wir nutzen daher die bereits 2017 begonnene Öffnung der Gemeinsamen Normdatei hin zu einer auch für nichtbibliothekarische Kulturerbe-Akteure offenen Kollaborationsstruktur und befassen uns in einem Arbeitsschwerpunkt ausgehend von musikalischen Werken mit der Weiterentwicklung von Normdaten für künstlerische Werke. Vor allem zwischen Musikwissenschaft und Performing Arts ergeben sich absehbar Überschneidungen bezüglich der Modellierung von Werknormsätzen, z. B. im Bereich Musiktheater.

Die Vernetzung von Fachvokabularen mit internationalen Referenzvokabularen wurde mit dem Aufbau einer projekt- und institutionsübergreifend nutzbaren Vokabularplattform in der Software xTree vom digiCULT-Verbund, einer Software für den ISO-standardkonformen Aufbau und die Pflege von Vokabular, begonnen. Dies ist die Arbeitsplattform, auf deren Basis die Anforderungen für Thesaurus-Anbindung definiert werden und die Entwicklung eines Redaktionsprozesses zum Art & Architecture Thesaurus (AAT) anhand konkreter multilingualer Projektvokabulare begonnen werden kann.

Dissemination und Outreach

Vorträge und Workshops
  • 2020-08-20 und 2020-12-10: Kailus, Angela: Sachstandsbericht NFDI4Culture und Aufgabenbereich 2 beim Projekt GND4C
  • 2021-01-21: Stellmacher, Martha: Vorstellung von NFDI4Culture, 1. SAVE-Fachtag, SLUB Dresden
  • 2021-01-18 und 2021-01-28: Kailus, Angela: Kurzvortrag und Workshop „NFDI4Culture Projektstart & nächste Schritte“, Arbeitskreis der kunsthistorischen Bildarchive und Fototheken (AKBF)
  • 2021-05-05: Kailus, Angela: „NFDI4Culture – Angebote für Museen“, Frühjahrstagung 2021 der Fachgruppe Dokumentation im Deutschen Museumsbund „Digitale Sammlungsarbeit: Das Museum im Wandel“
  • 2021-05-31: Wiermann, Barbara: Vorstellung NFDI4Culture, Vernetzungstreffen NFDI der Universität Leipzig
  • 2021-06-07: Kailus, Angela: „NFDI4Culture, GND und vernetzte Forschungsdaten zu Kulturgütern“, GNDCon 2.0
  • 2021-06-07: Mayer, Desiree / Wiermann, Barbara: „Werknormdaten der Musik – Bibliotheken und Wissenschaft im Gespräch“, GNDCon 2.0
  • 2021-06-28: Primavesi, Patrick / Gruß, Melanie: Vorstellung von NFDI4Culture, AG Archiv der Gesellschaft für Theaterwissenschaften
  • 2021-07-20: Richts-Matthaei, Kristina / Albrecht-Hohmaier, Martin / Röwenstrunk, Daniel / Münzmay, Andreas: Posterslam und -präsentation „MEI meets NFDI4Culture“, Music Encoding Conference, Alicante
  • 2021-08-07: Stanicka-Brzezicka, Ksenia: „The common heritage? Digital convergence of regional heritage data“, International Council for Central and Eastern European Studies (ICCEES) World Congress, online
  • 2021-09-15 bis 2021-09-17: Kailus, Angela / Stein, Regine: dreiteiliger Workshop „Standards für das Erschließen und Vernetzen“, Sammlungstagung – Digitales Kuratieren, online
  • 2021-09-15 bis 2021-09-17: Bracht, Christian / Stäcker, Thomas: dreiteiliger Workshop „Forschungsdaten und/oder Sammlungsdaten?“, Sammlungstagung – Digitales Kuratieren, online
  • 2021-09-21: Mayer, Desiree: „NFDI4Culture und Normdaten“, Tagung IAML Deutschland 2021, Treffpunkt Musikerschließung und GND, online
  • 2021-09-22: Wiermann, Barbara: „Visualisierung der Vernetzungstätigkeit bei Werknormdaten“, Kurzvorstellung NFDI4Culture, 2. Sächsische FDM-Tagung, online
  • 2021-11-24: Krause, Celia: „NFDI4Culture. FAIR Data Principles und die Definition von Datenqualität“, Virtuelles Treffen des AK Graphik vernetzt

Ausblick

Für das kommende Jahr sind die intensive Arbeit an Handreichungen, verstärkte Beratungsaktivitäten und das Erarbeiten begleitender Anträge geplant.