Anhang

Checkliste für Datengebende

  • Die im Data Feed beschriebenen Ressourcen verfügen über auflösende IRIs.
  • Übersicht über externe Identifikatoren und Klassifikatoren (z. B. GND, Wikidata, GeoNames, Iconclass, Getty AAT u. a.), die in den Daten zur Identifizierung von Entitäten (wie Orte, Personen, Organisationen oder Konzepte) verwendet werden
  • Wenn die Daten Teil eines Aggregatorenportals oder eines Suchindexes für Daten Dritter sind, wurden die ursprünglichen Datengebenden zu der geplanten Integration von Metadaten zu ihren Daten in den Culture Knowledge Graph kontaktiert.
  • Der Herausgeber des Datenportals oder seine Muttereinrichtung ist bereits formell an NFDI4Culture beteiligt (siehe Partnerliste) (ja/nein).
  • Das zugehörige Datenportal ist bereits im Culture Information Portal registriert (ja/nein).
  • Generelle Informationen, die zu jedem Data Feed benötigt werden:
    • Name, und wenn verfügbar, Culture IRI des Datenportals, zu dem der Feed gehört
    • Informationen über den Typ der Data Feed Elements
    • ob Ressourcen des Data Feeds in einem Aggregatorenportal gelistet sind, z. B. Deutsche Digitale Bibliothek (DDB) (PID E1183), heidICON (PID E2944), prometheus (PID E2428), Bildindex der Kunst und Architektur des Deutschen Dokumentationszentrums für Kunstgeschichte – Bildarchiv Foto Marburg (DDK) (PID E2916)
    • ob das Datenportal selbst ein Aggregatorenportal ist (ja/nein)
    • eine Kurzbeschreibung des Data Feeds auf Englisch und Deutsch mit Anzahl, Inhalt sowie Datenformaten der Forschungsdaten (bis zu 100 Wörter)
    • relevante Fachdisziplinen

Glossar

Term Definition
Culture Knowledge Graph Kitchen Die Culture Knowledge Graph Kitchen ist eine vielseitige ETL-Umgebung (Extract-Transform-Load), die für die effiziente Abfrage, Verarbeitung, Integration und Analyse von Data Feeds in den Culture Knowledge Graph entwickelt wurde. Sie besteht aus mehreren Python-Komponenten, die jeweils einem bestimmten Zweck innerhalb der „Küche“ dienen, um Daten zu konsumieren, zu bereinigen, zu versionskontrollieren, zu veröffentlichen und zu analysieren.
Culture Graph Interchange Format Das Culture Graph Interchange Format (CGIF) ist ein einfach zu verwendendes, leichtgewichtiges Austauschformat auf der Grundlage von schema.org für das Harvesting von Daten. CGIF hat den zusätzlichen Vorteil, dass sich die Daten automatisch für die Google Dataset Search qualifizieren und die Auffindbarkeit von Websites und Datensätzen durch Suchmaschinenoptimierung erheblich verbessert wird.
Data Feed Nach schema.org liefert ein Data Feed strukturierte Informationen über eine oder mehrere Entitäten oder Themen (siehe https://schema.org/DataFeed). Ein Data Feed kann auch als Dataset bezeichnet werden.
Data Feed Element Nach schema.org ist unter einem Data Feed Element ein Element innerhalb eines Data Feeds zu verstehen. Es können mehrere Data Feed Elements in einem Data Feed enthalten sein (siehe https://schema.org/dataFeedElement).
Data portal Nach der Definition der NFDIcore Ontology ist ein Datenportal eine Webseite, die als zentrale Plattform für den Zugang, die Verwaltung und den Austausch von Datensätzen, Informationen oder Ressourcen zu einem bestimmten Thema oder einer bestimmten Domäne dient (siehe https://nfdi.fiz-karlsruhe.de/ontology/NFDI_0000123).
Hydra Scraper Der Hydra Scraper ist ein Kommandozeilen-Werkzeug, mit dem Daten aus verschiedenen Quellen abgerufen werden können, wie z. B. von Hydra-paginierten APIs, Beacon-ähnlichen URL-Listen, ZIP-Dateien oder lokalen Daten-Dumps. Er kann Dateien in RDF-kompatible Formate wie JSON-LD oder Turtle umwandeln, aber auch z.B. LIDO-Dateien verarbeiten. Befehlszeilenaufrufe können kombiniert und angepasst werden, um vollwertige Scraping-Mechanismen zu erstellen, einschließlich der Möglichkeit, Triple für den Culture Knowledge Graph auszugeben.
NFDIcore Ontology Die NFDIcore Ontology (Präfix nfdicore) beschreibt Ressourcen wie Datensätze, Datengebende, Personen, Projekte und andere Entitäten in der Domäne der NFDI. Sie dient als Basis für weitere domänenspezifische Ontologiemodule. Mappings zu zahlreichen externen Vokabularen und Ontologien werden bereitgestellt.
NFDI4Culture Ontology Das NFDI4Culture Ontologiemodul (Präfix cto) dient der Darstellung und Kategorisierung verschiedener Ressourcen innerhalb der Domänen von NFDI4Culture. Es umfasst eine breite Palette von Entitäten, einschließlich einzelner Quellobjekte und Eigenschaften z. B. für zugehörige Personen, Organisationen, Orte, Datenkonzepte, Klassifikatoren und Zeitinformationen. CTO baut auf der NFDIcore Ontology auf.

List of abbreviations

Abbreviation Definition
AAT Getty Art & Architecture Thesaurus
API Application Programming Interface
CIDOC CRM CIDOC Conceptual Reference Model
CGIF Culture Graph Interchange Format
CMIF Correspondence Metadata Interchange Format
CTO NFDI4Culture Ontology
DDB Deutsche Digitale Bibliothek
DDK Deutsches Dokumentationszentrum für Kunstgeschichte – Bildarchiv Foto Marburg
EAD Encoded Archival Description
ETL Extract-Transform-Load
GND Gemeinsame Normdatei
ID Identifier
IRI Internationalised Resource Identifier
ISO International Organization for Standardization
JSON-LD JSON for Linking Data
KG Knowledge Graph
LIDO Lightweight Information Describing Objects
MARC MAchine-Readable Cataloging
MEI Music Encoding Initiative
NFDI Nationale Forschungsdateninfrastruktur (national research data infrastructure)
NFDI4Culture Consortium for research data on material and immaterial cultural heritage
OAI-PMH Open Archives Initiative Protocol for Metadata Harvesting
PID Persistent Identifier
REST-API Representational State Transfer-Application Programming Interface
RDF Resource Description Framework
SEO Search Engine Optimization
SPARQL SPARQL Protocol And RDF Query Language
TEI Text Encoding Initiative
URL Uniform Resource Locator
VIAF Virtual International Authority File
XML Extensible Markup Language
ZIP Dateiformat für verlustfrei komprimierte Dateien