Culture Knowledge Graph Kitchen |
Die Culture Knowledge Graph Kitchen ist eine vielseitige ETL-Umgebung (Extract-Transform-Load), die für die effiziente Abfrage, Verarbeitung, Integration und Analyse von Data Feeds in den Culture Knowledge Graph entwickelt wurde. Sie besteht aus mehreren Python-Komponenten, die jeweils einem bestimmten Zweck innerhalb der „Küche“ dienen, um Daten zu konsumieren, zu bereinigen, zu versionskontrollieren, zu veröffentlichen und zu analysieren. |
Culture Graph Interchange Format |
Das Culture Graph Interchange Format (CGIF) ist ein einfach zu verwendendes, leichtgewichtiges Austauschformat auf der Grundlage von schema.org für das Harvesting von Daten. CGIF hat den zusätzlichen Vorteil, dass sich die Daten automatisch für die Google Dataset Search qualifizieren und die Auffindbarkeit von Websites und Datensätzen durch Suchmaschinenoptimierung erheblich verbessert wird. |
Data Feed |
Nach schema.org liefert ein Data Feed strukturierte Informationen über eine oder mehrere Entitäten oder Themen (siehe https://schema.org/DataFeed). Ein Data Feed kann auch als Dataset bezeichnet werden. |
Data Feed Element |
Nach schema.org ist unter einem Data Feed Element ein Element innerhalb eines Data Feeds zu verstehen. Es können mehrere Data Feed Elements in einem Data Feed enthalten sein (siehe https://schema.org/dataFeedElement). |
Data portal |
Nach der Definition der NFDIcore Ontology ist ein Datenportal eine Webseite, die als zentrale Plattform für den Zugang, die Verwaltung und den Austausch von Datensätzen, Informationen oder Ressourcen zu einem bestimmten Thema oder einer bestimmten Domäne dient (siehe https://nfdi.fiz-karlsruhe.de/ontology/NFDI_0000123). |
Hydra Scraper |
Der Hydra Scraper ist ein Kommandozeilen-Werkzeug, mit dem Daten aus verschiedenen Quellen abgerufen werden können, wie z. B. von Hydra-paginierten APIs, Beacon-ähnlichen URL-Listen, ZIP-Dateien oder lokalen Daten-Dumps. Er kann Dateien in RDF-kompatible Formate wie JSON-LD oder Turtle umwandeln, aber auch z.B. LIDO-Dateien verarbeiten. Befehlszeilenaufrufe können kombiniert und angepasst werden, um vollwertige Scraping-Mechanismen zu erstellen, einschließlich der Möglichkeit, Triple für den Culture Knowledge Graph auszugeben. |
NFDIcore Ontology |
Die NFDIcore Ontology (Präfix nfdicore ) beschreibt Ressourcen wie Datensätze, Datengebende, Personen, Projekte und andere Entitäten in der Domäne der NFDI. Sie dient als Basis für weitere domänenspezifische Ontologiemodule. Mappings zu zahlreichen externen Vokabularen und Ontologien werden bereitgestellt. |
NFDI4Culture Ontology |
Das NFDI4Culture Ontologiemodul (Präfix cto ) dient der Darstellung und Kategorisierung verschiedener Ressourcen innerhalb der Domänen von NFDI4Culture. Es umfasst eine breite Palette von Entitäten, einschließlich einzelner Quellobjekte und Eigenschaften z. B. für zugehörige Personen, Organisationen, Orte, Datenkonzepte, Klassifikatoren und Zeitinformationen. CTO baut auf der NFDIcore Ontology auf. |