5. Modul: Kontrolliertes Vokabular

Warum ist kontrolliertes Vokabular wichtig?

Der Einsatz von kontrolliertem Vokabular statt Freitext ermöglicht:

  • gute d. h. möglichst vollständige und präzise Suchergebnisse in aggregierten Daten (z. B. Onlineportalen),
  • Eindeutigkeit (keine Verwechslung z. B. von namensgleichen Orten oder Personen),
  • die Anreicherung mit Synonymen,
  • die Anreicherung mit mehrsprachiger Information,
  • die Anreicherung mit zusätzlichen inhaltlichen Informationen (beispielsweise kann eine ID aus der Gemeinsamen Normdatei/GND der Deutschen Nationalbibliothek genutzt werden, um beim Import von Objektdaten in ein Portal weitere Informationen zu einer Person oder einem Ort einzuspielen, die in der Erfassungsdatenbank, aus der die Objektdaten stammen, zu dieser Person oder diesem Ort nicht vorhanden sind).

Der Einsatz von kontrolliertem Vokabular schafft eine gute Ausgangsbasis für die Transformation von LIDO-Daten in Linked Open Data und damit für die Verknüpfung verteilt liegender Daten.

LIDO Terminology Recommendation

Die LIDO-Terminologie-Empfehlungen enthalten Vokabular-Empfehlungen für eine Vielzahl von LIDO-Elementen und LIDO-Attributen. Empfohlen werden Terme aus der LIDO Terminology und aus weiteren Vokabularen. LIDO empfiehlt den Einsatz von kontrolliertem Vokabular für:

LIDO Terminology

Die LIDO Terminology enthält Vokabulare für ausgewählte LIDO-Elemente und LIDO-Attribute. Es handelt sich hier ausschließlich um Vokabulare für Allgemeinbegriffe. Die LIDO Terminology ist als Linked Open Data verfügbar und wird von der CIDOC LIDO Working Group verabschiedet.

Liste der LIDO Vokabulare (Webansicht): https://terminology-view.lido-schema.org/
SPARQL: http://terminology.lido-schema.org/sparql

Es wird dringend empfohlen, Terme der LIDO Terminology zu verwenden, wenn sie für ein Element oder Attribut zur Verfügung stehen! Bitte beachten Sie diesbezüglich besondere Vorgaben in LIDO-Anwendungsprofilen (s. Modul "LIDO-Anwendungsprofile").

Vokabulare der LIDO Terminology

Die Liste aller Vokabulare findet sich hier.

Ein Vokabular wird im Rahmen der LIDO Terminology für Elemente und Attribute entwickelt, wenn:

  • eine allgemeine Terminologie-Empfehlung wahrscheinlich sehr viele oder alle Anwendungsfälle abdeckt,
  • es kein geeignetes Vokabular gibt, das frei wiederverwendet werden kann, oder
  • wenn die Zusammenstellung von Begriffen aus verschiedenen Vokabularen in einem Vokabular die konsistente Indexierung erheblich erleichtert.

Beachten Sie, dass die meisten Vokabulare der LIDO Terminology aus relativ wenigen Begriffen bestehen und dass von ihnen erwartet wird, dass sie erschöpfend sind.

Terme der LIDO Terminology bestehen mindestens aus einer englischen Vorzugsbezeichnung (preferred label) und einer Definition. Darüber hinaus kann es alternative Bezeichnungen und Übersetzungen der Bezeichnungen in andere Sprachen und Mappings zu anderen Vokabularen geben.

Nutzen der LIDO Terminology

Die Verwendung von Termen aus der LIDO Terminology sorgt für eine gute Auswertbarkeit der Daten.

Beispielsweise kann ein LIDO-Datensatz verschiedene Typen von Objektbeschreibungen enthalten. Die Angabe des Typs erfolgt im Attribut @lido:type im Element <lido:objectDescriptionSet>. Würde ein Datenaggregator (z. B. ein Onlineportal) in diesem Attribut Freitext auswerten müssen, könnte darin stehen: "Zustandsbeschreibung", "Zustand des Objekts", "Erhaltungszustand" usw. ggf. auch in verschiedenen Sprachen.

<lido:objectDescriptionSet lido:type="Zustandsbeschreibung">
[...]
</lido:objectDescriptionSet>
<lido:objectDescriptionSet lido:type="Zustand des Objekts">
[...]
</lido:objectDescriptionSet>
<lido:objectDescriptionSet lido:type="Erhaltungszustand">
[...]
</lido:objectDescriptionSet>

Erhält ein Datenaggregator Daten von verschiedenen Datengebern, die unterschiedliche Freitexte im Attribut @lido:type enthalten, wird es schwierig, das Attribut und den gesamten Elementinhalt richtig auszuwerten und vergleichbare Daten aus verschiedenen Datensätzen richtig zu verarbeiten.

Durch die Verwendung des LIDO-Terms für "Zustandsbeschreibung" wie im folgenden Ausschnitt aus dem Beispiel "Geißblattlaube" aus dem LIDO-Handbuch "Malerei und Skulptur" wird der Typ des Beschreibungstexts einfach und eindeutig auswertbar und kann ggf. auch mit Übersetzungen in anderen Sprachen angereichert werden, wenn diese für diesen LIDO-Term vorhanden sind.

<!-- Wenn eine besondere Form der Objektbeschreibung in den Daten vorhanden ist, sollte diese durch das entsprechende Typattribut gekennzeichnet werden, wie in diesem Fall mit 'Zustandsbeschreibung' (lido00268)-->
<lido:objectDescriptionSet lido:type="http://terminology.lido-schema.org/lido00268">
    <lido:descriptiveNoteValue>Am oberen Rand beschnitten. Ursprünglich war der gesamte Hut von Rubens zu sehen. Der Originalzustand des Gemäldes kann druckgrafischen Reproduktionen entnommen werden, z. B. in: "Rubens und seine erste Frau" von Carl Ernst Hess im British Museum, Department of Prints and Drawings.</lido:descriptiveNoteValue>
    <lido:sourceDescriptiveNote>Gudrun Knaus, siehe auch: Norbert Schnabel, Trautes Paar im Grünen – „Die Geißblattlaube“ von Peter Paul Rubens. URL: http://syndrome-de-stendhal.blogspot.com/2015/02/trautes-paar-im-grunen-die.html (Last updated on 28.7.2018) [2022-04-29]</lido:sourceDescriptiveNote>    
    <lido:sourceDescriptiveNote>https://www.britishmuseum.org/collection/object/P_R-3-1 [2021-06-13]</lido:sourceDescriptiveNote>
</lido:objectDescriptionSet>

LIDO-Vokabulare für Elemente

Die Links zu den verschiedenen Vokabularen sind immer gleich aufgebaut: Der Link zum Vokabular für das Element <lido:recordType> lautet z. B.
"http://terminology.lido-schema.org/recordType" (= http://terminology.lido-schema.org/ + Elementname).

LIDO-Vokabulare für Attribute

Vokabulare für @lido:type

Mit dem Attribut @lido:type kann eine Typisierung von Elementen erfolgen. Im Modul "Dokumentstruktur, Elementtypen, Attribute" findet sich dazu ein XML-Beispiel.

Die LIDO Terminology enthält einige Vokabulare für @lido:type Attribute in verschiedenen Elementen. Die Links zu den verschiedenen Vokabularen sind immer gleich aufgebaut: Der Link zum Vokabular für das type-Attribut im Element <lido:objectDescriptionSet> lautet z. B.

"http://terminology.lido-schema.org/objectDescriptionSet_type" (= http://terminology.lido-schema.org/ + Elementname + Unterstrich + Attributname).

Verpflichtend ist das Attribut @lido:type in Identifier-Elementen (z. B. <lido:conceptID>, <lido:actorID>). Damit kann zwischen lokalen IDs (z. B. eine ID aus einer hausinternen Personen- oder Ortsdatenbank) und sog. Uniform Resource Identifiern (URIS), d.h. global gültigen IDs, unterschieden werden.

Beispiel: Lokale ID
LIDO-Term für das Attribut @lido:type: http://terminology.lido-schema.org/lido00100

<lido:recordID lido:type="http://terminology.lido-schema.org/lido00100">obj00154983</lido:recordID>

Beispiel: URI (Uniform Resource Identifier, Definition s. hier)
LIDO-Term für das Attribut @lido:type: http://terminology.lido-schema.org/lido00099

<lido:lidoRecID lido:type="http://terminology.lido-schema.org/lido00099" lido:source="https://ld.zdb-services.de/resource/organisations/DE-Mb112">
https://ld.zdb-services.de/resource/organisations/DE-Mb112/lido-obj00154983
</lido:lidoRecID>

Siehe dazu auch das Modul "Pflichtangaben".

Vokabular für @lido:pref

Das Attribut @lido:pref markiert bevorzugt auszuwertende Elemente. Die LIDO Terminology stellt folgendes Vokabular dafür bereit: http://terminology.lido-schema.org/pref.

Mehr Informationen zu diesem Attribut gibt der LIDO Primer.

Weitere Vokabulare für Allgemeinbegriffe und Individualbegriffe

Die LIDO-Terminologie-Empfehlungen (LIDO Terminology Recommendation document) enthalten neben den Empfehlungen von Termen aus der LIDO Terminology auch Vokabular-Empfehlungen für eine Vielzahl von LIDO-Elementen und LIDO-Attributen aus weiteren kontrollierten Vokabularen, die als Linked Open Data zur Verfügung stehen, wie beispielsweise:

Hinweis: Verwendung von LOD-URIs

Bitte verwenden Sie, wenn vorhanden, LOD-URIs (LOD = Linked Open Data, URI = Uniform Resource Identifier), die eine optimale maschinelle Auswertung ermöglichen. Für die obigen Beispiele bedeutet das:

Einbindung von kontrolliertem Vokabular in LIDO

LIDO stellt eine Vielzahl von Elementen und Attributen für die Einbindung von kontrolliertem Vokabular zur Verfügung.

Individualbegriffe

Beispiel: Akteur

Das folgende Beispiel aus dem LIDO Primer zeigt die Einbindung eines Individualbegriffs (Person Leonardo da Vinci, 1452–1519) unter Verwendung des Elements <lido:actor> (s. LIDO Documentation):

<lido:actor lido:type="http://terminology.lido-schema.org/lido00413">
    <lido:actorID lido:type="http://terminology.lido-schema.org/lido00099">http://viaf.org/viaf/24604287</lido:actorID>
    <lido:nameActorSet>
        <!-- Preferred name -->
        <lido:appellationValue lido:pref="http://terminology.lido-schema.org/lido00169" xml:lang="en">Leonardo, da Vinci</lido:appellationValue>
        <!-- Display name -->
        <lido:appellationValue lido:pref="http://terminology.lido-schema.org/lido00526" xml:lang="en">Leonardo da Vinci</lido:appellationValue>
    </lido:nameActorSet>
</lido:actor>

Seit LIDO v1.1 können zusätzliche IDs mit <owl:sameAs> angegeben werden. Im folgenden Beispiel werden neben der VIAF-ID in <lido:actorID> zusätzlich in <owl:sameAs> URIs von Wikidata, ULAN (Union List of Artist Names) und GND (Gemeinsame Normdatei) für Leonardo da Vinci angegeben.

<lido:actor lido:type="http://terminology.lido-schema.org/lido00413">
    <lido:actorID lido:type="http://terminology.lido-schema.org/lido00099">http://viaf.org/viaf/24604287</lido:actorID>
    <owl:sameAs>http://www.wikidata.org/entity/Q762</owl:sameAs>
    <owl:sameAs>http://vocab.getty.edu/ulan/500010879</owl:sameAs>
    <owl:sameAs>https://d-nb.info/gnd/118640445</owl:sameAs>
    <lido:nameActorSet>
        <!-- Preferred name -->
        <lido:appellationValue lido:pref="http://terminology.lido-schema.org/lido00169" xml:lang="en">Leonardo, da Vinci</lido:appellationValue>
        <!-- Display name -->
        <lido:appellationValue lido:pref="http://terminology.lido-schema.org/lido00526" xml:lang="en">Leonardo da Vinci        </lido:appellationValue>
    </lido:nameActorSet>
</lido:actor>

Beispiel: Ort

Das folgende Beispiel aus dem LIDO Primer zeigt die Einbindung einer Ortsangabe (Florenz) unter Verwendung des Elements <lido:place> (s. LIDO Documentation):

<lido:eventPlace>
    <lido:displayPlace xml:lang="en">Possibly Florence, between 1502/1506</lido:displayPlace>
    <!-- City -->
    <lido:place lido:politicalEntity="http://www.wikidata.org/entity/Q515">
        <lido:placeID lido:type="http://terminology.lido-schema.org/lido00099">http://www.wikidata.org/entity/Q2044</lido:placeID>
        <lido:namePlaceSet>
            <!-- Preferred label -->
            <lido:appellationValue lido:pref="http://terminology.lido-schema.org/lido00169" xml:lang="en">Florence</lido:appellationValue>
        </lido:namePlaceSet>
        <lido:gml>
            <gml:Point>
                <gml:pos>43.771389, 11.254167</gml:pos>
            </gml:Point>
        </lido:gml>
    </lido:place>
</lido:eventPlace>

Mit <owl:sameAs> könnten wie im obigen Personenbeispiel auch hier weitere IDs für den Ort angegeben werden.

Mit dem Element <lido:partOfPlace> (s. LIDO Documentation) können hierarchische Beziehungen zwischen Orten hergestellt werden.

LIDO enthält weitere Elemente für die Einbindung von Individualbegriffen, z. B. für Objekte (<lido:object> s. LIDO Documentation) oder für historische Ereignisse (<lido:event> s. LIDO Documentation).

Allgemeinbegriffe

Allgemeinbegriffe in Elementen

Die folgenden Beispiele zeigen die Einbindung eines Allgemeinbegriffs (Ereignistyp "Herstellung") unter Verwendung des Elements <lido:eventType>.

In LIDO v1.0 war die Einbindung von Allgemeinbegriffen in Indexelementen nur unter Verwendung der Elemente <lido:conceptID> und <lido:term> möglich:

<lido:eventType>
    <lido:conceptID>http://terminology.lido-schema.org/lido00007</lido:conceptID>
    <lido:term xml:lang="en">Production</lido:term>
    <lido:term xml:lang="de">Herstellung</lido:term>
</lido:eventType>

Seit LIDO v1.1 wird die Einbindung von Allgemeinbegriffen mit dem Element <skos:Concept> (s. SKOS) empfohlen, da dieses Element gute Möglichkeiten zur Datenanreicherung bietet:

<lido:eventType>
    <skos:Concept rdf:about="http://terminology.lido-schema.org/lido00007">
        <skos:prefLabel xml:lang="en">Production</skos:prefLabel>
        <skos:prefLabel xml:lang="de">Herstellung</skos:prefLabel>
    </skos:Concept>
</lido:eventType>

Mit <skos:Concept> bzw. seinen Unterelementen wie z. B. <skos:mappingRelation> können verwandte Begriffe aus anderen Vokabularen eingebunden werden, wie das folgende Beispiel aus dem LIDO Primer zeigt:

<lido:subjectConcept>
   <skos:Concept rdf:about="http://vocab.getty.edu/aat/300417502">
       <skos:prefLabel xml:lang="en">smiling</skos:prefLabel>
       <skos:altLabel xml:lang="en">smiled</skos:altLabel>
       <skos:mappingRelation>http://www.wikidata.org/entity/Q487</skos:mappingRelation>
       <skos:mappingRelation>https://d-nb.info/gnd/4034011-9</skos:mappingRelation>
   </skos:Concept>
   <lido:term lido:addedSearchTerm="yes" xml:lang="en">smile</lido:term>
   <lido:term lido:addedSearchTerm="yes" xml:lang="de">Lächeln</lido:term>
</lido:subjectConcept>

Im folgenden Beispiel aus dem LIDO Primer enthält der Term aus dem Getty Art & Architecture Thesaurus leider eine falsche deutsche Übersetzung (im Element <skos:prefLabel>). Die richtige Übersetzung kann im Element <lido:term> als zusätzlicher Suchbegriff (sichtbar am Attribut @lido:searchTerm="yes") ausgegeben werden:

<lido:termMaterialsTech
   lido:type="http://terminology.lido-schema.org/lido00513">
   <skos:Concept rdf:about="http://vocab.getty.edu/aat/300015050">
       <skos:prefLabel xml:lang="en">oil paint (paint)</skos:prefLabel>
       <!-- The following label is an incorrect German translation -->
       <skos:prefLabel xml:lang="de">Ölgemälde</skos:prefLabel>
   </skos:Concept>
   <lido:term lido:addedSearchTerm="yes" xml:lang="de">Ölfarbe</lido:term>
</lido:termMaterialsTech>

Allgemeinbegriffe in Attributen

Das folgende Beispiel zeigt die Einbindung eines Allgemeinbegriffs (Ttiteltyp "published titles") unter Verwendung des Attributs @lido:type im Element <lido:titleSet>.

<!-- Term aus Getty Art & Architecture Thesaurus (AAT) in @lido:type: "published titles", @lido:type ist in diesem Element keine Pflichtangabe //-->
                <lido:titleSet lido:type="http://vocab.getty.edu/aat/300417206">
                    <lido:appellationValue lido:pref="http://terminology.lido-schema.org/lido00169" xml:lang="it">La Primavera</lido:appellationValue>
                    <lido:sourceAppellation>Le Gallerie degli Uffizi. URL: https://www.uffizi.it/opere/botticelli-primavera [2021-12-10]</lido:sourceAppellation>
                </lido:titleSet>

Das folgende Beispiel zeigt die Einbindung eines Allgemeinbegriffs (Typ des Identifiers "URI") unter Verwendung des Attributs @lido:type im Element <lido:lidoRecID>.

<!-- Term aus LIDO Terminology in @lido:type: http://terminology.lido-schema.org/lido00099 für "URI" //-->
    <lido:lidoRecID lido:type="http://terminology.lido-schema.org/lido00099" lido:source="https://ld.zdb-services.de/resource/organisations/DE-Mb112">https://ld.zdb-services.de/resource/organisations/DE-Mb112/lido-obj00154983</lido:lidoRecID>

Der LIDO Primer enthält zahlreiche weitere XML-Beispiele, die die Möglichkeiten zur Einbindung von kontrolliertem Vokabular zeigen.

Aufgaben

Kontrolliertes Vokabular

  1. Vertiefung: Bitte sehen Sie sich die Möglichkeiten zur Einbindung von kontrolliertem Vokabular anhand der XML-Beispiele im LIDO Primer und anhand der verschiedenen LIDO-Beispieldatensätze auf der LIDO-Website und der Anwendungsbeispiele des LIDO-Handbuchs "Malerei und Skulptur", z. B. "Geißblattlaube" (XML) an.
  2. Vertiefung: Bitte erstellen Sie eine Liste der Felder in Ihrer Erschließungsdatenbank, in denen kontrolliertes Vokabular verwendet wird. Welche der Vokabulare sind nur in Ihrer Einrichtung (also lokal) verfügbar, welche Vokabulare stehen frei zur Verfügung (wie z. B. GND, Wikidata, AAT, ...)? Erstellen Sie eine Liste der Felder, für die der Einsatz von kontrolliertem Vokabular in Ihren Augen sinnvoll wäre. Bitte vergleichen Sie Ihre Listen mit den LIDO Terminologie-Empfehlungen (LIDO Terminology Recommendation).
  3. Vertiefung: Bitte sehen Sie sich die Vokabulare der LIDO Terminology näher an und prüfen Sie, an welchen Stellen der Einsatz der LIDO Terminology für Ihre Erschließungsdatenbank sinnvoll wäre (z. B. Typisierung von Beschreibungstexten).
  4. Hands-on:
    • Bitte laden Sie den LIDO-Beispieldatensatz LIDO-Beispieldatensatz "La Primavera Pflichtelemente mit kontrolliertem Vokabular" (XML) in Ihren XML-Editor und speichern sie das Dokument unter dem Namen "LIDO-v1-1_DE_Beispielobjekt.xml". An dieser Datei werden Sie nun bis zum Ende der Schulung weiterarbeiten und sie nach und nach ergänzen.
    • Bitte ersetzen Sie die Angaben im Dokument mit den Informationen zu Ihrem Beispielobjekt, die Sie in der Hands-on-Aufgabe in Modul 1 zusammengestellt haben. Informationen zu den Pflichtelementen finden Sie im Modul "Pflichtangaben". Bitte validieren Sie das Dokument.

Materialien und Links