3.4. Identifizierung erhaltenswerter Eigenschaften

Erhaltenswerte Eigenschaften (auch „signifikante Eigenschaften“ genannt) bilden die Grundlage für das archivarische Handeln, wenn es darum geht, die Nutzbarkeit der Forschungsdaten zu erhalten (→siehe Abschnitt Content Preservation). In diesem Kontext bilden sie die Basis für den Erhalt der Nutzbarkeit des Archivmaterials. Selbst wenn es zunächst nur darum geht, die Datenintegrität des eingelieferten Archivmaterials zu erhalten, ist die Erfassung erhaltenswerter Eigenschaften zu empfehlen, um auch später noch Maßnahmen zur Erhaltung der Nutzbarkeit durchführen zu können.

Eine erhaltenswerte Eigenschaft wäre zum Beispiel die Lesbarkeit von Text innerhalb eines Dokumentes bei üblichem Betrachtungsabstand.

Das Fehlen oder der Verlust von nur einer erhaltenswerten Eigenschaft kann eventuell ein Objekt unbrauchbar machen. Auch Entscheidungen zur →Formatmigration und zur →Auswahl von Dateiformaten hängen wesentlich von erhaltenswerten Eigenschaften ab.

Fallbeispiel: signifikante Eigenschaften bei Tabelleninhalten

Abbildung 3: Beispiel einer Tabellenkalkulationsdatei mit farbig codierten Informationen. (Foto: © Matthias Razum, CC BY 4.0 International)

Tabellarische Daten sollten maschinenlesbar sein und nicht in proprietären Formaten vorliegen. Dafür eignet sich z. B. das Tabellenformat CSV, in dem Werte durch Kommata getrennt werden. In diesem Beispiel sind Teile der Ursprungsdatei farbig codiert. Das könnte im CSV-Format problematisch sein, denn dieses deckt derartige Zusatzinformationen nicht ab. Es ist also zu prüfen, ob die Farbwerte eine erhaltenswerte Eigenschaft sind. Da es sich im Beispiel bei der roten Markierung um die Hervorhebung von negativen Zahlen handelt, diese aber zusätzlich das Negativzeichen aufweisen, bedeutet der Wegfall der Farbe keinen Informationsverlust. Die Farbe ist damit keine erhaltenswerte Eigenschaft, und das CSV-Format kann hier verwendet werden.

Falls nun das Archiv Tabellen nur als CSV archiviert, müsste der Rat an die Datenproduzierenden lauten, über Farbauszeichnung getragene Informationen in zusätzliche Tabellenspalten zu extrapolieren oder Minuszeichen einzufügen. Andernfalls wäre eine Überführung in das CSV-Format nicht möglich.

Fallbeispiel: signifikante Eigenschaften bei 3D-Modellen

Abbildung 4: 3D-Tastmodell des Völkerschlachtdenkmals des Stadtgeschichtlichen Museums in Leipzig (links, Maßstab: 1:100, Foto: © Sandrino Donnhauser) sowie seine virtuelle Präsentation (rechts, 3D-Modell: © Eric Eschrich).

3D-Modelle sollten in nicht-proprietären Formaten vorliegen. Dafür eignet sich das STL-Format, das Geometrieinformationen in Form von Dreiecksfacetten speichern kann. Möchte man 3D-gescannte Gegenstände oder Gebäude mit einfarbigem Filament 3D-drucken, um diese z. B. als Kunststofftastmodelle für sehbeeinträchtigte und blinde Menschen in Museen wie im linken Bild der oberen Abbildung zu nutzen, so stellt der Erhalt von Farbinformationen keine signifikante Eigenschaft dar. Soll das digitalisierte Denkmal hingegen für eine wirklichkeitstreue virtuelle Präsentation gesichert werden, sind Farbinformationen eine erhaltenswerte Eigenschaft und ein anderes archivfähiges 3D-Format wie etwa glTF oder X3D muss verwendet werden. Falls das Archiv keine 3D-Daten archiviert, müsste der Rat an die Datenproduzierenden lauten, alternative Darstellungsweisen wie 360°-Videos oder Bilder aus unterschiedlichen Perspektiven einzuliefern.

Erhaltenswerte Eigenschaften werden meist von den Datengebenden mit Unterstützung der Archivar:innen bestimmt. Wichtig ist, dass bei der Einlieferung von Materialien ins Archiv die Bestimmung erhaltenswerter Eigenschaften generell ganz am Anfang stehen sollte. Auch sollten sich Forschende bereits zu Projektbeginn mit dem digitalen Archiv beraten, um die Weichen rechtzeitig in ihrer Datenhaltung zu stellen.

Bei der Ermittlung dieser Eigenschaften muss in Betracht gezogen werden, um welches Material es sich handelt, zu welchem Zweck es archiviert werden soll und für welche Zielgruppen es geschaffen wurde. Dabei definiert das Archiv auf Basis von Checklisten sogenannte „Objekttypgruppen“ (Material mit gleichen Eigenschaften), von denen angenommen werden kann, dass sie auf ähnliche Art und Weise genutzt werden. Das Archiv überträgt die erfassten Eigenschaften dann in ein geeignetes Format. Das SLUBArchiv.digital stellt dafür ein eigenes XML-Schema „significant properties“ (Anleitung) bereit, mit dem erhaltenswerte Eigenschaften in einer XML-Datei erfasst werden können. Bei der Einlieferung von Datenpaketen prüft das Archiv das Vorhandensein erhaltenswerter Eigenschaften und überführt diese dann in technische Eigenschaften: So ist die Anforderung, dass auf einem Bild enthaltene Textinformationen bei üblichem Betrachtungsabstand auf einem Bildschirm lesbar sein sollen, eine abstrakte erhaltenswerte Eigenschaft; die Anforderung, dass bei Rastergrafiken mit einer Auflösung von mindestens 300dpi gearbeitet werden muss, wäre eine abgeleitete technische Eigenschaft.

Bei der Bestimmung erhaltenswerter Eigenschaften gibt es unterschiedliche Ansätze, wie es am Fallbeispiel „Stein von Rosetta“ (siehe Abbildung 5) veranschaulicht werden kann.

Der provenienzbasierte Ansatz fragt danach, welche überlieferte oder vermutete Absicht in der Vergangenheit bei der Erstellung eines analogen oder digitalen Objekts verfolgt wurde. Im Falle des Steins von Rosetta war etwa die Vermittlung des eingemeißelten Textes so wichtig, dass dieser gleich in drei Sprachen verfasst wurde. Nach diesem Ansatz hätte bei der digitalen Langzeitarchivierung daher der semantische Erhalt des gesamten Textes mit umfangreichen Kontextinformationen Priorität.

Der nutzergruppenbasierte Ansatz hingegen fragt danach, welche Bedürfnisse eine Community zukünftig haben wird und was daher mit den archivierten Objekten geschehen soll. Außerdem stellt sich hier die Frage, welcher Anspruch daraus an die Qualität der Daten im Archiv erwächst. Für die Langzeitarchivierung des Steins von Rosetta hätten dann erhaltenswerte Eigenschaften vor allem zum äußeren Erscheinungsbild Priorität. Dabei ist der Zweck entscheidend, je nachdem, ob die Objektdaten nach einer 3D-Digitalisierung online zur virtuellen Erkundung oder originalgetreu zur Reproduktion im Falle einer Zerstörung aufbewahrt werden sollen.

Die durch beide Ansätze ermittelten erhaltenswerten Eigenschaften ergänzen sich oft. Zusammen werden sie auch als „Preservation Intent“ bezeichnet. Darin legt das Archiv – basierend auf den Informationen der Datengebenden – fest, was wie erhalten werden soll.

Fallbeispiel: erhaltenswerte Eigenschaften aus unterschiedlichen Perspektiven

Abbildung 5: Der Stein von Rosetta. Links: Bruchstück; ausgestellt im British Museum; enthält eine dreisprachige Inschrift aus dem Jahr 196 v. Chr., in dem der ägyptische König Ptolemaios V. geehrt wird (Foto: © Olaf Herrmann, free use). Rechts: digitale Rekonstruktion des kompletten Steins (Grafik: © Captmondo, CC BY-SA 3.0).

Beim Stein von Rosetta wurden sowohl einfache Fotografien aus unterschiedlichen Perspektiven als auch 3D-Modelle mittels Photogrammetrie-Methoden für eine breite Zielgruppe – „vom Wissenschaftler bis zum Bürger“ – erstellt: Einerseits für museale Zwecke, vom Ansehen der Steinoberfläche bis zum Erschließen von Kontextinformationen, andererseits zum Zwecke der Rekonstruktion. 3D-Modelle werden dabei online auf der Sketchfab-Seite des British Museum zur Verfügung gestellt. Fotografien mit weiterführenden Informationen z. B. über das Objekt und zur Handhabung sowie Aufzeichnungen zur Konservierung werden über das Webpräsentationssystem COL des British Museum kostenlos bereitgestellt. Einige Felder sind aus Gründen der Sicherheit und Vertraulichkeit nicht öffentlich einsehbar. Alle Aufzeichnungen werden dabei regelmäßig mit neuen Forschungsergebnissen und Bibliografien aktualisiert und sind einige Tage später online sichtbar.

Fotografien und 3D-Modelle werden zur Webpräsentation in niedriger Auflösung der Öffentlichkeit zur Verfügung gestellt. Fotografien und 3D-Modelle in hoher Auflösung samt allen Metadaten werden hingegen im digitalen Archiv des British Museum aufbewahrt und können auf Anfrage bereitgestellt werden.

Es ist empfehlenswert, zuerst erhaltenswerte Eigenschaften zu identifizieren, dann darauf aufbauend technische Parameter festzulegen und anschließend erst geeignete Dateiformate auszuwählen. Erst danach sollte die Digitalisierung durchgeführt werden.

Vor der Digitalisierung großer homogener Datenmengen eines Projektes (wie z. B. bei der Digitalisierung historischer Kunstzeitschriften oder mittelalterlicher Handschriften) müssen erhaltenswerte Eigenschaften oft nur einmal für den jeweiligen Objekttyp erfasst werden. Bei großen, inhomogenen Datenmengen verschiedener Projekte kann dies aufwändiger werden. Da die digitale Langzeitarchivierung in den meisten Infrastruktureinrichtungen noch nicht fest etabliert ist, wird dieser Schritt im Prozess der Digitalisierung oft ausgelassen. Dies kann jedoch die Nutzbarkeit der Objekte langfristig gefährden, wenn diese Jahrzehnte später wieder aus dem Archiv ausgespielt werden.

Weitere Informationen zu erhaltenswerten Eigenschaften