5.2. Content Preservation

Eine weitere Strategie der digitalen Langzeitarchivierung ist der Erhalt der Nutzbarkeit gespeicherter Informationen. Dieser wird durch die Content Preservation erreicht und schließt neben der technischen Interpretierbarkeit (logische Perspektive) auch die inhaltliche Interpretierbarkeit (semantische Perspektive) ein.

Digitale Langzeitarchive definieren ihre Erhaltungsstrategien nicht einheitlich. Während etwa die TIB Hannover in der TIB Preservation Policy drei „Preservation Levels“ festlegt: Bitstream Preservation, Logical Preservation und Semantic Preservation. Die SLUB Dresden fasst die letzteren beiden zur Content Preservation zusammen (→siehe Abbildung 9). Die Content Preservation wird oft auch „funktionaler Erhalt“ genannt.

Eine Herausforderung bei der Content Preservation ist vor allem der Alterungsprozess der Informationen. Wie analoge Inschriften in Sprachen verfasst sein können, die sich in heutiger Zeit nicht mehr entschlüsseln lassen (wie etwa Kretische Hieroglyphen oder die Inka-Schrift Quipu), können Dateiformate im Laufe der Jahre veraltern und somit unlesbar werden.

Wenn Langzeitarchive eine Content Preservation anbieten, bauen sie zumeist auf der Bitstream Preservation auf, übernehmen aber zusätzlich die Erhaltungsplanung. Diese beinhaltet eine Überwachung und Risikoanalyse von Dateiformaten, in der regelmäßig überprüft wird, ob ein Dateiformat weiterhin zukunftssicher ist oder ggf. Maßnahmen eingeleitet werden müssen (→siehe Abschnitt Erhaltungsplanung).

Einige Langzeitarchive, wie z. B. das SLUBArchiv, betreiben eine strikte Content Preservation: Beispielsweise können hier „nur statische [HTML-]Seiten ohne ausführbaren [JavaScript-]Code“ (Langzeitarchivfähige Dateiformate, S. 9) eingeliefert werden. Denn bisher ist eine Formatmigration für JavaScript-Code und somit eine Garantie der Nutzbarkeit beim Ausspielen der Daten Jahrzehnte später aus dem Archiv nicht möglich (→siehe Abschnitt Sonderfall Webarchivierung).