5.1. Bitstream Preservation

Die Bitstream Preservation beschreibt den Erhalt der Datenintegrität. Sie ist eine der wichtigsten Erhaltungsstrategien der digitalen Langzeitarchivierung. Dies bedeutet, dass die Lesbarkeit der Sequenz aller gespeicherter Nullen und Einsen unverfälscht und vollständig auf Datenträgern über Technologiewechsel hinaus garantiert werden muss.

Die Bitstream Preservation umfasst eine Reihe von Aktivitäten. Die wichtigsten davon beziehen sich auf die Erhaltung der gesamten IT-Infrastruktur (also Hardware und Software), auf der die Informationen gespeichert werden.

Eine Herausforderung bei der Bitstream Preservation ist die Haltbarkeit der Datenträger. Während in Stein gemeißelte Inschriften über Tausende von Jahren erhalten bleiben können, ist die Haltbarkeit von digitalen Datenträgern wie Festplatten oder Disketten nur auf einige Jahre begrenzt; selbst bei professionell gepressten DVDs oder Blu-ray-Discs beschränkt sie sich auf wenige Jahrzehnte. Der Bitstream, also die Sequenz aus Nullen und Einsen auf dem Datenträger, aus welchem sich die eigentlichen Dateien ergeben, wird zudem durch äußere Umwelteinflüsse (wie Strahlung, Magnetfelder, usw.), Hardware-Ausfälle oder Software-Fehler bedroht. Daher ist es notwendig, diese technische Umgebung, die zum Betreiben des Archivs benötigt wird, zu pflegen und Hardware-Komponenten, insbesondere Datenträger, auszutauschen, bevor sie das Ende ihrer Lebensdauer erreicht haben.

Andererseits müssen Vorkehrungen getroffen werden, um eventuell auftretende Fehler in den Daten erkennen zu können. Dazu werden Prüfsummen erstellt, die anhand verschiedener Datenmerkmale berechnet und zusätzlich auf dem Datenträger abgelegt werden. Im Rahmen von Prüfsummenchecks, auch „Fixity-Checks“ genannt, werden gespeicherte und neu berechnete Prüfsummen miteinander verglichen. Ergibt sich eine abweichende Prüfsumme, haben sich die Daten geändert, was auf eine Beschädigung hinweist.

Um solchen Defekten, aber auch Katastrophenfällen wie Bränden oder Kriegen entgegentreten zu können, werden Forschungsdaten mit ihren zugehörigen Metadaten redundant gespeichert. In der Regel sind das drei Kopien an mindestens zwei unterschiedlichen Standorten. Einige Archive bieten darüber hinaus die Möglichkeit eine vierte Kopie (bspw. aus Bestanderhaltungsgründen) zu archivieren, wodurch die Speicherung noch robuster und zuverlässiger wird.

Eine Bitstream Preservation ohne Content Preservation wird bei Daten angewandt, für die eine Content Preservation noch nicht durchgeführt werden kann. Beispiele hierfür sind ausführbare Computercodes wie Quellcodes, Anwendungen bzw. Computerspiele. Darüber hinaus eignet sich die Bitstream Preservation ohne Content Preservation auch für die schnelle und einfache Erhaltung von Daten, wie etwa im Falle von RADAR4Culture.

Schließlich sei bemerkt, dass der Betrieb einer Bitstream Preservation mit Content Preservation deutlich kostenintensiver ist als ohne.

Digitale Langzeitarchive innerhalb von NFDI4Culture, die Bitstream Preservation anbieten:

Weiterführende Informationen zur Lebensdauer verschiedener Datenträger