Datensicherung & Archivierung

Daten und Materialien, die auf Datenträgern geliefert wurden, werden von den Original-Medien getrennt und die digitalen Objekte werden in ein definiertes Langfristsicherungsformat überführt.

Für die Archivierung wird im Datenarchiv ein Paket aus mehreren Objekten (Archival Information Package, AIP) zusammengestellt, das neben den abgelieferten Original-Objekten weitere Daten/Informationen enthält. Dazu gehören u.a. im Archiv aufbereitete Versionen von Daten und Dokumenten sowie entsprechende (kommentierte) Syntaxdateien, die den Bezug zwischen Original- und Archivversionen herstellen. In ausgewählten Fällen werden zusätzlich auch Metadaten auf Variablenebene erzeugt und mit abgelegt.

Zusätzliche Dokumente wie Fragebögen, Korrespondenz und ähnliches werden in einem separaten Ordner abgelegt. Werden diese Dokumente als Printversionen dem Archiv übergeben, werden sie gescannt und digital abgelegt. Bereinigte Daten und solche, an denen Veränderungen vorgenommen wurden, werden ebenfalls dokumentiert und gesichert.

Für die Nutzung der Daten werden zusätzlich definierte Objekte in einem Paket (Dissemination Information Package, DIP) zusammengestellt. Diese Ausgabepakete werden den Nutzern des Archiv über verschiedene Services zur Verfügung gestellt.

Archivsystem

Alle gelieferten Daten werden nach festgelegten Regeln im Archivsystem abgelegt. Die Datenarchivierung erfolgt entlang des Lebenszyklus von Forschungsdaten.

Das Archiv unterliegt restriktiven Zugriffsrechten, so dass zum Beispiel nur autorisierte Mitarbeiter langfristsicherungsfähige Objekte in das digitale Archiv überführen bzw. aus dem Archiv entfernen können.

Das Archivsystem hat eine dateibasierte Verzeichnisstruktur. Die Dateien werden nach bestimmten Regeln in definierte Verzeichnisse abgelegt und nach einem einheitlichen Schema benannt. Die Originale, d.h. die vom Datengeber gelieferten Dateien werden in der ursprünglichen Form mit den ursprünglichen Dateinamen abgelegt und erhalten. Durch dieses Vorgehen werden die technischen und logischen Beziehungen der Objekte zueinander ausgedrückt.

Neben den beschriebenen organisatorischen und technischen Maßnahmen und dem Vorhalten einer modernen und leistungsfähigen IT-Infrastruktur setzt das Datenarchiv weitere Maßnahmen ein, die zur Sicherstellung des physischen Erhalts von archivierten Objekten geeignet sind und im Katastrophenfall eine schnelle Wiederherstellung ermöglichen. Dazu gehören die physische Sicherung der Daten, regelmäßige Backups, eine redundante Speicherung an unterschiedlichen Standorten sowie die Sicherung der Daten auf verschiedenartigen Speichermedien und die Medienmigration.