Vorbereitung der Datenübergabe

Bevor Daten an das Archiv übermittelt werden, wird von beiden Seiten - Archiv und Datengeber - ein Archivierungsvertrag unterzeichnet. In diesem sind u.a. Verfügungs- und Nutzungsrechte, Gewährleistungen und Datenschutz geregelt. Darüber hinaus wird durch den Datengeber eine Zugangskategorie (Benutzungsordnung (31 KB)) gewählt, die regelt, wem die archivierten Daten und Dokumente und zu welchen Bedingungen zur Verfügung gestellt werden sollen.

Voraussetzung für die Übernahme von Daten in das Archiv ist, dass sämtliche rechtlichen Fragen geklärt sind und der Datengeber die einfachen Nutzungsrechte zur Archivierung und Weitergabe an das Archiv abtreten darf.

Der Datengeber stellt ein Datentransferpaket (Submission Information Package, SIP) zusammen, das folgende Bestandteile enthalten sollte:

Materialien im PDF-Format müssen frei von Schutzmechanismen sein, da sie ansonsten nicht bearbeitet, z.B. in neuere Dateiformate migriert werden können.

Empfohlene Formate

Im Hinblick auf den dauerhaften Erhalt von Interpretierbarkeit und Nutzbarkeit der Daten ist die Wahl geeigneter Dateiformate besonders wichtig. Ebenso wie Hardware ist Software einem konstanten Entwicklungsprozess unterworfen. Programme werden bspw. mit neuer Funktionalität ausgestattet oder für neue Betriebssysteme angepasst, was in beiden Fällen mit einer entsprechenden Veränderung des Dateiformats einhergehen kann. Alle digitalen Daten sind somit permanent durch Veränderungen in der Hard- und Softwareumgebung bedroht. Diese Risiken können u.a. durch die Wahl geeigneter Formate gesenkt werden.

Das Datenarchiv gibt folgende Empfehlungen für die wichtigsten Arten von Objekten:

Grundsätzlich sollten Datensätze so übergeben werden, dass sie mit einem der weit verbreiteten Statistikpakete (SPSS, Stata oder SAS) genutzt werden können. Dafür gibt es verschiedene Möglichkeiten:

1. Daten können in den proprietären Formaten der gängigen Statistikprogramme als sogenannte Systemfiles (bspw. SPSS System File) übergeben werden.

2. Daten können in software-spezifischen portablen Dateiformaten (z.B. SAS transport file) geliefert werden.

3. Daten können in textbasierten (Komma-, Tabulator- oder Spalten-getrennten) Formaten zusammen mit entsprechenden Setup bzw. Syntax-Dateien zum Einlesen in die jeweiligen Statistikprogramme übergeben werden.

Art der DatenBevorzugte FormateAkzeptierte Formate
Daten (Statistik-Formate)
  • SPSS Portable (.por)
  • STATA (.dta)
  • SAS Transport (.sas)
  • Weit verbreitete (proprietäre) Formate von Statistikpaketen, wie z.B. SPSS (.sav), Stata (.dta), SAS (.sas7bdat)
  • Tabulator-, Komma- oder Spalten-getrennte Textdatei (“csv”) mit zusätzlicher Setup-Datei (setup, command oder syntax file für SPSS, Stata, SAS usw.) mit entsprechenden Datendefinitionen (Variablennamen u. –label, fehlenden Werten etc.). Alternativ können die Datendefinitionen auch als DDI-XML file übermittelt werden.
  • OpenDocument-Tabellendokument (*.ods) , MS Excel (*.xls, *.xlsx), MS Access (*.mdb, *.accdb)
  • CSV-Formate ohne zusätzliche Datendefinitionsdateien (Setup, Syntax, Command file)
  • Column Binary-Format (column binary ist ein Standard um Daten als Abbilder von Lochkarten zu repräsentieren) oder Card-Image Format.
Dokumentation (Texte)
  • PDF/A (*.pdf)
  • Text-Formate (ASCII, ANSI, etc.)
  • OpenDocument Text (*.odt)
  • PDF (*.pdf)
  • MS Word (*.doc, .docx)
  • RichTextFormat (*.rtf)
  • WordPerfect (*.wpd, *.cwp, *.vwp)
  • HTML (*.htm)
Bilder
  • TIFF Version 6 unkomprimiert (*.tif)
  • JPEG 2000
  • JPEG, PNG, GIF, BMP
  • PDF/A, PDF (*.pdf)

Darüber hinaus unterstützt DAS weitere Formate – insbesondere im Bereich der Forschungsdaten -, die nach Absprache in bevorzugte Formate für die Archivierung überführt werden können. Unabhängig jedoch vom konkreten Datenformat gilt als Grundsatz, dass Datensätze so organisiert sein sollten, dass Dritte diese lesen und interpretieren können.

Dateien dürfen nicht verschlüsselt sein. Auch teilweises Sperren von Funktionen wie etwa Drucken oder Kopieren von Inhalten sollte auf jeden Fall vermieden werden.

Wege ins Archiv

Das Datentransferpaket (SIP) kann auf folgenden Wegen an das Datenarchiv übermittelt werden:

  • Datenträger per Post an den Standort Köln z.Hd. Herrn Oliver Watteler
  • Nach Rücksprache: Upload-Server des Datenarchivs (Cryptshare)
  • Per E-Mail
  • Download-Server des Datengebers