Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen
SuchenSitemapHilfe
GESIS Servicestelle Osteuropa GESIS-ZA  
Informationszentrum Sozialwissenschaften Zentrum für Umfragen, Methoden und Analysen

Literatur- & Forschungsinformation

Weitere Angebote Datenservice & Archivierung

Studien archivieren & Beratung

Aufbereitung sozialwiss. Studien

Dauerbeobachtung

Methodenberatung

Forschung & Entwicklung

Software

Publikationen

 

Bestellen & Downloads

Veranstaltungen

GESIS-Bibliotheken

Linksammlung SocioGuide

 

Kooperationen

Beratung

Mitarbeiter & Adressen

Presse

Organisation

 

Impressum


 

 

 

Die Aufbereitung von sozialwissenschaftlichen Studien & Datensätzen

Akquisition, Aufbereitung, Archivierung - Von den Rohdaten zur aufbereiteten Studie

Zur Versorgung der interessierten Öffentlichkeit mit Primärmaterial und Ergebnissen aus empirischen Untersuchungen gehört der beständige Ausbau der Datenbasis des GESIS-ZA. Damit die Studien und ihre Datensätze für Sekundäranalysen genutzt werden können, sind in der Regel umfangreiche Kontroll- und Aufbereitungsarbeiten notwendig. Die einzelnen Schritte bis hin zur Archivierung erfolgen im GESIS-ZA nach den folgenden Standards und Verfahrensweisen, um die Daten als qualitativ hochwertiges Basisprodukt für weitere Analysen bereitstellen zu können. Sie entsprechen internationalen Archivstandards, die den technischen Entwicklungen und neuen wissenschaftlichen Anforderungen angepasst werden.

1. Datenakquisition und Datengeber

  • Ausgangspunkt ist die laufende Beschaffung von Studien aus der empirischen Sozialforschung, im Einzelfall auch im Auftrag eines Nutzers. Das Archiv bemüht sich bei den unterschiedlichsten Einrichtungen um die Freigabe von Studien. Zu den Datengebern gehören Hochschulinstitute genauso wie Markt- und Meinungsforschungsinstituten oder wissenschaftliche Stiftungen oder Verbände aus dem In- und Ausland.
  • Gleichzeitig können Forscher ihre eigenen Daten zur Archivierung, Aufbereitung und zum Vertrieb selbst an das Zentralarchiv weitergeben.
  • Bei der Akquisition wird darauf geachtet, dass das Datenmaterial bestimmten methodisch-technischen Kriterien genügt. Eine Darrüberhinausgehende Bewertung findet durch das GESIS-ZA aber nicht statt. Detailinformationen zur Archivierung erhalten Sie in den Hinweisen für Datengeber.

Bei allen Fragen zu Archivierungsmöglichkeiten von sozialwissenschaftlichen Datensätzen berät Sie:

  • Oliver Watteler, M.A., Tel. +49 (0)221- 47694-76, E-Mail

2. Eingangskontrolle der Daten und Dokumente im GESIS-ZA

Die Datensätze werden dem Archiv in der Regel auf Disketten übergeben. Zu diesen maschinenlesbaren Daten werden dem Zentralarchiv die notwendigen Dokumente (Fragebogen, Codeplan) und ergänzende Informationen über die Untersuchung zur Verfügung gestellt. Diese werden in der Eingangskontrolle geprüft:

Prüfung der Primärunterlagen auf Vollständigkeit:
  • Ist der Fragebogen vorhanden?
  • Ist der Codeplan vollständig?
  • Ist das Informationsmaterial
    für eine methodische Beschreibung
    der Untersuchung ausreichend?
technische Kontrolle der Speichermedien
und Prüfung der Daten:
  • Ist das Speichermedium lesbar und virenfrei?
  • Ist der richtige Datensatz geliefert worden?
  • Ist die Fallzahl korrekt?
  • Gibt es Unstimmigkeiten zwischen Fragebogen, Codeplan und Daten?
  • Gibt es nicht-definierte, sogenannte "wilde Codes" oder doppelte Fälle?
  • Vergleich der erstellten Auszählung mit den Dokumenten des Datengebers.
  • Fehlerbereinigung.

Eventuell vorhandene Fehlverkodungen und logische Inkonsistenzen werden bereinigt sowie die Auszählung anhand des Codeplans kontrolliert. Ziel der Eingangskontrollen ist die Erstellung eines Datensatzes, in dem alle Fälle vollständig vorhanden sowie eindeutig identifiziert sind und mit dem Codeplan übereinstimmen.

3. Datenaufbereitung nach dem GESIS-ZA Standardformat

  • In der nächsten Bearbeitungsphase werden die Daten in einem Datenformat aufbereitet, die dem Benutzer eine moderne statistische Analyse etwa mit SAS oder SPSS ermöglicht.
  • Je nach Stand der Aufbereitung werden Studien den Zustandsklassen 1, 2 oder 3 zugeordnet.
  • Sowohl für die Formatierung der Daten auf den Datenträgern als auch für die Beschreibung der Daten und die zugehörigen Begleitinformationen (Codebuch, Studienbeschreibung) sind entsprechende Archivstandards entwickelt worden, die sich an den Anforderungen moderner Datenanalysesysteme orientieren und laufend mit den internationalen Partnerarchiven abgestimmt werden.
dokumentierte Aufbereitung und Prüfung der Daten z.B.:
  • Stimmen die Filter oder sind die Daten inkonsistent?
  • "Fehlende Werte" (missing values) werden auf standardisierte Werte festgesetzt, die für alle Studien gleich sind.
  • Variablenbezeichnungen werden festgelegt.
  • Labels (Etiketten) werden für Variablennamen und Merkmalsausprägungen definiert und geschrieben.
  • Ein SPPS-Setup wird erarbeitet, das die direkte Erstellung eines Systemfiles bzw. portable files ermöglicht.
  • Alle Aufbereitungs- und Korrekturschritte werden dokumentiert.
Integration zu einem kumulierten Gesamtdatensatz:
  • Einzeldatensätze mit Befragungen über mehrere Zeitpunkte bzw. aus mehreren Ländern werden einer zusätzlichen Bearbeitung unterzogenen, um dem wachsenden Bedarf an vergleichenden Studien zu decken.
  • In mehreren Zwischenschritten werden dazu die heterogen Datenstrukturen der Einzeldatensätzen an einheitliche Standards angepaßt und in einen Gesamtdatensatz integriert.
  • Die Kumulationen werden z.B. für die Datenschwerpunkte ALLBUS, Eurobarometer, ISSP, Politbarometer und Wahlstudien hergestellt.

4. Codebuch-Erstellung

Parallel zur datentechnischen Aufbereitung erfolgt die Textaufbereitung für ausgewählte Studien:

  • strukturiertes Erfassen von Fragebogen mit komplettem Fragetext und allen Antwortkategorien nach GESIS-ZA Standardformat.
  • Zusammenführen von Text und bereinigten Daten zu einem Codebuch.

Endprodukt der Studienaufbereitung (Zustandsklasse 1) ist ein maschinenlesbares Codebuch, das zusätzlich als Printversion verfügbar ist. Es enthält die komplette Dokumentation des Datensatzes, die für die Sekundäranalyse von Bedeutung sind:

  • Kontextinformationen zur Erhebung ( z. T. mit zusätzlichem Methodenbericht)
  • Labels der Variablen
  • vollständige Frage- und Antworttexte
  • Position der Variablen im Datensatz
  • Hinweise zur Filterführung und zu (länder-)spezifischen Verkodungen
  • ungewichtete Grundauszählung mit absoluten und relativen Häufigkeiten je Variable
  • zusätzliche Hinweise z. B. zur Verkodungen von Berufen (Notes)
  • Variblenverzeichnis

5. Studienbeschreibung

Zur inhaltlichen und methodischen Information wird eine gesonderte Studienbeschreibung erstellt. Sie dient insbesondere der systematischen Erschließung der GESIS-ZA Datensatzbestände durch die:

  • inhaltliche Zusammenfassung des Fragebogens
  • methodisch-technische Beschreibung der Untersuchung
  • Aufnahme der Studienbeschreibung in den Datenbestandskatalog
  • Mitteilung über neue Datensätze

6. Archivierung

Die maschinenlesbaren Daten und Originaldokumente werden gesichert:

  • Speicherung des aufbereiteten Datensatzes in Ergänzung zum Originaldatensatz und maschinenlesbaren Codebuch
  • Anfertigung von Sicherungskopien und Auslagerung an einen separaten Ort.
  • Sicherung der Originaldokumente (Fragebogen usw.) durch Einscannen und elektronische Speicherung.

7. Informationsrückgewinnung

Zum Auffinden vorhandener Studien bzw. vergleichbarer Themen auf Studien- bzw. auf Variablenebene erfolgt eine Indexierung von Studienbeschreibungen sowie maschinenlesbarer Codebücher in Retrievalsystemen. Online stehen verschiedene Suchoberflächen des GESIS-ZA (Datenbestandskatalog, ZACAT, ZA Q-Base) und seiner Datenschwerpunkte im Internet zur Verfügung.

8. Bereitstellung der Daten

Die Bestellung von Daten und Kontextinformationen erfolgt im Rahmen der Benutzungs- und Gebührenordnung (Überblick) und ist postalisch und über das Internet möglich. Weitere Informationen zur Auswahl und Bereitstellung von Daten und Dokumenten sowie deren Bezug sind in einer gesonderten Übersicht zusammengestellt.

 

© GESIS Oliver Watteler 14.12.2007