|
|
Die Aufbereitung von sozialwissenschaftlichen Studien & Datensätzen
Akquisition, Aufbereitung, Archivierung - Von den Rohdaten zur aufbereiteten Studie
Zur Versorgung der interessierten Öffentlichkeit mit Primärmaterial und Ergebnissen aus empirischen Untersuchungen gehört der
beständige Ausbau der Datenbasis des GESIS-ZA. Damit die Studien und ihre Datensätze für Sekundäranalysen genutzt werden können, sind in der Regel umfangreiche
Kontroll- und Aufbereitungsarbeiten notwendig. Die einzelnen Schritte bis hin zur Archivierung erfolgen im GESIS-ZA nach den folgenden
Standards und Verfahrensweisen, um die Daten als qualitativ hochwertiges Basisprodukt für weitere Analysen bereitstellen zu können. Sie
entsprechen internationalen Archivstandards, die den technischen Entwicklungen und neuen wissenschaftlichen Anforderungen
angepasst
werden.
1. Datenakquisition und Datengeber
- Ausgangspunkt ist die laufende Beschaffung von Studien aus der empirischen Sozialforschung, im Einzelfall auch im Auftrag eines Nutzers.
Das Archiv bemüht sich bei den unterschiedlichsten Einrichtungen um die Freigabe von Studien. Zu den
Datengebern gehören
Hochschulinstitute genauso wie Markt- und Meinungsforschungsinstituten oder wissenschaftliche Stiftungen oder Verbände aus dem In- und
Ausland.
- Gleichzeitig können Forscher ihre eigenen Daten zur Archivierung, Aufbereitung und zum Vertrieb selbst an das Zentralarchiv weitergeben.
- Bei der Akquisition wird darauf geachtet, dass das Datenmaterial bestimmten methodisch-technischen Kriterien genügt. Eine
Darrüberhinausgehende Bewertung findet durch das GESIS-ZA aber nicht statt. Detailinformationen zur Archivierung erhalten Sie in den
Hinweisen für Datengeber.
Bei allen Fragen zu Archivierungsmöglichkeiten von
sozialwissenschaftlichen Datensätzen berät Sie:
- Oliver Watteler, M.A., Tel. +49
(0)221- 47694-76, E-Mail
2. Eingangskontrolle der Daten und Dokumente im GESIS-ZA
Die Datensätze werden dem Archiv in der Regel auf Disketten übergeben. Zu diesen maschinenlesbaren Daten werden dem Zentralarchiv die
notwendigen Dokumente (Fragebogen, Codeplan) und ergänzende Informationen über die Untersuchung zur Verfügung gestellt. Diese werden in
der Eingangskontrolle geprüft:
Prüfung der Primärunterlagen
auf Vollständigkeit:
- Ist der Fragebogen vorhanden?
- Ist der Codeplan vollständig?
- Ist das Informationsmaterial
für eine methodische Beschreibung der Untersuchung ausreichend?
|
technische Kontrolle der Speichermedien
und Prüfung der Daten:
- Ist das Speichermedium lesbar und virenfrei?
- Ist der richtige Datensatz geliefert worden?
- Ist die Fallzahl korrekt?
- Gibt es Unstimmigkeiten zwischen Fragebogen, Codeplan und Daten?
- Gibt es nicht-definierte, sogenannte "wilde Codes" oder doppelte Fälle?
- Vergleich der erstellten Auszählung mit den Dokumenten des Datengebers.
- Fehlerbereinigung.
|
Eventuell vorhandene Fehlverkodungen und logische Inkonsistenzen werden bereinigt sowie die Auszählung anhand des Codeplans
kontrolliert. Ziel der Eingangskontrollen ist die Erstellung eines Datensatzes, in dem alle Fälle vollständig vorhanden sowie eindeutig
identifiziert sind und mit dem Codeplan übereinstimmen.
3. Datenaufbereitung nach
dem GESIS-ZA Standardformat
- In der nächsten Bearbeitungsphase werden die Daten in einem Datenformat aufbereitet, die dem Benutzer eine moderne statistische Analyse
etwa mit SAS oder SPSS ermöglicht.
- Je nach Stand der Aufbereitung werden Studien den Zustandsklassen 1, 2 oder 3 zugeordnet.
- Sowohl für die Formatierung der Daten auf den Datenträgern als auch für die Beschreibung der Daten und die zugehörigen
Begleitinformationen (Codebuch, Studienbeschreibung) sind entsprechende Archivstandards entwickelt worden, die sich an den Anforderungen
moderner Datenanalysesysteme orientieren und laufend mit den internationalen Partnerarchiven abgestimmt werden.
dokumentierte Aufbereitung und Prüfung der Daten z.B.:
- Stimmen die Filter oder sind die Daten inkonsistent?
- "Fehlende Werte" (missing values) werden auf standardisierte Werte festgesetzt, die für alle Studien gleich sind.
- Variablenbezeichnungen werden festgelegt.
- Labels (Etiketten) werden für Variablennamen und Merkmalsausprägungen definiert und geschrieben.
- Ein SPPS-Setup wird erarbeitet, das die direkte Erstellung eines Systemfiles bzw. portable files ermöglicht.
- Alle Aufbereitungs- und Korrekturschritte werden dokumentiert.
|
Integration zu einem kumulierten Gesamtdatensatz:
- Einzeldatensätze mit Befragungen über mehrere Zeitpunkte bzw. aus mehreren Ländern werden einer zusätzlichen Bearbeitung
unterzogenen, um dem wachsenden Bedarf an vergleichenden Studien zu decken.
- In mehreren Zwischenschritten werden dazu die heterogen Datenstrukturen der Einzeldatensätzen an einheitliche Standards angepaßt und
in einen Gesamtdatensatz integriert.
- Die Kumulationen werden z.B. für die Datenschwerpunkte ALLBUS, Eurobarometer, ISSP,
Politbarometer und Wahlstudien hergestellt.
|
4. Codebuch-Erstellung
Parallel zur datentechnischen Aufbereitung erfolgt die Textaufbereitung für ausgewählte Studien:
- strukturiertes Erfassen von Fragebogen mit komplettem Fragetext und allen Antwortkategorien nach
GESIS-ZA Standardformat.
- Zusammenführen von Text und bereinigten Daten zu einem Codebuch.
Endprodukt der Studienaufbereitung (Zustandsklasse 1) ist ein maschinenlesbares Codebuch, das zusätzlich als Printversion verfügbar
ist. Es enthält die komplette Dokumentation des Datensatzes, die für die Sekundäranalyse von Bedeutung sind:
- Kontextinformationen zur Erhebung ( z. T. mit zusätzlichem Methodenbericht)
- Labels der Variablen
- vollständige Frage- und Antworttexte
- Position der Variablen im Datensatz
- Hinweise zur Filterführung und zu (länder-)spezifischen Verkodungen
- ungewichtete Grundauszählung mit absoluten und relativen Häufigkeiten je Variable
- zusätzliche Hinweise z. B. zur Verkodungen von Berufen (Notes)
- Variblenverzeichnis
5. Studienbeschreibung
Zur inhaltlichen und methodischen Information wird eine gesonderte Studienbeschreibung erstellt. Sie dient insbesondere der
systematischen Erschließung der GESIS-ZA Datensatzbestände durch die:
- inhaltliche Zusammenfassung des Fragebogens
- methodisch-technische Beschreibung der Untersuchung
- Aufnahme der Studienbeschreibung in den Datenbestandskatalog
- Mitteilung über neue Datensätze
6. Archivierung
Die maschinenlesbaren Daten und Originaldokumente werden gesichert:
- Speicherung des aufbereiteten Datensatzes in Ergänzung zum Originaldatensatz und maschinenlesbaren Codebuch
- Anfertigung von Sicherungskopien und Auslagerung an einen separaten Ort.
- Sicherung der Originaldokumente (Fragebogen usw.) durch Einscannen und elektronische Speicherung.
7. Informationsrückgewinnung
Zum Auffinden vorhandener Studien bzw. vergleichbarer Themen auf Studien- bzw. auf Variablenebene erfolgt eine Indexierung von
Studienbeschreibungen sowie maschinenlesbarer Codebücher in Retrievalsystemen.
Online stehen verschiedene Suchoberflächen des
GESIS-ZA (Datenbestandskatalog,
ZACAT,
ZA
Q-Base) und seiner Datenschwerpunkte im
Internet zur Verfügung.
8. Bereitstellung der Daten
Die Bestellung von Daten und Kontextinformationen erfolgt im Rahmen der
Benutzungs- und Gebührenordnung (Überblick) und ist postalisch und über das
Internet möglich. Weitere Informationen zur Auswahl und Bereitstellung von Daten und Dokumenten sowie deren Bezug sind in einer
gesonderten Übersicht zusammengestellt.
© GESIS Oliver Watteler
14.12.2007
|