Sie sind hier: Das Institut / Wissenschaftliche Arbeitsbereiche / Dauerbeobachtung der Gesellschaft / German Microdata Lab
03.12.08

GML: German Microdata Lab - Überblick

Servicezentrum für Mikrodaten der GESIS


 


 

Am 1. Juli 2003 wurden die beiden ZUMA-Abteilungen Mikrodaten und Einkommen & Verbrauch in eine neue organisatorische Einheit – das German Microdata Lab - überführt. Damit nahm das vom Gründungsausschuss des Rates für Sozial- und Wirtschaftsdaten vorgeschlagene „Servicezentrum für Mikrodaten der GESIS bei ZUMA“ seine Arbeit auf. 
Gemeinsam mit dem Internationalen Datenservicezentrum am Forschungsinstitut zur Zukunft der Arbeit (IZA, Bonn) und den Forschungsdatenzentren des Statistischen Bundesamtes (Wiesbaden, Bonn), der Statistischen Landesämter, der Bundesagentur für Arbeit (Nürnberg) und dem Forschungsdatenzentrum der Rentenversicherung, ist eine Forschungs- und Servicestruktur für amtliche Mikrodaten entstanden, die vor wenigen Jahren noch undenkbar erschien. Ziel der Einrichtungen ist es, für die empirisch arbeitenden Wirtschafts- und Sozialwissenschaften Mikrodaten der amtlichen Statistik zu erschließen, bereitzustellen und einen umfassenden Service zu den Daten anzubieten.

Die Einrichtung von Forschungsdaten- und Servicezentren geht  auf Empfehlungen der Kommission (Bundesforschungsbericht 2004: 357) zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik (KVI) zurück, die vom BMBF eingesetzt wurde. Neben Eigenleistungen der statistischen Ämter und Institute erfolgt die Finanzierung der Zentren durch das BMBF.


 

Wie es dazu kam

[nach oben]

Die Verwendung von amtlichen Mikrodaten für die Bearbeitung von Forschungsfragen begann, als ab den siebziger Jahren in Folge der Entwicklung der Datenverarbeitung zunehmend auch in der akademischen Forschung die technischen Voraussetzungen gegeben waren, die umfangreichen Mikrodaten der amtlichen Statistik zu verarbeiten.
Vorreiter in der Nutzung solcher Daten waren die Projekte SPES und VASMA sowie der Sonderforschungsbereich 3, in denen eine Vielzahl von Forschungsarbeiten entstanden. Der bis zu diesem Zeitpunkt relativ einfache Zugang zu amtlichen Mikrodaten wurde im Zusammenhang mit öffentlichen Diskussionen über Datenschutz ab Ende der siebziger Jahre deutlich erschwert. Nach dem Bundesstatistikgesetz von 1980 wurden Individualdaten von den statistischen Ämtern nur noch in Form stark aggregierter Tabellen weitergegeben, deren Analysemöglichkeiten erheblich eingeschränkt waren.

Erst mit der Novellierung des Bundesstatistikgesetzes (BStatG) 1987 wurden die rechtlichen Grundlagen für eine verbesserte Datenweitergabe geschaffen. Nach § 16 Abs. 6 BStatG können für die Durchführung wissenschaftlicher Vorhaben von den statistischen Ämtern Einzelangaben an Forschungseinrichtungen übermittelt werden, wenn sie Auskunftsgebenden oder Betroffenen nur mit einem unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft zugeordnet werden können. 
Zur Operationalisierung dieses Konzepts der faktischen Anonymität wurden im Anonymisierungsprojekt (Müller et al. 1991, Kooperation zwischen Universität Mannheim, Statistischem Bundesamt, Statistischen Landesämtern und ZUMA) konkrete Empfehlungen entwickelt, welche die Voraussetzungen für die Bereitstellung von Scientific Use Files des Mikrozensus (ab 1989) und anderer Daten waren. 
Dennoch wurden die Mikrozensusdaten nur von wenigen Forschungseinrichtungen genutzt, da von der amtlichen Statistik sehr hohe Kosten für die Bereitstellung der Daten erhoben wurden. Dies führte zu einer Initiative von Wolfgang Zapf, dem damaligen Vorsitzenden des Kuratoriums der Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen (GESIS), und Walter Müller, der sich weitere Forschungseinrichtungen und einzelne Forscher anschlossen. 
Nach Gesprächen mit dem Statistischen Bundesamt und dem Bundesministerium für Bildung und Forschung (BMBF) konnten ab Ende 1996 insbesondere durch die finanzielle Unterstützung des BMBF die Kostenprobleme für die Mikrozensen 1995 und 1996 gelöst und weitere Scientific Use Files zugänglich gemacht werden. Darüber hinaus haben die GESIS und das Statistische Bundesamt für vier weitere weitere Mikrozensusdaten einen kostengünstigen Datenzugang vereinbart, wobei die GESIS die Grundfinanzierung der Datenbereitstellungskosten übernommen hat. All dies hat bewirkt, dass das Potenzial amtlicher Mikrodaten des Mikrozensus durch die Sozial- und Wirtschaftsforschung seither breiter als zuvor genutzt wird.

Um den Zugang zu kostengünstigen Mikrodaten zu institutionalisieren und darüber hinaus grundlegende Fragen des Verhältnisses zwischen amtlicher Statistik und Wissenschaft zu klären, die im Memorandum zur Situation der empirischen Wirtschaftsforschung thematisiert wurden, wurde von der Bundesministerin für Bildung und Forschung eine Kommission mit dem Auftrag bestellt, Lösungsvorschläge zu einem intensiveren Zusammenwirken von Wissenschaft und Statistik in Bezug auf inhaltliche, institutionelle und ressourcenbezogene Fragestellungen zu erarbeiten. 
Diese „Kommission zur Verbesserung der informationellen Infrastruktur“ (KVI), in der Vertreter der amtlichen Statistik bzw. der öffentlichen Datenproduzenten und Vertreter der Sozial- und Wirtschaftswissenschaften versammelt waren, hat eine Reihe von Vorschlägen erarbeitet, die von institutionellen Regelungen der Kooperation über Empfehlungen zu einzelnen Datenerhebungen, Methodenforschung, Archivierung und Datenschutz reichen, wobei im Mittelpunkt Aspekte des Zugangs zu Mikrodaten stehen. 
Als einen ersten Schritt zur Institutionalisierung der Zusammenarbeit zwischen Wissenschaft und Statistik hat das BMBF einen Ausschuss zur Gründung eines „Rates für Sozial- und Wirtschaftsdaten“ berufen. Dieser Gründungsausschuss hat auf der Grundlage der KVI-Anträge zur Einrichtung von Forschungsdatenzentren bei den Datenproduzenten sowie von in der Forschung verankerten Servicezentren angeregt, evaluiert und dem BMBF zur Förderung empfohlen.


 

Das German Microdata Lab der GESIS   GML-Überblick

[nach oben]

Die Aktivitäten von GESIS zu amtlichen Mikrodaten gehen auf eine Initiative aus der Wissenschaft und einer darauf folgenden Empfehlung des Wissenschaftsrates von 1986 zurück, durch die GESIS beauftragt wurde, beim damaligen ZUMA eine Mikrodatenabteilung als Nachfolgeeinrichtung des VASMA-Projektes einzurichten und forschungsgerechte Nutzungsmöglichkeiten für amtliche Mikrodaten zu schaffen. Ziel war es, diese damals für die empirische Wirtschafts- und Sozialforschung teilweise nur schwierig, teilweise überhaupt nicht nutzbaren Daten zu erschließen, als festen Bestandteil der deutschen Forschungsinfrastruktur zu verankern und für die effiziente Nutzung in der Forschung den notwendigen wissenschaftlichen Service auf der Basis eigener wissenschaftlicher Arbeiten aufzubauen (siehe Pilotprojekt).


 

Wissenschaftliche Dienstleistungen     

[nach oben]

GESIS konzentriert sich bei seinen wissenschaftlichen Dienstleistungen auf die beiden großen Haushaltsstichproben der amtlichen Statistik, den Mikrozensus und die Einkommens- und Verbrauchsstichprobe (EVS). Beide Datenbestände zeichnen sich durch ein hohes Potenzial zur Analyse von für die Sozial- und Wirtschaftswissenschaften zentralen Fragestellungen aus, unter anderen zum Arbeitsmarkt, zur demografischen und sozialen Struktur der Gesellschaft, zur Einkommensverteilung und -verwendung oder zu den Formen des Zusammenlebens. 
Sie bieten aufgrund ihrer regelmäßigen Periodizität mit weitgehend identischen Frageprogrammen interessante Möglichkeiten längsschnittlich angelegter Auswertungen zu Fragen des sozialen und wirtschaftlichen Wandels auf der Basis langer Datenreihen. Neben dem Schwerpunkt des wissenschaftlichen Service zu Scientific Use Files des Mikrozensus und der EVS werden übergreifende Funktionen in Bezug auf amtliche Mikrodaten und deren Erschließung für die gesamte Sozial- und Wirtschaftsforschung wahrgenommen.

Im Zusammenhang mit den Empfehlungen der KVI zum Ausbau der Dateninfrastruktur setzt GESIS in Zusammenarbeit mit der amtlichen Statistik kurz- und mittelfristig zwei Schwerpunkte für die Bereitstellung neuer Scientific Use Files:

Erweiterung der Nutzungsmöglichkeiten des Mikrozensus sowie der Einkommens- und Verbrauchsstichprobe in inhaltlicher und zeitlicher Perspektive.
Zur Deckung des Bedarfs der Forschung an weiteren Daten wird die Bereitstellung von älteren Erhebungen der Einkommens- und Verbrauchsstichprobe (vor 1993) und des Mikrozensus (vor 1989) angestrebt. Des Weiteren sollen beim Mikrozensus die Möglichkeiten der Bereitstellung von Regionalfiles und Panelfiles ausgeschöpft werden.

Unterstützung von Projekten zur Öffnung des Zugangs zu Daten, für die bisher noch keine Anonymisierungskonzepte vorliegen.
Zur Erschließung neuer Datenbasen wird GESIS gemeinsam mit den Datenbesitzern und Forscher/innen in Projekten an Konzepten für Scientific Use Files mitarbeiten und hierbei seine Expertise insbesondere in Form von Beratungen zu verschiedenen Fragen der Umsetzung faktischer Anonymität einbringen. Neben den auf die Primärerschließung der Daten gerichteten generellen Dienstleistungen bietet GESIS in enger Zusammenarbeit mit dem Statistischen Bundesamt einen umfassenden spezifischen Service für die Nutzer der Scientific Use Files des Mikrozensus und der EVS an. Bei diesen spezifischen Angeboten geht es vor allem darum, den Aufwand des Einzelforschers bei der Informationsbeschaffung, der Erarbeitung des datenbezogenen methodischen und inhaltlichen Grundlagenwissens, der Datenaufbereitung und der Datenanalyse zu minimieren und damit die Effizienz der Datennutzung zu steigern. Zu nennen sind u.a.:

  • die Entwicklung von Konzepten zur Filebereitstellung und Gespräche mit den statistischen Ämtern zu deren Umsetzung;

  • Konsistenzprüfungen der Scientific Use Files; diese ergänzen die Datenprüfungen durch die statistischen Ämter, so dass schon im Vorfeld der eigentlichen Datenbereitstellung durch das Amt Datenprobleme erkannt und behoben werden können;

  • die Datenaufbereitung und Datendokumentation entsprechend sozialwissenschaftlicher Standards, wie z.B. Bereitstellung von Setups zur Erstellung von Files im dokumentierten Format, Randverteilungen zur Prüfung der eingelesenen Rohdaten sowie von Metadaten im WWW (Fragebogen, Schlüsselverzeichnis, Klassifikationen und Definitionen der amtlichen Statistik);

  • die Umsetzung forschungsüblicher Konzeptualisierungen, Klassifikationen und Skalen und damit einhergehend die Bereitstellung der hierfür notwendigen Codierungsroutinen für theoriebasierte sozialwissenschaftliche Klassifikationen oder Skalen wie auch sonstiger Hilfsmittel für die Datenanalyse (Mikrodaten-Tools);

  • die individuelle Nutzerberatung zu Datennachweisen und Analysemöglichkeiten aber auch spezifischen Problemen bei der Verwendung von amtlichen Mikrodaten;

  • Sonderauswertungen für externe Forscher sowie die Ermöglichung von Arbeitsaufenthalten als Gastwissenschaftler bei ZUMA für eigene Datenanalysen;

  • Weiterbildungsangebote (Workshops, Nutzerkonferenzen), wobei insbesondere die Nutzerkonferenzen zugleich den Erfahrungsaustausch zwischen den Nutzern und den Austausch zwischen Datennutzern und Datenproduzenten fördern.


 

Forschung und Entwicklung für besseren Service    GML-Überblick

[nach oben]

Voraussetzung für die hohe Qualität der wissenschaftlichen Dienstleistungen sind eigenständige Forschungs- und Entwicklungsarbeiten auf Basis der betreuten Mikrodaten: Sie vermitteln ein allgemeines Hintergrundverständnis und sind unabdingbar für die Theorie- und Methodenkompetenz im Sinne des KVI-Gutachtens. Gleichzeitig fließen ihre Ergebnisse direkt in den wissenschaftlichen Service ein. Die Forschungsarbeiten tragen in Form von Mikrodaten-Tools zur Erweiterung des Analysepotenzials der Mikrodaten bei oder sind, wie beispielsweise die geplanten methodischen Untersuchungen zum Mikrozensus-Panel, mit der Erschließung neuer Scientific Use Files verbunden.

(gekürzte Fassung aus: Lüttinger, P. et al. 2003, ZUMA-Nachrichten 52, 153-172).


 

© GESIS Yvonne Lechert 01.09.2008