Version: 02.05.2005 ------------------------------------------------------------------------- - - - Informationen zum Mikrozensus 1997 und Hinweise zur - - Verarbeitung des Setups zum Einlesen der Daten - - - ------------------------------------------------------------------------- Inhalt - Was ist der Mikrozensus? - Datenerhebung - Stichprobe - Erhebungsprogramm - Besonderheiten - Zugang zum Mikrozensus - Service-Angebot des German Microdata Lab bei ZUMA - Hinweise zur Verarbeitung des Setups - Recodierungen der Missing-Kategorien - Besonderheiten des Setups Mikrozensus 1997 - Hochrechnung, Gewichtung, Vergleich mit Veroeffentlichungen des Statistischen Bundesamtes - Pruefung des eingelesenen Materials Mikrozensus 1997 - Uebersicht der Merkmale des Mikrozensus 1997 - Hinweise auf Materialien zum Mikrozensus ------------------------------------------------------------------------- Was ist der Mikrozensus? Der Mikrozensus ist eine repraesentative 1-Prozent-Bevoelkerungs- stichprobe, die bereits seit 1957 in Westdeutschland und seit 1991 auch in den neuen Bundeslaendern erhoben wird. Sie umfasst 1997 Informationen zu bevoelkerungs-und arbeitsmarktstatistischen Strukturdaten von ca. 816.000 Personen in 370.000 Haushalten. ------------------------------------------------------------------------- Datenerhebung Die Daten des Mikrozensus 1997 wurden in der Berichtswoche vom 21. bis 27.April 1997 durch die Statistischen Landesaemter erhoben. Die Befragung findet im Regelfall muendlich statt, ein kleiner Teil erfolgt mittels schriftlicher Auskunft der Befragten. Fuer alle Beteiligten besteht gemaeß der gesetzlichen Regelungen Auskunftspflicht. Nur wenige Fragen sind freiwillig zu beantworten. Der Mikrozensus ist eine Haushaltsstichprobe, d.h. alle Personen in einem Haushalt werden entweder direkt befragt, bzw. eine erwachsene Person gibt Auskunft ueber die weiteren (alle minderjaehrigen) Haushaltsmitglieder. Der Mikrozensus umfasst auch auslaendische Haushalte. Zur Erhebung ihrer Angaben wird der gleiche Fragebogen verwendet wie bei deutschen Haushalten. Die Daten werden schließlich von den Statistischen Landesaemtern aufbereitet und beim Statistischen Bundesamt zu einem Datensatz zusammengespielt. ------------------------------------------------------------------------- Stichprobe Fuer den Mikrozensus 1997 gilt das Stichprobendesign von 1990. Die Stichprobe wurde aus dem Datenmaterial der Volkszaehlung 1987 gezogen. Das stichprobenmethodische Grundkonzept des Mikrozensus ist die einstufige Klumpenstichprobe. Die Klumpen sind Auswahlbezirke, die ganze Gebaeude oder Gebaeudeteile umfassen. Zur Verbesserung der Regionalisierbarkeit wurde die durchschnittliche Groeße der Auswahlbezirke 1990 verkleinert. Ein Auswahlbezirk umfasst durchschnittlich 9 Wohnungen (vor 1990: 23 Wohnungen). Jaehrlich wird die Stichprobe durch eine Ergaenzungsauswahl der Bautaetigkeitsstatistik aktualisiert, um z.B. Neubauten zu erfassen. Waehrend fuer das fruehere Bundesgebiet die Grundauswahl auf der Basis der Volkszaehlung 1987 vorgenommen werden konnte, war fuer die neuen Bundeslaender die Volkszaehlung 1981 als Auswahlgrundlage zu alt. Aus diesem Grund wurde in den neuen Bundeslaendern und Ost-Berlin das "Bevoelkerungsregister Statistik" in einem weitgehend analogen Verfahren zur Abgrenzung der Auswahleinheiten herangezogen. Im Mikrozensus 1997 sind Informationen zum Auswahlbezirk, der Gebaeudeschicht und der Bogenart enthalten. Zur intensiveren Nutzung der Daten steht jetzt auch die Zahl der Haushalte in der Wohnung zur Verfuegung. ------------------------------------------------------------------------- Erhebungsprogramm Das Fragenprogramm des Mikrozensus besteht aus einem gleichbleibenden Grundprogramm, das soziooekonomische Grundinformationen liefert und die laufende Beobachtung des Arbeitsmarktes ermoeglicht. Im Grundprogramm, das sich an alle Haushalte richtet, sind im Mikrozensus 1997 folgende Bereiche enthalten: - Fragen zur Wohnung/zum Haushalt - Fragen zu den Personen im Haushalt - Schulbesuch - Erwerbsbeteiligung - Erste gegenwaertige Erwerbstaetigkeit - Zweite Erwerbstaetigkeit - Arbeitsuche/Arbeitsplatzwechsel - Altersvorsorge - Ausbildung - Pflegeversicherung - Unterhalt, Einkommen Neben den jaehrlich zu erhebenden Merkmalen des Grundprogramms (Auswahlsatz 1%) gibt es eine Reihe weiterer Merkmale, die nur im Abstand von 4 Jahren erhoben werden (Auswahlsatz bis zu 0,5%). Der bislang existierende zwei- bzw. dreijaehrliche Turnus entfaellt mit dem Mikrozensusgesetz vom 17.1.1996 ab 1996. Im Ergaenzungsprogramm 1997 sind folgende zusaetzliche Bereiche enthalten: - Fruehere Erwerbstaetigkeit - Sonderformen der Arbeitszeit - Private und betriebliche Altersversorgung - Aus- und Weiterbildung - Pflegebeduerftigkeit - Vermoegenswirksame Leistungen - Erwerbsbeteiligung ein Jahr vor der Erhebung - Wohnsitz ein Jahr vor der Erhebung ------------------------------------------------------------------------- Besonderheiten Im faktisch-anonymisierten Grundfile sind die Regionalangaben Bundesland und eine vergroeberte Gemeindegroeßenklasse, die nicht fuer die kleinen Bundeslaender Bremen und Saarland ausgewiesen ist, enthalten. Mit Hilfe eines speziellen Codes der Variablen Gemeindegroeßenklasse kann zwischen West- und Ost-Berlin (EF708=9) unterschieden werden. Die Auspraegungen der Variable Nationalitaet werden so aggregiert, dass eine Nationalitaetengruppe in der Grundgesamtheit wenigstens 50.000 Einwohner umfasst. Bei den uebrigen Variablen werden Merkmalsvergroeberungen vorgenommen, damit in den univariaten Randverteilungen jede Auspraegung mindestens 5.000 Faelle in der Grundgesamtheit enthaelt. ------------------------------------------------------------------------- Zugang zum Mikrozensus Der Mikrozensus 1997 kann von unabhaengigen inlaendischen Forschungseinrichtungen als faktisch anonymisierte 70-Prozent- Substichprobe (Scientific Use File) im Rahmen der Vereinbarung zwischen dem Statistischen Bundesamt und dem BMBF (Bundesministerium fuer Bildung und Forschung) zu Sonderkonditionen (Bereitstellungsgebuehr von jeweils 65 Euro) beim Statistischen Bundesamt erworben werden. Die Mikrozensen 1989, 1991, 1993, 1995, 1996 bis 2002 koennen zu gleichen Konditionen beim Statistischen Bundesamt bestellt werden. ------------------------------------------------------------------------- Service-Angebot des German Microdata Lab bei ZUMA Das vorliegende Setup ist ein zentrales Serviceangebot des German Microdata Lab (GML) von ZUMA zum Einlesen der faktisch-anonymisierten Daten des Mikrozensus 1999. Fuer Interessenten und Nutzer des Mikrozensus besteht die Moeglichkeit sich an das GML zu wenden und folgende Serviceleistungen in Anspruch zu nehmen: - Beratung, inwieweit der Forschungsplan mit Daten aus dem Mikrozensus zu realisieren ist, - Beratung und evtl. Unterstuetzung beim Verfassen des Antrags (Forschungsplans), - Beratung zu technischen Fragen (EDV-Voraussetzungen, Datensicherheit etc.) und Beratung zu Auswertungs- und Analysefragen. Fuer weitere Informationen zum Mikrozensus siehe: http://www.gesis.org/Dauerbeobachtung/GML/index.htm ------------------------------------------------------------------------- Hinweise zur Verarbeitung des Setups     Das Stata-Setup beruht auf dem SPSS-Setup und wurde mit Hilfe des Programmes StatTrans automatisch erstellt. Dadurch sind die Variable und Value Labels gekuerzt bzw. abgeschnitten. Vollstaendige Labellisten finden sich z.B. in der Datendokumentation, im Internet und im SPSS-Setup.  Das Stata-Setup setup_97.do erfuellt folgende Aufgaben: - Einlesen der Rohdaten, wie sie vom StBA bereitgestellt werden - Umwandeln von alphanumerischen Variablen in numerische Variablen - Ersetzen von fehlenden Werten (Blanks, @) - Recodieren der Missing Values - Umformatierung des Hochrechnungsfaktors - Hinzufuegen der Variable Labels - Hinzufuegen der Value Labels - Speichern des endgueltigen Stata-Systemfile Das Rohdatenfile des StBA enthaelt alle Variablen des Mikrozensus 1997. Damit das obige Stata-Setup fuer jede moegliche Variablen-Auswahl verwendbar ist, wurden alle Variablen erfasst. Variablen, die Sie nicht bestellt haben, sind in Ihrem Rohdatenfile auf 0 oder BLANK gesetzt. Um einen Systemfile zu erzeugen, der nur die von Ihnen bestellten Variablen enthaelt, fuegen Sie im Stata-Setup (setup_97.do) vor der save-Zeile den Ausdruck keep + Variablennamen hinzu und nennen dort Ihre bestellten Variablen. Beispiel: keep ef1 ef2 save Mz97.dta Stata benoetigt fuer temporaere Operationen ca. das Dreifache des Plattenplatzes des Rohdatenfiles. D.h. es sollten ca. 500 MB Plattenplatz zur Verfuegung stehen. ------------------------------------------------------------------------- Recodierungen und Missing-Kategorien im Mikrozensus 1997 im Vergleich zum Schluesselverzeichnis Im Setup des Mikrozensus 1997 wurde groeßtenteils auf Recodierungen verzichtet. Recodierungen wurden nur vorgenommen, um den im Rohdatensatz nicht gekennzeichneten Missings einen numerischen Wert zu zuordnen. Im Folgenden wird die Systematik dieser Recodierungen kurz vorgestellt: 1. Soweit die 0 in den einzelnen Variablen nicht vergeben ist, wird die Missing-Kategorie mit der 0 gekennzeichnet. 2. Ist die 0 besetzt, so wird die Missing-Kategorie mit der 9 oder der 99 gekennzeichnet. 3. Ist auch die 9 in der Variable schon vergeben, so wird die 8 gewaehlt. ------------------------------------------------------------------------- Der Mikrozensus 1997 weist zwei Besonderheiten auf: 1. Es finden sich im Datensatz des Scientific Use Files 1997 bei einigen Variablen einzelne Faelle, die nicht einer der vorhandenen Kategorien zugeordnet sind. Diese werden, soweit moeglich, im Setup direkt mit der Missing-Kategorie "Entfaellt" zusammengefasst oder aber extra als Missing ausgewiesen. 2. Bei der Kontrolle der Variable EF668 (Beruf fruehere Erwerbstaetigkeit nach ISCO88 (COM)) fiel auf, dass im Rohdatensatz neben der Missingkategorie "leer" noch eine weitere, nicht weiter spezifizierte Kategorie mit der Auspraegung "0" auftaucht, die im Schluesselverzeichnis nicht naeher beschrieben wurde. Durch einige Tests konnten diese beiden Gruppen unterschieden und genauer spezifiziert werden. Welche Personen sich in der Kategorie "0" bzw. "leer" (codiert mit 999) befinden, wurde im Schluesselverzeichnis ergaenzt. Darueber hinaus gibt es jedoch 10939 ungeklaerte Faelle, bei denen nicht klar ersichtlich ist, warum ihnen fuer die ISCO88 (COM) keine Auspraegung zugeschrieben wurde. Denn diese Faelle haben sowohl bei der Angabe zur frueheren Erwerbstaetigkeit sowie des Berufs der frueheren Erwerbstaetigkeit nach KldB (ef114) gueltige Werte. ------------------------------------------------------------------------- Hochrechnung, Gewichtung und Vergleich mit den Veroeffentlichungen des Statistischen Bundesamtes ollen die Ergebnisse von Haeufigkeitsauszaehlungen der 70%- Stichprobe mit Veroeffentlichungen des Statistischen Bundesamtes zum Mikrozensus 1997 verglichen werden, muss der entsprechende Hochrechnungsfaktor (Gewicht) des Mikrozensus (EF750, EF751, EF755) verwendet werden. Vgl. hierzu: http://www.gesis.org/Dauerbeobachtung/GML/Daten/MZ/mz_1997/ hochrechnungsfaktoren_mz97.htm EF750 Personenbezogener Hochrechnungsfaktor EF751 Haushaltsfaktor EF755 Personenbezogener Hochrechnungsfaktor fuer die disproportionale 0,45%-Unterstichprobe /Ergaenzungsprogramm (Der Auswahlsatz der Unterstichprobe liegt auf Regierungsbezirksebene bei 0,4%, 0,6%, 0,8% oder 1% und betraegt im Bundesdurchschnitt 0,45%). Um auf 1% der Bevoelkerung hochzurechnen, wird der Hochrechnungsfaktor mit 100/70 multipliziert (z.B. gen gewicht = ef750/0.7; tabulate [iw=gewicht]). In den Fachserien des Statistischen Bundesamtes werden die Ergebnisse meist auf die gesamte Bevoelkerung hochgerechnet. Zur Herstellung der Vergleichbarkeit muessen in diesem Fall Ergebnisse eigener Berechnungen noch zusaetzlich zur Hochrechnung und Gewichtung mit 100 multipliziert werden. Weiterhin sind zum Vergleich mit den vom Statistischen Bundesamt veroeffentlichten Zahlen die jeweiligen Bevoelkerungs-, und Erwerbskonzepte durch entsprechende Filterungen bzw. Selektionen (z.B. tabulate if (...) ) zu beruecksichtigen: Bevoelkerungs-/ Erwerbskonzept und Filterung / Selektion: 'Bevoelkerung in Privathaushalten': (EF506==1) 'Bevoelkerung in Privathaushalten am Ort der Hauptwohnung': (EF505==1 | EF505==2) 'Erwerbstaetige': (EF504==1 & (EF505==1 | EF505==2)) 'Erwerbslose' nach Mikrozensus (ohne Verfuegbarkeitskriterium): ((EF504==2 | EF504==3) & (EF505==1 | EF505==2)) 'Erwerbslose' nach ILO (mit Verfuegbarkeitskriterium): (EF504==2 & (EF505==1 | EF505==2)) 'Nichterwerbspersonen': (EF504==4 & (EF505==1 | EF505==2)) 'Erwerbstaetige (EU-Arbeitskraefteerhebung, 0,45% Substichprobe)': (EF504==1 & (EF505==1 | EF505==2) & EF738==1) ------------------------------------------------------------------------- Pruefung des eingelesenen Materials Mikrozensus 1997 Zur Pruefung, ob der Rohdatensatz des faktisch anonymisierten Materials Mikrozensus 1997 fehlerfrei eingelesen wurde, kann die folgende Fallzahl (ohne Gewichtung, ohne Selektion) mit der des eingelesenen Datensatzes verglichen werden. Unterscheiden sich die Fallzahlen, weist dies auf einen Fehler beim Einlesen hin. (Anmerkung: Handelt es sich um unterschiedliche Stichproben, koennen sich die Fallzahlen ebenfalls unterscheiden.) Fallzahl Mikrozensus 1997 (ohne Gewichtung, ohne Selektion)= 509892 ------------------------------------------------------------------------- Uebersicht der Merkmale des Mikrozensus 1997 Erhebungseinheiten: Haushalte/Personen Zuordnung Person/Haushalt: Personen mit mehreren Haushalten werden dem Haushalt zugerechnet, der ihre Hauptwohnung ist. Haupt- wohnung eines verheirateten Einwohners, der nicht dauernd von seiner Familie getrennt lebt, ist die vorwiegend benutzte Wohnung seiner Familie Erhebungsverfahren: Interview, zu ca. 80% muendlich und zu ca. 20% schriftlich (Selbstausfueller) Aufbereitungseinheiten: Person, Haushalt Auswahlverfahren: Einstufig geschichtete Stichprobe Schichtungsmerkmale: nach Bundesland, Regierungsbezirk, Anpassungsschicht, Regional- schicht, Gebaeudeschicht Auswahleinheiten: Zaehlbezirke (i.d.R. zusammen- liegende Gebaeude bzw. Gebaeude- teile); ein Auswahlbezirk verbleibt vier Jahre in der Stichprobe, in jedem Jahr scheidet 1/4 der Auswahlbezirke aus (rotierendes Panel) Stichprobenumfang: ca. 370.000 Haushalte, ca. 816.000 Personen Auswahlgrundlage: Volkszaehlung 1987, unter Beruecksichtigung der Neubautaetig- keit (alte Bundeslaender), Bevoelkerungsregister Statistik (neue Bundeslaender/Ost-Berlin) Auswahlsatz: 1 Prozent Auswahltechnik: Systematische Ziehung mit Zufallsstart Scientific Use File Das Scientific Use File (Grundfile) ist eine faktisch-anonymisierte 70%- Substichprobe der Haushalte der Mikrozensus-Daten 1997, bei der alle Personen eines ausgewaehlten Haushaltes in das Scientific Use File aufgenommen werden. Gezogen wird die Stichprobe durch a) Anordnen nach Land, Regierungsbezirk, Gemeindegroeßenklasse und Haushaltsgroeße, b) Durchnumerieren der Haushalte, sowie c) Ziehen aller Saetze, die nicht die Endziffern 2, 5 und 9 einer ganzzahligen Zufallszahl haben. Gewicht in der Stichprobe: Im Grundfile liegen zur Hoch- rechnung personen- , haushalts- bzw. familienspezifische Hoch- rechnungsfaktoren (Gewichte) vor: EF750,EF751, EF755. (s.u.) Regionalinformationen: Die Datei enthaelt an Regional- informationen Angaben zum Bundes- land und zur Gemeindegroeßen- klassen sowie zum Auswahlbezirk. ------------------------------------------------------------------------- Hinweise auf Materialien zum Mikrozensus: Informationen zum Mikrozensus und seiner Konzeption: Emmerling, Dieter/Riede, Thomas (1997): 40 Jahre Mikrozensus. Wirtschaft und Statistik (3):160-174. Heidenreich, H.-J.: Hochrechnung des Mikrozensus ab 1990. In: Gabler, S./Hoffmeyer-Zlotnik, J./Krebs, D. (Hrsg.): Gewichtung in der Umfragepraxis. Westdeutscher Verlag, Opladen 1994, S. 112-123. Meyer, Kurt: Zum Auswahlplan des Mikrozensus ab 1990. In: Gabler, S./Hoffmeyer-Zlotnik, J./Krebs, D. (Hrsg.): Gewichtung in der Umfragepraxis. Westdeutscher Verlag, Opladen 1994, S. 106-111. Statistisches Bundesamt (Hrsg.): Arbeitsunterlagen zum Mikrozensus. Das Erhebungsprogramm des Mikrozensus seit 1957. Wiesbaden, September 1997. Statistisches Bundesamt (Hrsg.): Inhaltliche Fragen bevoelkerungsstatistischer Stichproben am Beispiel des Mikrozensus. Bericht zur Konferenz vom 21. und 22. Oktober 1988. Heft 10 der Schriftenreihe Ausgewaehlte Arbeitsunterlagen zur Bundesstatistik. Wiesbaden 1989. Hartmann, P.: Der Mikrozensus als Datenquelle fuer die Sozialwissenschaften. ZUMA-Nachrichten Nr. 24, Mai 1989: 6-25. Schmidt, S.: Erwerbstaetigkeit im Mikrozensus. Konzept, Definition, Umsetzung. ZUMA-Arbeitsbericht 2000/01 Luettinger, P./Riede, T.: Der Mikrozensus: amtliche Daten fuer die Sozialforschung, ZUMA-Nachrichten Nr. 41, November 1997: 19-43. Zur Weitergabe faktisch anonymisierter Einzeldaten: Mueller, W./Blien, U./Knoche, P./Wirth, H.: Die Faktische Anonymitaet von Mikrodaten, (Band 19 der Schriftenreihe Forum der Bundesstatistik). Metzler-Poeschel, Stuttgart 1991. Wirth, H.: Die faktische Anonymitaet von Mikrodaten: Ergebnisse und Konsequenzen eines Forschungsprojektes. ZUMA-Nachrichten Nr. 30, Mai 1992. Zur Fehlerrechnung im Mikrozensus: Statistisches Bundesamt (1998): Bevoelkerung und Erwerbstaetigkeit, Fachserie 1, Reihe 4.1.1, Stand und Entwicklung der Erwerbstaetigkeit 1997 (Ergebnisse des Mikrozensus), Stuttgart: Metzler-Poeschel. Krug, W./ Nourney, M./Schmidt, J.: (1994): Wirtschafts- und Sozialstatistik. Gewinnung von Daten. Muenchen: Oldenbourg (3. voellig neubearb. Auflage) [s. insbes. Seite 242-246] Ergebnisse des Mikrozensus 1997: Statistisches Bundesamt (1998): Bevoelkerung und Erwerbstaetigkeit, Fachserie 1, Reihe 3, Haushalte und Familien 1997 (Ergebnisse des Mikrozensus), Stuttgart: Metzler- Poeschel. Statistisches Bundesamt (1998): Bevoelkerung und Erwerbstaetigkeit, Fachserie 1, Reihe 4.1.1, Stand und Entwicklung der Erwerbstaetigkeit 1997 (Ergebnisse des Mikrozensus), Stuttgart: Metzler-Poeschel. Statistisches Bundesamt (1998): Bevoelkerung und Erwerbstaetigkeit, Fachserie 1, Reihe 4.1.2, Beruf, Ausbildung und Arbeitsbedingungen der Erwerbstaetigen 1997 (Ergebnisse des Mikrozensus), Stuttgart: Metzler-Poeschel. Darueber hinaus sind Veroeffentlichungen in der Zeitschrift 'Wirtschaft und Statistik' des Statistischen Bundes- amtes zu finden. ------------------------------------------------------------------------- Autorin: Simone Schmidt Zentrum fuer Umfragen, Methoden und Analysen (ZUMA) German Microdata Lab B2,1 68159 Mannheim Ergaenzungen: Helga Christians Februar 2004. Julia H. Schroedter Juli 2004. Ergaenzungen zu Stata: Tobias Hubert, August 2004 -------------------------------------------------------------------------