Version: 02.05.2005 ------------------------------------------------------------------------- - - - Informationen zum Mikrozensus 1995 und Hinweise zur - - Verarbeitung des Setups zum Einlesen der Daten - - - ------------------------------------------------------------------------- Inhalt: - Was ist der Mikrozensus? - Datenerhebung - Stichprobe - Erhebungsprogramm - Besonderheiten - Zugang zum Mikrozensus - Service-Angebot des German Microdata Lab bei ZUMA - Hinweise zur Verarbeitung des Setups - Recodierungen und Missing-Kategorien im Mikrozensus 1995 im Vergleich zum Schluesselverzeichnis - Besonderheiten des Setups Mikrozensus 1995 - Hochrechnung, Gewichtung, Vergleich mit Veroeffentlichungen des Statistischen Bundesamtes - Pruefung des eingelesenen Materials - Uebersicht der Eigenschaften des Mikrozensus - Hinweise auf Materialien zum Mikrozensus ------------------------------------------------------------------------- Was ist der Mikrozensus?  Der Mikrozensus ist eine repraesentative 1-Prozent-Bevoelkerungs- stichprobe, die bereits seit 1957 in Westdeutschland erhoben wird. Im Jahre 1991 wurden erstmals auch die neuen Bundeslaender mit einbezogen. Die Stichprobe umfasst 1995 Informationen zu bevoelkerungs- und arbeitsmarktstatistischen Strukturdaten von ca. 800.000 Personen in 350.000 Haushalten. ------------------------------------------------------------------------- Datenerhebung    Die Daten des Mikrozensus 1995 wurden in der Berichtswoche vom 24. bis 30. April 1995 durch die Statistischen Landesaemter erhoben. Die Befragung findet im Regelfall muendlich statt, ein kleiner Teil erfolgt mittels schriftlicher Auskunft der Befragten. Fuer alle Beteiligten besteht gemaeß der gesetzlichen Regelungen Auskunftspflicht. Nur wenige Fragen sind freiwillig zu beantworten. Der Mikrozensus ist eine Haushaltsstichprobe, d.h. alle Personen in einem Haushalt werden entweder direkt befragt, bzw. eine erwachsene Person gibt Auskunft ueber die weiteren (alle minderjaehrigen) Haushaltsmitglieder. Der Mikrozensus umfasst auch auslaendische Haushalte. Zur Erhebung ihrer Angaben wird der gleiche Fragebogen verwendet wie bei deutschen Haushalten. Die Daten werden schließlich von den Statistischen Landesaemtern aufbereitet und beim Statistischen Bundesamt zu einem Datensatz zusammengespielt. ------------------------------------------------------------------------- Stichprobe    Mit dem Mikrozensus 1990 wurde ein neuer Stichprobenplan eingefuehrt. Das stichprobenmethodische Grundkonzept des Mikrozensus ist nach wie vor die einstufige Klumpenstichprobe. Innerhalb eines Auswahlbezirkes werden alle Haushalte befragt. Grundlage fuer die Auswahlbezirke sind ganze Gebaeude oder bei groeßeren Gebaeuden Gebaeudeteile. Die Gebaeude der Auswahlgrundlage wurden dabei nach der Zahl ihrer Wohnungen in drei Groeßenklassen bzw. Schichten eingeteilt, zusaetzlich wurden Gebaeude mit vermuteten Gemeinschaftsunterkuenften einer Sonderschicht zugeordnet. Im Gegensatz zum frueheren Stichprobenplan ergebe sich fuer die einzelnen Schichten eine geringere Durchschnittsgroeße, im Jahre 1989 umfasste eine Schicht noch durchschnittlich 23 Wohnungen, im Auswahlplan 1990 nur noch durchschnittlich 9 Wohnungen. Zusaetzlich wurde eine staerkere regionale Schichtung eingefuehrt. Als regionale Schichten wurden Raumeinheiten von durchschnittlich ca. 350.000 Einwohnern herangezogen. In den alten Bundeslaendern ergaben sich 170, in den neuen Bundeslaendern 31 regionale Schichten. Auf Grund dieser Umstellung auf staerkere regionale Schichtung und die Reduzierung der Klumpengroeße sind die Angaben nun staerker regionalisierbar und auch unterhalb der Regierungsbezirksebenen aussagekraeftig. In den alten Bundeslaendern basiert die Grundauswahl auf den Daten der Volkszaehlung 1987; in den neuen Bundeslaendern und Ostberlin wurden hingegen die Daten des "Bevoelkerungsregisters Statistik" herangezogen. Die Neubautaetigkeit wird entsprechend beruecksichtigt. ------------------------------------------------------------------------- Erhebungsprogramm     Das Fragenprogramm des Mikrozensus besteht aus einem gleichbleibenden Grundprogramm, das soziooekonomische Grundinformationen liefert und die laufende Beobachtung des Arbeitsmarktes ermoeglicht. Im Grundprogramm, das sich an alle Haushalte richtet, sind im Mikrozensus 1995 folgende Bereiche enthalten: - Fragen zur Wohnung/zum Haushalt - Fragen zu den Personen im Haushalt - Schulbesuch - Ausbildung - Erwerbsbeteiligung - Erste gegenwaertige Erwerbstaetigkeit - Zweite Erwerbstaetigkeit - Arbeitsuche/Arbeitsplatzwechsel - Unterhalt, Einkommen - Altersvorsorge - Krankenversicherung Neben den jaehrlich zu erhebenden Merkmalen des Grundprogramms (Auswahlsatz 1%) gibt es eine Reihe weiterer Merkmale, die mit einem Auswahlsatz bis zu 0,5% in einem Ergaenzungsprogramm erhoben werden.  Im Ergaenzungsprogramm 1995 sind folgende zusaetzliche Bereiche enthalten: - Aus- und Weiterbildung - Zusatzangaben fuer Auslaender - Wohnsituation der Haushalte - Fragen zur Gesundheit - Behinderteneigenschaften - Private und betriebliche Altersvorsorge - EG - Arbeitskraefte Stichprobe ------------------------------------------------------------------------- Besonderheiten       Im Grundfile sind die Regionalangaben Bundesland und eine vergroeberte Gemeindegroeßenklasse, die aus Anonymisierungsgruenden z.T. zusammengefasst wurden, enthalten. Die Auspraegungen der Variable Nationalitaet werden so aggregiert, dass eine Nationalitaetengruppe in der Grundgesamtheit wenigstens 50.000 Einwohner umfasst. Bei den uebrigen Variablen werden Merkmalsvergroeberungen vorgenommen, damit in den univariaten Randverteilungen jede Auspraegung mindestens 5.000 Faelle in der Grundgesamtheit enthaelt.   ------------------------------------------------------------------------- Zugang zum Mikrozensus     Der Mikrozensus 1989 kann von unabhaengigen inlaendischen Forschungs- einrichtungen als faktisch anonymisierte 70-Prozent-Substichprobe (Scientific Use File) im Rahmen der Vereinbarung zwischen dem Statistischen Bundesamt und der GESIS zu Sonderkonditionen (Bereitstellungsgebuehr von jeweils 65 Euro) beim Statistischen Bundesamt erworben werden. Die Mikrozensen 1989, 1991, 1993, 1996 - 2002 sind zu gleichen Konditionen zugaenglich. ------------------------------------------------------------------------- Service-Angebot des German Microdata Lab bei ZUMA      Das vorliegende Setup zum Einlesen der faktisch-anonymisierten Daten des Mikrozensus 1995 ist ein zentrales Serviceangebot des German Microdata Lab (GML) von ZUMA. Fuer Interessenten und Nutzer des Mikrozensus besteht die Moeglichkeit, sich an das GML zu wenden und folgende Service- leistungen in Anspruch zu nehmen: - Beratung, inwieweit der Forschungsplan mit Daten aus dem Mikrozensus zu realisieren ist, - Beratung und evtl. Unterstuetzung beim Verfassen des Antrags (Forschungsplans), - Beratung zu technischen Fragen (EDV-Voraussetzungen, Datensicherheit etc.) und - Beratung zu Auswertungs- und Analysefragen. siehe auch: http://www.gesis.org/Dauerbeobachtung/GML/index.htm    ------------------------------------------------------------------------- Hinweise zur Verarbeitung des Setups   Das Stata-Setup beruht auf dem SPSS-Setup und wurde mit Hilfe des Programmes StatTrans automatisch erstellt. Dadurch sind die Variablen und Value Labels gekuerzt bzw. abgeschnitten.Vollstaendige Labellisten finden sich z.B. in der Datendokumentation, im Internet und im SPSS-Setup.    Das Stata-Setup setup_95.do erfuellt folgende Aufgaben: - Einlesen der Rohdaten, wie sie vom StBA bereitgestellt werden - Umwandeln von alphanumerischen Variablen in numerische Variablen - Ersetzen von fehlenden Werten (Blanks, @) - Umformatierung des Hochrechnungsfaktors - Recodieren der Missing Values - Hinzufuegen der Variable Labels - Hinzufuegen der Value Labels - Speichern des endgueltigen Stata-Systemfile Das Rohdatenfile des StBA enthaelt alle Variablen des Mikrozensus 1995. Damit das obige Stata-Setup fuer jede moegliche Variablen-Auswahl verwendbar ist, wurden alle Variablen erfasst. Variablen, die Sie nicht bestellt haben, sind in Ihrem Rohdatenfile auf 0 oder BLANK gesetzt. Um einen Systemfile zu erzeugen, der nur die von Ihnen bestellten Variablen enthaelt, fuegen Sie im Stata-Setup (setup_95.do) vor der save-Zeile den Ausdruck keep + Variablennamen hinzu und nennen dort Ihre bestellten Variablen. Beispiel: keep ef1 ef2 save Mz95.dta Stata benoetigt fuer temporaere Operationen ca. das Dreifache des Plattenplatzes des Rohdatenfiles. D.h. es sollten ca. 500 MB Plattenplatz zur Verfuegung stehen. ------------------------------------------------------------------------- Recodierungen und Missing-Kategorien im Mikrozensus 1995 im Vergleich zum Schluesselverzeichnis Im Setup des Mikrozensus 1995 wurde groeßtenteils auf Recodierungen verzichtet. Recodierungen wurden nur vorgenommen, um den im Rohdatensatz nicht gekennzeichneten Missings einen numerischen Wert zu zuordnen. Die Missing-Kategorien im Schluesselverzeichnis werden durch das Stata-Setup nicht in Systemmissings umgewandelt. Den Missing-Kategorien werden stattdessen numerische Werte zugeordnet. Im Folgenden wird die Systematik dieser Recodierungen kurz vorgestellt: 1. Soweit die 9 bzw. 99 oder 999 in den einzelnen Variablen nicht vergeben ist, wird die Missing-Kategorie mit diesen Zahlen bezeichnet. 2. Ist die 9 bzw. 99 oder 999 besetzt, so wird die Missing-Kategorie mit der 0 gekennzeichnet. 3. Ist auch die 0 in der Variable schon vergeben, so wird die 8 bzw. die 98 oder 998 gewaehlt. Lediglich in den Variablen EF221 und EF231 (Arbeitszeittyp) wurden weitere Recodierungen vorgenommen. Hier wird die Luecke innerhalb der Zahlenfolge geschlossen (1,2,3,4,5,7,8,9, 0 und "leer" wurde zu 1,2,3,4,5,6,7,8,0 und 9 als Missing-Kategorie) ------------------------------------------------------------------------- Besonderheiten des Setups Mikrozensus 1995 Der Mikrozensus 1995 weist drei Besonderheiten auf: 1. Im Gegensatz zu Scientific Use Files (SUF) aus anderen Jahrgaengen sind im SUF 1995 oftmals die Kategorien "ohne Angabe" und "entfaellt" in eine Missing-Kategorie zusammengefasst. 2. Es finden sich im Datensatz des SUF 1995 bei einigen Variablen einzelne Faelle, die nicht einer der vorhandenen Kategorien zugeordnet sind. Diese werden, soweit moeglich, im Setup direkt mit der Missing-Kategorie "Entfaellt" zusammengefasst oder aber extra als Missing ausgewiesen. 3. In der Bandsatzerweiterung EF228 "ueberwiegender Lebensunterhalt, Ehefrau der Familienbezugsperson" befinden sich im Rohdatenfile die zusaetzlichen Auspraegungen "8" und "9", die laut Schluesselverzeichnis in der Kategorie "1 (Erwerbstaetigkeit, Berufstaetigkeit)" zusammengefasst sein sollten. In den Kategorien "8" und "9" befinden sich entsprechend auch nur erwerbstaetige/ berufstaetige Personen. Fuer die Analyse empfiehlt es sich daher, die drei Kategorien "1", "8" und "9" zusammenzufassen. In der Bandsatzerweiterung EF226 "Wirtschaftszweig der Ehefrau der Familienbezugsperson" gibt es geringe Abweichungen zur Variable EF92 "Wirtschaftszweig". Einige Personen, die in der Variablen EF92 eine gueltige Angabe haben, sind in der EF226 der Kategorie "entfaellt" zugeordnet. Zur Behebung dieses Problems vergleiche: Schimpl-Neimanns, B./Schmidt, K., 1997: Konstruktion von Bandsatz-Erweiterungen zum Haushalt und zur Familie im Mikrozensus mittels satzuebergreifenden Operationen in SPSS. ZUMA-Technischer Bericht Nr. 97/08. ------------------------------------------------------------------------- Hochrechnung, Gewichtung und Vergleich mit den Veroeffentlichungen des Statistischen Bundesamtes      Sollen die Ergebnisse von Haeufigkeitsauszaehlungen der 70%-Stichprobe mit Veroeffentlichungen des Statistischen Bundesamtes zum Mikrozensus 1995 verglichen werden, muss der Hochrechnungsfaktor (Gewicht) des Mikrozensus (EF254: "Hochrechnungsfaktor (Haushalts-, Familienfaktor) in der regionalen Anpassungsschicht") verwendet werden.  Um auf 1% der Bevoelkerung hochzurechnen, wird der Hochrechnungsfaktor mit 100/70 multipliziert:  gen gewicht= ef254/0.7; tabulate [iw=gewicht]   Bei Auszaehlungen von Fragen zur Gesundheit und Behinderteneigenschaft, die bei einer 0,5% Stichprobe erhoben wurden, sowie den Fragen zur privaten und betrieblichen Altersvorsorge (0,25% Stichprobe) ist bei der Hochrechnung zusaetzlich der Auswahlsatz der Unterstichprobe zu beruecksichtigen: gen gewicht= ef257u4/0.7/0.5; tabulate [iw=gewicht] bzw. gen gewicht= ef257u4/0.7/0.25; tabulate [iw=gewicht] In den Fachserien des Statistischen Bundesamtes werden die Ergebnisse meist auf die gesamte Bevoelkerung hochgerechnet. Zur Herstellung der Vergleichbarkeit muessen in diesem Fall Ergebnisse eigener Berechnungen noch zusaetzlich zur Hochrechnung und Gewichtung mit 100 multipliziert werden. Weiterhin sind zum Vergleich mit den vom Statistischen Bundesamtes veroeffentlichten Zahlen die jeweiligen Bevoelkerungs- und Erwerbs- konzepte (z.B. tabulate if (...)) zu beruecksichtigen: Bevoelkerungs-/ Erwerbskonzept mit Filterung/ Selektion: 'Bevoelkerung in Privathaushalten': ef27==1 'Bevoelkerung am Ort der Hauptwohnung': ef26==1 | ef26==2 'Privathaushalte': ef27==1 & ef33==1 'Bevoelkerung am Familienwohnsitz': ef28==1 'Familien': ef28==1 & ef30==1 'Erwerbstaetige': ef34>=1 & ef34<=4 & (ef26==1 | ef26==2) 'Erwerbslose' nach MZ (ohne Verfuegbarkeitskriterium): ef34>=5 & ef34<=7 & (ef26==1 | ef26==2) 'Erwerbslose' nach ILO (mit Verfuegbarkeitskriterium): (ef34>=5 & ef34<=7) & (ef26==1 | ef26==2) & (ef68==1) 'Nichterwerbspersonen': (ef34==8 | ef34==9) & (ef26==1 | ef26==2)) ------------------------------------------------------------------------- Pruefung des eingelesenen Materials       Zur Pruefung, ob der Rohdatensatz des faktisch anonymisierten Materials Mikrozensus 1995 fehlerfrei eingelesen wurde, kann die folgende Fallzahl (ohne Gewichtung, ohne Selektion) mit der des eingelesenen Datensatzes verglichen werden. Unterscheiden sich die Fallzahlen, weist dies auf einen Fehler beim Einlesen hin. (Anmerkung: Handelt es sich um unterschiedliche Stichproben, koennen sich die Fallzahlen ebenfalls unterscheiden.) Fallzahl Mikrozensus 1995 (ohne Gewichtung, ohne Selektion)= 512509 ------------------------------------------------------------------------- Uebersicht der Eigenschaften des Mikrozensus 1995:      Erhebungseinheiten: Haushalte/Personen Zuordnung Person/Haushalt: Personen mit mehreren Haushalten werden dem Haushalt zugerechnet, der ihre Hauptwohnung ist. Hauptwohnung eines verheirateten Einwohners, der nicht dauernd von seiner Familie getrennt lebt, ist die vorwiegend benutzte Wohnung seiner Familie Erhebungsverfahren: Interview, in der Regel muendlich Aufbereitungseinheiten: Person, Haushalt Auswahlverfahren: Einstufig geschichtete Stichprobe Schichtungsmerkmale: nach Bundesland, Regierungsbezirk, Anpassungsschicht, Regionalschicht, Gebaeudeschicht Auswahleinheiten: Zaehlbezirke (i.d.R. zusammenliegende Gebaeude bzw. Gebaeudeteile); ein Auswahlbezirk verbleibt vier Jahre in der Stichprobe, in jedem Jahr scheidet 1/4 der Auswahlbezirke aus (rotierendes Panel) Stichprobenumfang: ca. 350.000 Haushalte, ca. 800.000 Personen Auswahlgrundlage: Volkszaehlung 1987 (alte Bundeslaender), Bevoelkerungsregister Statistik (neue Bundeslaender/Ost-Berlin), Aktualisierung unter Beruecksichtigung der Neubautaetigkeit Auswahlsatz: 1 Prozent Auswahltechnik: Systematische Ziehung mit Zufallsstart Hochrechnungsverfahren: In einem zweistufigen Verfahren werden zunaechst die bekannten Ausfaelle kompensiert und dann in einem zweiten Schritt die Stichprobenergebnisse gebunden an Eckzahlen aus der laufenden Bevoelkerungs- fortschreibung hochgerechnet. Diese Hochrechnung erfolgt dabei grundsaetzlich auf der Ebene von bundesweit 123 sogenannten regionalen Anpassungsschichten. Das sind regionale Einheiten mit einer derzeitigen Durchschnittsgroeße von etwa 660.000 Einwohnern. Die Anpassungsklassen werden dabei gebildet durch die Angaben ueber die Zahl von Deutschen und Auslaendern in der Gliederung nach Geschlecht. Die Anpassung fuer Soldaten erfolgt dagegen getrennt auf Regierungsbezirksebene. Scientific Use File: Das Scientific Use File (Grundfile) ist eine faktisch-anonymisierte 70%- Substichprobe der Haushalte der Mikrozensus-Daten 1995, bei der alle Personen eines ausgewaehlten Haushaltes in das Scientific Use File aufgenommen werden. Gezogen wird diese Stichprobe durch a) Anordnen nach Land, Regierungs- bezirk, Gemeindegroeßenklasse und Haushaltsgroeße, b) Durchnumerieren der Haushalte, sowie c) Ziehen aller Saetze, die nicht die Endziffern 2, 5 und 9 einer ganzzahligen Zufallszahl haben. Gewicht in der Stichprobe: Im Grundfile liegt zur Hochrechnung ein Hochrechnungsfaktoren (Gewicht) vor: EF254. Regionalinformationen: Die Datei enthaelt an Regional- informationen Angaben zum Bundesland und zur Gemeindegroeßenklassen. ------------------------------------------------------------------------- Hinweise auf Materialien zum Mikrozensus: Informationen zum Mikrozensus und seiner Konzeption: Emmerling, Dieter/Riede, Thomas (1997): 40 Jahre Mikrozensus. Wirtschaft und Statistik (3): 160-174. Greiner, Ulrich (1996): Erste Ergebnisse des Mikrozensus April 1995. Wirtschaft und Statistik (5): 304-312. Heidenreich, H.-J.,: Hochrechnung des Mikrozensus ab 1990. In: Gabler, S./Hoffmeyer-Zlotnik, J./Krebs, D. (Hrsg.): Gewichtung in der Umfragepraxis. Westdeutscher Verlag, Opladen 1994, S. 112-123. Meyer, Kurt: Zum Auswahlplan des Mikrozensus ab 1990. In: Gabler, S./Hoffmeyer-Zlotnik, J./Krebs, D. (Hrsg.): Gewichtung in der Umfragepraxis. Westdeutscher Verlag, Opladen 1994, S. 106-111. Statistisches Bundesamt (Hrsg.): Arbeitsunterlagen zum Mikrozensus, Wiesbaden, Mai 1990. Statistisches Bundesamt (Hrsg.): Inhaltliche Fragen bevoelkerungs- statistischer Stichproben am Beispiel des Mikrozensus. Bericht zur Konferenz vom 21. und 22. Oktober 1988. Heft 10 der Schriftenreihe Ausgewaehlte Arbeitsunterlagen zur Bundesstatistik. Wiesbaden 1989. Hartmann, P,: Der Mikrozensus als Datenquelle fuer die Sozialwissenschaften. ZUMA-Nachrichten Nr. 24, Mai 1989. Zur Weitergabe faktisch anonymisierter Einzeldaten: Mueller, W./Blien, U./Knoche, P./Wirth, H.: Die Faktische Anonymitaet von Mikrodaten, (Band 19 der Schriftenreihe Forum der Bundesstatistik). Metzler-Poeschel, Stuttgart 1991. Wirth, H.: Die faktische Anonymitaet von Mikrodaten: Ergebnisse und Konsequenzen eines Forschungsprojektes. ZUMA-Nachrichten Nr. 30, Mai 1992. Zur Fehlerrechnung im Mikrozensus: Statistisches Bundesamt (1995): Fachserie 1, Reihe 4.1.1. Stand und Entwicklung der Erwerbstaetigkeit, S. 18-22. Ergebnisse des Mikrozensus 1995: Statistisches Bundesamt (im Erscheinen): Bevoelkerung und Erwerbs- taetigkeit, Fachserie 1, Reihe 3, Haushalte und Familien (Ergebnisse des Mikrozensus), Stuttgart: Metzler-Poeschel. Statistisches Bundesamt (1996): Bevoelkerung und Erwerbstaetigkeit, Fachserie 1, Reihe 4.1.1, Stand und Entwicklung der Erwerbstaetigkeit 1995 (Ergebnisse des Mikrozensus), Stuttgart: Metzler-Poeschel. Statistisches Bundesamt (1996): Bevoelkerung und Erwerbstaetigkeit, Fachserie 1, Reihe 4.1.2, Beruf, Ausbildung und Arbeitsbedingungen der Erwerbstaetigen (Ergebnisse des Mikrozensus), Stuttgart: Metzler-Poeschel. Darueber hinaus sind Veroeffentlichungen in der Zeitschrift 'Wirtschaft und Statistik' des Statistischen Bundesamtes zu finden. ------------------------------------------------------------------------- Matthias Engelhard, Karen Schmidt, Ramona Winkler, April 1997 Vollstaendige ueberarbeitung: Helga Christians, Oktober 2003 Ergaenzungen zu Stata: Tobias Hubert, August 2004 Aktualisierung WWW-Adressen: Kathrin Leim, Mai 2005 ------------------------------------------------------------------------- Zentrum fuer Umfragen, Methoden und Analysen (ZUMA) German Microdata Lab Postfach 12 21 55 68072 Mannheim Tel.: 0621 / 1246-265 Fax: 0621 / 1246-100 E-Mail: mikrodaten@zuma-mannheim.de -------------------------------------------------------------------------