Welche Bevölkerungskonzepte müssen verwendet werden, um die Daten
des MZ 1973-87 (ZUMA-Files) mit den Daten des MZ1989 ff. zu
vergleichen?
Mikrozensus Scientific Use Files: 1973,
1976, 1982, 1989ff.
In den Scientific Use Files der
Mikrozensen 1973, 76, 82, 89ff. liegen Informationen zu den einzelnen
Bevölkerungskonzepten der amtlichen Statistik (Wohnbevölkerung,
Bevölkerung in
Privathaushalten, Bevölkerung am Ort der Hauptwohnung, Bevölkerung am
Familienwohnsitz) für jede Person und jeden Haushalt vor (Individualdatensatz).
Mikrozensus ZUMA-Files: 1973, 76, 80,
82, 85, 87
Die Daten der ZUMA-Files der Mikrozensen der Jahre 1973, 76, 80, 82, 85 und 87 liegen als
Aggregatdaten in Form mehrdimensionaler Tabellen
(Merkmalskombinationen von 30 bzw. 40 Variablen) vor. Die Variable Gewicht
enthält die Fallzahlen pro Merkmalskombination. Diese Fallzahlen sind
bereits an die Ergebnisse der laufenden Bevölkerungsfortschreibung angepasst.
Die Anpassung der Fallzahlen erfolgte bis
einschließlich 1982 auf der Basis des Konzepts "Wohnbevölkerung"
und ab 1985 auf der Basis des äquivalenten Konzepts "Bevölkerung am
Ort der Hauptwohnung".
Um vergleichende Auswertungen der
Scientific Use Files mit den
ZUMA-Files durchzuführen, ist in den MZ ab 1989 eine Fallselektion nach der
Eigenschaft "Bevölkerung am Ort der Hauptwohnung" (Mikrozensen
1989-1995: EF26<>3 ; Mikrozensen 1996ff: EF505<>3) bzw.
"Wohnbevölkerung" (MZ73, 76, 82: EF58<>2)
vorzunehmen.
|
Wie müssen die einzelnen Stichproben der Mikrozensen gewichtet werden,
um vergleichend auszuwerten?
Mikrozensus: Scientific Use Files
SUF 1973, 1976, 1982
Die Daten der Scientific Use Files von 1973, 76 und 82 entsprechen einer 70%
Substichprobe des Mikrozensus.
Die Anpassung der Mikrozensusergebnisse an die laufende
Bevölkerungsfortschreibung erfolgte nicht -wie bei den neueren
Mikrozensen- durch eine Gewichtung, sondern durch das Doppeln und Streichen von
Personen (Personenebene) (EF76). Die sog. Eckwerte, an welche der
Mikrozensus angepasst wird, sind die aus der Bevölkerungsfortschreibung
gewonnene Zahl von Personen, gegliedert nach Deutschen/Ausländern,
Geschlecht und Regierungsbezirk. Ergibt sich in der Stichprobe des MZ nach
der Gliederung nach diesen Merkmalen in einem Gliederungssegment z.B. eine
Untererfassung gegenüber dem Eckwert der Bevölkerungsforschreibung, d.h.
wenn der Stichprobenwert weniger als 1% des Eckwertes beträgt, werden
zufällig ausgewählte Stichprobenfälle so lange gedoppelt, bis der
Stichprobenwert dem Eckwert entspricht. Das umgekehrte Prinzip, nämlich
die Streichung von Fällen, erfolgt bei einer Übererfassung von Fällen
in einem Gliederungssegment (Stichprobenumfang größer als 1% des
entsprechenden Eckwertes). Das Verfahren des Doppelns
und Streichens ist ausführlich beschrieben in Krug/Nourney:
Wirtschafts- und Sozialstatistik, 2. Auflage. München: Oldenbourg, 1987
(S. 145-146). Ab der 3. Auflage wird das Verfahren nur noch knapp erwähnt.
SUF 1989ff.
Die Mikrozensusdaten der Scientific Use Files ab 1989ff. entsprechen ebenfalls einer 70% Substichprobe.
Für die
Daten 1989-1995 liegt lediglich ein Hochrechungsfaktor auf Haushaltsebene
vor (MZ 1989: EF257U4;
Ergebnis der Soll-durch-Ist-Anpassung). Die Anpassung der Mikrozensus-Ergebnisse an die laufende
Bevölkerungsfortschreibung geschieht auf Haushaltsebene, so dass für die
Personenebene in den Scientific Use Files 1989-1995 kein entsprechender
Hochrechnungsfaktor bereitsteht. Testauswertungen haben jedoch gezeigt,
dass die Verwendung des Haushalts-Hochrechungsfaktors für Auswertungen
auf Personenebene zu keinen wesentlich anderen Ergebnissen führt als die
Verwendung des korrekten Personen-Hochrechungsfaktors.
Ab dem Mikrozensus
1996 kann neben dem Haushalts-Hochrechungsfaktor auch auf
Hochrechnungsfaktoren für Personen zurückgegriffen werden.
Mikrozensus: ZUMA-Files
1973, 1976, 1980, 1982, 1985, 1987
Die Daten der ZUMA-Files der Mikrozensen der Jahre 1973, 76, 80, 82, 85 und 87 liegen als Aggregatdaten in Form mehrdimensionaler Tabellen
(Merkmalskombinationen von 30 bzw. 40 Variablen) vor. Die Daten
entsprechen einer 98% Substichprobe. Die Variable Gewicht
enthält die Fallzahlen pro Merkmalskombination. Diese Fallzahlen sind an
die Ergebnisse der laufenden Bevölkerungsfortschreibung angepasst.
Vergleichende Auswertungen
Vor dem Hintergrund, dass es sich bei den oben beschriebenen
Mikrozensen einerseits um Aggregat- bzw.
Einzeldaten handelt, denen andererseits verschiedene Auswahlsätze und
Anpassungsverfahren zugrunde liegen, sind folgende Vorgehensweisen zu empfehlen:
a) Auswertungen bei Populationsschätzungen, wenn (näherungsweise) veröffentlichte oder "amtliche" Ergebnisse
erzielt werden
MZ 1973, 1976, 1982 (Scientific Use File)
|
select if (EF76=1 or EF76=3 or EF76=0)
and (EF38=1 or EF38=0)
compute gewicht = 100/70
weight by gewicht
|
MZ 1989 - 1995 (Scientific Use File)
|
weight by ef257u4 / 0.70
|
MZ 1973-1985 (ZUMA-File)
|
weight by v31 / 0.98
|
MZ1987 (ZUMA File)
|
weight by v40 / 0.70
|
Für eine Hochrechnung auf die Gesamtpopulation
(100%) sind die gewichteten Ergebnisse mit 100 zu multiplizieren.
b) Auswertung bei Schätzung von statistischen Modellen
Bei der Schätzung von statistischen Modellen empfiehlt sich die
ungewichtete Auswertung.
Um die Daten der Scientific Use Files der MZ 1973, 76 und 82 völlig ungewichtet (d.h.
ohne Anpassung an die Bevölkerungsfortschreibung und ohne Berücksichtigung
des SUF-Auswahlsatzes von 70%)
und vergleichbar zu einer ungewichteten Auszählung von MZ-Daten ab
1989ff. auszuwerten, empfiehlt es sich, die "Originalsätze"
befragter Personen in den MZ-Daten 73, 76 und 82 abzugrenzen. Dies
geschieht, indem man (z.B. nach Abgrenzung der Wohnbevölkerung: ef58=1, ef58=2, ef58=4), nur
die entsprechenden "Originalsätze" auswertet (ef76=0,
ef38>=0&ef38<=1).
| MZ 1973, 1976, 1982 (Scientific Use File) |
a) Selektion: Wohnbevölkerung [oder andere Bevölkerungsgruppen]
(ef58=1,2,4)
b) Selektion (Originalsätze): (ef76=0 & ef38>=0&ef38<=1)
c) keine Hochrechnung |
| MZ 1989 - 1995 (Scientific Use File): |
a) Selektion: Bevölkerung am Hauptwohnsitz [oder
andere Bevölkerungsgruppen]
b) keine Gewichtung/Hochrechnung |
In Bezug auf die Hochrechnungsfaktoren bei der Schätzung von
Gesamt-, Anteils- und Mittelwerten sowie zur Anpassung an die
Bevölkerungsfortschreibung enthält der folgende Aufsatz weitere
Informationen: Rendtel, U./Schimpl-Neimanns, B., 2001: Die Berechnung der
Varianz von Populationsschätzern im Scientific Use File des Mikrozensus
ab 1996. ZUMA-Nachrichten
48: 85-116.
0,45% Substichprobe ab MZ 1996
Bei Verwendung der 0,45%-Substichprobe ist das besondere
Hochrechnungsverfahren mit der Variablen EF755 (Mikrozensus ab 1996) zu
berücksichtigen, das vom Statistischen Bundesamt wie folgt beschrieben
wird: "(...) Für die Festlegung eines Anpassungsfaktors für
Merkmale der 0,45%-Unterstichprobe werden die Ergebnisse der 1%-Stichprobe
und dieser Unterstichprobe innerhalb eines Regierungsbezirks in der
Differenzierung nach Erwerbstätigen, Erwerbslosen und
Nichterwerbspersonen kombiniert mit dem Merkmal Deutsche/Ausländer und
dem Geschlecht mit dem bereits ermittelten Anpassungsfaktor für die
1%-Stichprobe hochgerechnet. Der Anpassungsfaktor für die
0,45%-Stichprobe [siehe Variable EF755] ergibt sich dann aus der Relation
der Ergebnisse aus der 1%-Stichprobe (= "Sollzahl") und den
Ergebnissen der 0,45%-Unterstichprobe (= "Istzahl").
(...)".
|