* ID_2006.do clear capture log close set mem 600m set dp comma set linesize 150 * Wechseln ins Arbeits- bzw. Datenverzeichnis, z.B. c:\temp cd log using ID_2006.log, text replace /* Diese Datei: ID_2006.do (Februar 2012) ---------------------------------------------------------------------------- Programm zur Rekodierung doppelter Identifikatoren im Scientific Use File des Mikrozensus 2006: Nr. des Haushalts im Auswahlbezirk (EF4) und Nummer der Person im Haushalt (EF5). Im Scientific Use File des Mikrozensus 2006 sind doppelte Identifikatoren (IDs, Ordnungsnummern) bei Haushalten des Jahresueberhangs (EF5b=1) vorhanden. Diese Gruppe konnte - vor allem aus Gruenden der Erreichbarkeit - nicht gemaess Stichprobenplan im Jahre 2005, sondern erst 2006 befragt werden. Bei den quartalsweise durchgefuehrten Hochrechnungen und Haushaltsauswertungen sind solche Jahresueberhaenge im Grunde jeweils als eigener Haushalt zu behandeln, selbst wenn im Erhebungsjahr 2006 eine weitere (regulaere) Befragung stattgefunden hat. Dies ist jedoch auch in den Originaldaten nicht durchgaengig umgesetzt worden. Aus diesem Grund sind die in den Daten vorhandenen IDs zur Abgrenzung von Haushalten (EF3, EF4, EF5b, EF12) nicht immer eindeutig. Aufgrund dessen sind des Weiteren bei der Ziehung der Substichprobe der zweiten Schicht fuer Personen mit Jahresueberhang Folgeprobleme aufgetreten. Teilweise sind die betreffenden Haushalte unvollstaendig. Z. B. koennen nicht fuer alle Haushalte Haushaltsbezugspersonen (EF37=1) oder Haupteinkommensbezieher des Haushalts (EF662>=1 & EF662<=4) ermittelt werden. Bei eigenen satzuebergreifenden Auswertungen auf der Ebene von Haushalten, Lebensformen oder Familien und der Konstruktion von abgeleiteten Variablen oder sogenannten Bandsatzerweiterungen fuehrt dies zu abweichenden Ergebnissen (z. B. Haushaltsgroesse vs. EF663) und ggf. zu Fehler- oder Warnmeldungen. Bei Korrekturen der doppelten IDs muss beachtet werden, dass die Angaben zu weiteren Personen im Haushalt und deren Ordnungsnummern (Ehepartner im Haushalt: EF50; Nr. des Ehepartners im Haushalt (EF51); (...) Lebenspartner einer Person im Haushalt (EF56); Nr. des Lebenspartners im Haushalt (EF57) moeglichst nicht veraendert werden. Die unten stehenden Rekodierungen der Haushaltsnummer (EF4) basieren auf Dateninspektionen der folgenden Variablen: Nr. des Gebaeudes im Auswahlbezirk (EF8), Nr. der Wohnung im Auswahlbezirk (EF9), Berichtsquartal (EF12), Bevoelkerung: Privathaushalte (EF31) und Personen im Haushalt: Anzahl (EF663) sowie den Angaben zu Haushaltszusammenhaengen (EF51 - EF57). Die Datenprobleme lassen sich nicht vollstaendig klaeren, aber immerhin koennen mithilfe der neuen Haushaltsnummer (EF4R) die Abweichungen zwischen der selbst ermittelten Haushaltsgroesse im Vergleich zur abgeleiteten Variablen EF663 von ueber 2.200 Faellen vor der Plausibilisierung auf 637 Faelle reduziert werden. Im Anschluss an die Rekodierung der Haushaltsnummer (EF4R) erfolgt fuer wenige Faelle die Rekodierung der Personennummer (EF5R). - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Quelle http://www.gesis.org/missy/home/auswahl-datensatz/mikrozensus-2006/ --- Arbeitshilfen: Rekodierung doppelter Identifikatoren --- URL: http://www.gesis.org/missy/fileadmin/missy/daten/mikrodaten_tools/Rekodierung_doppelter_Identifikatoren/ID_2006.do E-Mail: gml[at]gesis.org --------------------------------------------------------------------------- */ * Scientific Use File Mikrozensus 2006 * Vollstaendigen Dateinamen inkl. Verzeichnis in <> eintragen use , clear gen ID_ORG = _n lab var ID_ORG "Lfd. Satznummer im Ausgangsfile mz2006.dta" /* Variablen, die zur Abgrenzung eines Haushalts erforderlich sind siehe http://www.gesis.org/missy/studie/arbeitshilfen/datenaufbereitung-analyse/identifikatoren-fuer-haushalte/) EF3 Nr. des Auswahlbezirks EF4 Nr. des Haushalts im Auswahlbezirk EF5b Jahresueberhang aus dem Vorjahr EF12 Berichtsquartal (bei der Verwendung von Jahresueberhaengen) [EF5a Nr. der Person im Haushalt (systemfrei)] */ * SORTIERUNG 1 sort EF1 EF3 EF4 EF5b EF12 EF5a ID_ORG gen ID1 = _n lab var ID1 "Lfd. Satznummer nach Sortierung 1: EF1 EF3 EF4 EF5b EF12 EF5a ID_ORG" * hhnr1: Vorlaeufige laufende Haushaltsnummer bei Haushaltsabgrenzung nach Sortierung 1 egen hhnr1 = group(EF1 EF3 EF4 EF5b EF12) lab var hhnr1 "Lfd. Haushaltsnummer bei Sortierung EF1 EF3 EF4 EF5b EF12" /* Rekodierung der vorlaeufigen Haushaltsnummer nach Dateninspektion und Ermittlung plausibler Haushaltszusammenhaenge */ recode hhnr1 /// (4=3) (10=9) (12=11) (14=13) (26=25) (39=38) (41=40) (47=48) (49=50) /// (52=51) (57=56) (59=58) (102=101) (1187=1186) (1189=1188) (1191=1190) /// (1193=1192) (1198=1197) (1201=1200) (1203=1202) (1837=1838) /// (1871=1870) (1873=1872) (1881=1880) (1883=1882) (1887=1886) /// (1888=1889) (1893=1892) (2084=2083) (2338=2337) (2352=2351) /// (2417=2418) (2490=2489) (2494=2493) (2503=2502) (2509=2508) /// (2518=2519) (2713=2712) (2968=2967) (2978=2977) (2980=2979) /// (3028=3027) (3242=3241) (3280=3279) (4480=4479) (4496=4495) /// (4567=4566) (5271=5270) (5276=5275) (5378=5377) (5407=5408) /// (5819=5818) (5871=5870) (5908=5909) (5912=5911) (6010=6009) /// (6224=6223) (6243=6242) (6335=6334) (6527=6526) (6629=6628) /// (6856=6855) (6858=6857) (6860=6859) (6863=6862) (6871=6870) /// (6873=6872) (6931=6932) (7008=7007) (7247=7246) (7249=7248) /// (7250=7251) (7258=7257) (7298=7297) (8148=8147) (8288=8287) /// (8647=8646) (9070=9069) (9424=9423) (9604=9603) (9605=9606) /// (9620=9619) (9634=9635) (10671=10670) (10853=10854) (10914=10913) /// (11214=11213) (11441=11442) (11448=11447) (11870=11869) (11872=11871) /// (12293=12292) (12370=12369) (12449=12448) (12452=12451) (12596=12595) /// (13798=13797) (13801=13800) (13818=13819) (13999=13998) (14422=14421) /// (14877=14876) (14940=14939) (15296=15295) (15298=15299) (15301=15300) /// (15303=15302) (15874=15873) (15906=15905) (15908=15907) (15914=15913) /// (15915=15916) (15920=15921) (15923=15922) (16060=16061) (16063=16064) /// (16066=16065) (16185=16184) (16685=16686) (16693=16692) (16696=16695) /// (16723=16722) (16726=16725) (17052=17051) (17371=17370) (17808=17807) /// (17951=17950) (18080=18079) (18221=18220) (18223=18222) (18320=18319) /// (18322=18321) (18503=18504) (18684=18683) (18739=18738) (19188=19187) /// (19904=19903) (20483=20484) (20577=20576) (21053=21052) (21335=21336) /// (21470=21469) (21504=21503) (21751=21750) (22013=22012) (22016=22015) /// (22139=22138) (22248=22249) (22339=22340) (22346=22345) (23890=23889) /// (23966=23965) (24843=24842) (25350=25349) (25884=25883) (26125=26124) /// (26155=26154) (26244=26243) (26246=26245) (26584=26583) (27549=27548) /// (27671=27670) (28202=28201) (28257=28256) (29846=29845) (29959=29958) /// (30273=30272) (30536=30535) (30539=30540) (30901=30902) (31003=31002) /// (31012=31011) (31242=31241) (31397=31398) (31453=31452) (31508=31507) /// (31683=31682) (32229=32228) (32235=32234) (32448=32449) (32452=32451) /// (32460=32459) (32915=32914) (33012=33011) (33157=33156) (33215=33214) /// (33222=33221) (33280=33279) (33380=33379) (33705=33704) (33930=33931) /// (34103=34104) (34109=34108) (34539=34538) (34671=34670) (34767=34766) /// (35056=35055) (35061=35060) (35331=35330) (35342=35341) (35353=35352) /// (35443=35442) (35620=35621) (35629=35628) (35729=35728) (35825=35824) /// (35855=35854) (35952=35951) (36034=36033) (36041=36040) (36108=36107) /// (36111=36110) (36426=36427) (36561=36562) (36705=36704) (36708=36707) /// (36734=36735) (36796=36795) (37063=37064) (37086=37085) (37407=37406) /// (37558=37559) (37880=37879) (37886=37887) (37899=37898) (38258=38259) /// (38416=38415) (38458=38457) (38470=38469) (39208=39207) (39292=39291) /// (39310=39309) (39334=39333) (39349=39350) (39419=39418) (39565=39566) /// (40095=40094) (40132=40131) (40219=40218) (40227=40226) (40408=40407) /// (41313=41312) (41366=41365) (41383=41382) (41960=41959) (42040=42039) /// (42286=42285) (42540=42539) (42608=42607) (42729=42728) (42751=42750) /// (43013=43012) (43334=43333) (43349=43350) (43631=43632) (43886=43885) /// (44248=44247) (44432=44431) (44444=44445) (44447=44446) (45207=45206) /// (45282=45281) (45397=45396) (45430=45429) (45503=45502) (45627=45626) /// (45755=45754) (46171=46170) (46355=46354) (46369=46368) (46371=46370) /// (46875=46874) (47198=47197) (47692=47691) (47805=47804) (48065=48064) /// (48088=48087) (48290=48289) (48440=48439) (48452=48451) (48545=48544) /// (48566=48565) (49071=49070) (49125=49124) (49381=49382) (49421=49420) /// (49779=49778) (49784=49783) (49789=49788) (50380=50379) (50382=50381) /// (50883=50882) (51129=51128) (51160=51161) (51591=51590) (51656=51655) /// (51785=51786) (51789=51788) (51835=51836) (52119=52118) (52187=52186) /// (52484=52483) (52645=52644) (53068=53067) (53336=53337) (53341=53340) /// (53417=53418) (53791=53790) (53804=53803) (53949=53948) (54054=54053) /// (54330=54331) (54332=54333) (54687=54688) (55071=55070) (55075=55074) /// (55387=55386) (55542=55541) (55749=55748) (55751=55750) (55986=55985) /// (56321=56322) (56447=56446) (56621=56620) (56623=56622) (56770=56769) /// (56792=56791) (56807=56806) (57246=57247) (57515=57516) (57628=57629) /// (57635=57634) (57648=57647) (57861=57860) (58087=58086) (58089=58088) /// (58238=58237) (58487=58486) (58528=58527) (58863=58862) (58894=58893) /// (59032=59031) (59380=59379) (59818=59817) (60191=60190) (60559=60558) /// (60816=60815) (60954=60953) (61402=61401) (61638=61637) (61791=61792) /// (64047=64046) (64189=64188) (64220=64219) (64658=64657) (64750=64749) /// (65394=65393) (68230=68229) (68474=68473) (69271=69270) (69488=69487) /// (69624=69623) (69628=69627) (69712=69711) (70413=70412) (70790=70789) /// (70843=70842) (71269=71268) (71284=71283) (71776=71775) (71866=71865) /// (72889=72888) (73001=73002) (73290=73289) (73398=73397) (73506=73505) /// (73949=73948) (74106=74105) (74690=74689) (74833=74834) (75015=75014) /// (75145=75144) (75319=75320) (76731=76730) (77151=77150) (79633=79632) /// (80223=80222) (80374=80375) (80939=80938) (81114=81113) (81116=81117) /// (84667=84666) (87046=87047) (87377=87376) (87661=87660) (87765=87764) /// (88003=88002) (95037=95036) (95112=95111) (95521=95520) (95532=95531) /// (95535=95536) (95538=95537) (95540=95539) (95580=95579) (95653=95652) /// (95657=95656) (95665=95664) (95672=95673) (95693=95692) (95722=95721) /// (95855=95854) (95857=95856) (96018=96017) (96031=96030) (96033=96032) /// (96109=96108) (96256=96255) (96286=96285) (96379=96378) (96385=96384) /// (96488=96487) (96498=96497) (96504=96503) (96618=96617) (96714=96713) /// (96717=96716) (96728=96727) (96729=96730) (96761=96762) (96988=96987) /// (97184=97185) (97515=97514) (97825=97824) (97946=97945) (97987=97986) /// (97995=97994) (97998=97997) (98002=98001) (98121=98120) (98238=98237) /// (98243=98242) (98245=98244) (98248=98247) (98265=98266) (98386=98385) /// (98419=98418) (98646=98645) (98719=98720) (98930=98929) (99105=99106) /// (99210=99209) (99833=99832) (99835=99834) (99849=99848) (99851=99850) /// (99943=99942) (100025=100024) (100223=100222) (100316=100315) /// (100808=100807) (100810=100811) (100818=100817) (101014=101013) /// (101132=101131) (101138=101137) (101286=101285) (101345=101344) /// (101348=101347) (101358=101357) (101405=101404) (101487=101486) /// (101489=101490) (101626=101625) (101629=101628) (101958=101957) /// (102023=102024) (102088=102087) (102147=102146) (102335=102336) /// (102493=102492) (102618=102617) (102629=102628) (102767=102766) /// (102824=102823) (102953=102952) (102959=102958) (102983=102982) /// (103227=103226) (103230=103231) (103547=103548) (103734=103733) /// (104651=104650) (104657=104656) (105099=105098) (105132=105131) /// (105330=105329) (105419=105418) (105456=105455) (105522=105521) /// (106190=106189) (106550=106549) (106555=106554) (106938=106937) /// (107149=107150) (107189=107188) (107192=107191) (107401=107400) /// (107483=107482) (107538=107537) (107875=107874) (107879=107878) /// (107881=107880) (107885=107884) (107984=107983) (108145=108146) /// (108382=108381) (108609=108608) (108655=108654) (108657=108656) /// (108662=108661) (108665=108664) (108670=108669) (108673=108672) /// (108840=108839) (110375=110374) (110998=110997) (111165=111164) /// (111185=111184) (111319=111318) (111794=111793) (112097=112096) /// (112099=112098) (117524=117525) (117678=117679) (117681=117680) /// (117683=117682) (117684=117685) (117688=117687) (117691=117690) /// (117696=117695) (117698=117699) (117846=117845) (118204=118205) /// (118291=118292) (118361=118360) (118612=118611) (118706=118707) /// (118710=118709) (118715=118714) (118940=118939) (119164=119163) /// (119285=119284) (119390=119389) (119543=119542) (119547=119546) /// (120773=120772) (120810=120809) (121229=121230) (121447=121446) /// (122387=122386) (122604=122603) (122606=122605) (123327=123326) /// (123330=123329) (123687=123686) (123820=123819) (124301=124300) /// (124308=124307) (124563=124564) (124572=124571) (125018=125019) /// (125216=125215) (125393=125392) (125542=125541) (125628=125627) /// (126200=126199) (126408=126407) (126421=126420) (126430=126431) /// (126434=126433) (126437=126438) (126496=126495) (126525=126524) /// (126546=126545) (126836=126835) (126840=126839) (126879=126878) /// (127325=127324) (127783=127782) (128821=128820) (129328=129327) /// (130731=130730) (130753=130752) (130757=130758) (130764=130763) /// (131063=131062) (131306=131305) (131498=131497) (131766=131765) /// (132044=132045) (132920=132919) (133559=133558) (134300=134299) /// (134489=134488) (135168=135169) (135348=135349) (135354=135353) /// (136166=136165) (136662=136661) (136865=136864) (137088=137087) /// (137277=137276) (199105=199106) (201449=201450) (201704=201703) /// (201891=201890) (202319=202318) (202783=202784) (202792=202791) /// (203184=203183) (203587=203586) (203589=203590) (203946=203945) /// (204262=204263) (204265=204264) (204438=204437) (204442=204441) /// (204967=204966) (205355=205354) (205358=205357) (205361=205360) /// (205519=205518) (205539=205538) (205808=205807) (207256=207255) /// (207732=207731) (207774=207773) (208116=208115) (208163=208162) /// (210120=210119) (212873=212872) (213200=213199) (215139=215140) /// (215242=215241) (215485=215484) (215487=215488) (215822=215821) /// (215882=215883) (216055=216054) (216386=216385) (216419=216418) /// (216423=216422) (216941=216940) (216973=216972) (217214=217213) /// (217748=217747) (218287=218286) (218969=218970) (218978=218977) /// (219353=219352) (219850=219849) (220247=220248) (220634=220633) /// (221436=221437) (221677=221676) (221948=221947) (235264=235263) /// , gen(hhnr) lab var hhnr "Lfd. Haushaltsnummer bei Sortierung EF1 EF3 EF4 EF5b EF12 - plausibilisiert" /* Korrektur von Haushalten mit 2 Haupteinkommensbeziehern oder 2 Bezugspersonen ID_ORG hhnr1 ID1 EF1 EF3 EF4 EF5a EF37 EF44 EF46 EF662 => HHNR 184265 88385 184943 5 17197 2 1 1 28 2 3 88385 184266 88385 184944 5 17197 2 1 1 28 2 3 88386 259433 132614 277478 9 25235 4 1 1 48 1 7 132615 259434 132614 277479 9 25235 4 1 1 48 1 7 132616 */ replace hhnr = hhnr + 1 if (hhnr1>88385) replace hhnr = 88386 if (hhnr1==88385 & ID1==184944) replace hhnr = hhnr + 1 if (hhnr1>132614) replace hhnr = hhnr + 1 if (hhnr1==132614 & ID1==277479) * SORTIERUNG NACH LFD. HAUSHALTSNUMMER HHNR (~EF1 EF3 EF4 EF5b EF12~) und PERSONENNUMMER EF5a sort EF3 hhnr EF5a by EF3 hhnr : gen EF4R = 1 if _n ==1 by EF3 : replace EF4R = sum(EF4R) lab var EF4R "Nr. des Haushalts im Auswahlbezirk (systemfrei) - plausibilisiert" /* REKODIERUNG DOPPELTER PERSONENNUMMERN (EF5a) ID1 EF4R EF1 EF3 EF4 EF5a EF5b EF12 EF20 EF31 EF44 EF46 146456 5 3 12791 5 1 1 2 5 2 16 2 146457 5 3 12791 5 3 1 2 5 2 13 1 146458 5 3 12791 5 4 1 2 5 2 15 1 146459 6 3 12791 5 5 1 4 5 2 15 1 146460 6 3 12791 5 5 1 4 5 2 15 1 <=== */ generate EF5aR = EF5a replace EF5aR = 6 if (ID1==146460 & EF3==12791 & EF4R==6 & EF5a==5) lab var EF5aR "Nr. der Person im Haushalt (EF5a) rekodiert" * KONTROLLEN sort EF3 EF4R EF5aR * 1 PERSONENNUMMER EINDEUTIG? isid EF1 EF3 EF4R EF5aR * 2 HAUSHALTSGROESSE, Zahl der Personen in Privathaushalten ermittelt mit EF4R * vs. EF663 Haushaltsgroesse (Haushaltstypisierung) egen v663 = total(EF31==1), by(EF1 EF3 EF4R) replace v663 = 9 if (v663>=9) replace v663 = 0 if (EF31==2) * Personen in Haushalten ohne Jahresueberhang tab v663 EF663 if EF5b==0, miss * Personen in Haushalten mit Jahresueberhang tab v663 EF663 if EF5b==1, miss count if v663~=EF663 & EF5b==1 /* HINWEIS: AEHNLICHE ABWEICHUNGEN WIE ZU EF663 SIND BEI ANDEREN ABGELEITETEN VARIABLEN AUF HAUSHALTS-, FAMILIEN- ODER LEBENSFORMEBENE ZU ERWARTEN */ * Arbeitsvariablen loeschen drop hhnr1 ID1 hhnr v663 * Falls Kontrolle OK, File mit neuem Dateinamen speichern note _dta : TS MZ 2006: Datei mit revidierter Haushalts- (EF4R) und /// Personennummer (EF5R) - Korrektur mit /// http://www.gesis.org/missy/fileadmin/missy/daten/mikrodaten_tools/Rekodierung_doppelter_Identifikatoren/ID_2006.do save "mz2006r.dta" exit * === PROGRAMMENDE ===