Die Einkommensstichprobe in Arbeiter- und Angestelltenhaushalten (im folgenden: EKS) wurde in der DDR seit 1959 in regelmäßigen Abständen durchgeführt. Die letzte Erhebung fand 1988 statt und ist die einzige, die noch maschinenlesbar zur Verfügung steht. Das damalige ZUMA hat diese Erhebung 1990 erworben. Im Unterschied zu der allgemein üblichen Darstellungsform, lag die EKS jedoch nicht in einer Rechtecksform (jeder physikalische Satz entspricht einem logischen Satz) vor. Vielmehr wurde bei der EKS für jeden der sechs inhaltlichen Fragebogenteile ein neuer physikalischer Satz begonnen. Auf diese Weise lagen bspw. für einen Einpersonenhaushalt bis zu sechs physikalische, für einen Zweipersonenhaushalt bis zu neun physikalische Sätze vor. Da eine solche Struktur die Analyse des Datenfiles sehr aufwendig macht, wurden die Daten bei GESIS so aufbereitet, dass jeder physikalische Satz nun einem logischen Satz entspricht, so dass eine Auswertung mit gängigen Statistikprogrammen problemlos möglich ist. Diese Aufbereitung orientierte sich an den befragten Personen, d. h. jeder Einzelsatz entspricht einer Person (vgl. Engelhard/Wirth 1993: Mikrodaten - DDR. Einkommensstichprobe in Arbeiter- und Angestelltenhaushalten 1988. Dokumentation und Datenaufbereitung, ZUMA-Technischer Bericht 92/08).
Nun ist die EKS jedoch eigentlich eine Haushaltserhebung, d. h. es wurde nicht nur eine ausgewählte Person, sondern auch deren Haushaltsmitglieder befragt. Haushaltsmitglieder sind solche Personen, die zusammen wohnen und gemeinsam wirtschaften. Wohnen Personen zwar zusammen ohne aber gemeinsam zu wirtschaften, werden sie nicht zum gleichen Haushalt gezählt, sondern in getrennten Haushalten erfasst. Die Information, welche Personen zu welchem Haushalt gehören, ist in der aufbereiteten EKS zwar in der Variablen 'Mergeid' enthalten, eine haushaltsbezogene Auswertung ist jedoch nur durch satzübergreifende Analysen möglich. Um auch eine haushaltsbezogene Analyse der EKS mit möglichst geringem technischen Aufwand zu ermöglichen, haben wir daher neben dem Personen-File auch ein Haushalts-File erstellt. Hier entspricht ein Fall im Datenfile nicht wie bisher einer Person sondern einem Haushalt, der alle für diesen Haushalt und die darin lebenden Personen erhobenen Informationen enthält.
Im folgenden skizzieren wir die einzelnen Schritte der Umsetzung und geben abschließend eine kurze Übersicht über die Zusammensetzung der Haushalte in der EKS.
Die Struktur des Ausgangsdatensatzes ist, wie bereits erwähnt, personenorientiert, d. h. ein Fall im Datensatz enthält die Daten der befragten Person und einige Angaben zum Haushalt in dem diese Person lebt. Zu diesen Angaben zählt auch die sogenannte 'Mergeid', eine Haushaltskennung, die es ermöglicht die Fälle zu identifizieren, die jeweils zu einem Haushalt gehören. Im Ausgangsdatensatz sind die Fälle der einzelnen Haushaltsmitglieder in einer mehr oder weniger unsystematischen Reihenfolge hintereinander gespeichert. Der Haushaltszusammenhang ist dabei über die Stellung zum Haupteinkommensbezieher (im folgenden: HEB) in der Variablen 'v1' erfasst. Nach der Arbeitsrichtlinie für Betriebsverantwortliche/Beauftragte der SZS, S. 4 ist der HEB eines Haushalts das Haushaltsmitglied, welches überwiegend zum Lebensunterhalt des Haushalts beiträgt. Im einzelnen wurde hierbei unterschieden zwischen HEB, dem Ehepartner des HEB, den Kindern des HEB und sonstigen Personen im Haushalt. Insgesamt wurden maximal neun Personen aus einem Haushalt in die Befragung aufgenommen. In einem ersten Schritt wurden aus dem Personen- Ausgangsdatensatz der EKS diejenigen Fälle in ein neues Systemfile geschrieben, die als HEB gekennzeichnet (v1=1) waren. Dieses neue HEB-File umfasst 28.471 Fälle und enthält alle Merkmale des Ausgangsdatensatzes, d. h. die individuellen Angaben des HEB sowie die allgemeinen Haushaltsinformationen. Die Personenmerkmale wurden so umbenannt, dass ein eindeutiger Bezug zum HEB möglich ist (z. B. HEBV1, HEBV2, ...).
In einem weiteren Schritt wurden die Ehepartner (gekennzeichnet durch v1=2) der HEB's - soweit vorhanden - aus dem Personen-Ausgangsdatensatz in ein eigenes Systemfile geschrieben. Dieser Datensatz umfasst 20.515 Fälle und enthält aber neben der Variable 'Mergeid' (Haushaltskennung ), die zum späteren Zusammenspielen der Haushalte notwendig ist, nur die individuellen Merkmale des Ehepartners aus dem Ausgangsdatensatz. Auch diese wurden wiederum so umbenannt, dass sie als Merkmale des Ehepartners erkennbar sind (z. B. EPV1, EPV2, ...). Wie aus der Differenz zwischen der Zahl der HEB's (28.471) und der Ehepartner (20.515) deutlich wird, gibt es in 7.956 Haushalten keinen Ehepartner.
Im folgenden wurden die Kinder des HEB (gekennzeichnet durch v1=3) in ein eigenes Systemfile geschrieben. In die Kategorie Kind fielen nach Definition der DDR-Statistik nur Kinder unter 17 Jahren. Kinder des HEB, die älter als 17 Jahre sind, wurden als 'übrige Haushaltsmitglieder' erfasst (Arbeitsrichtlinie für Betriebsverantwortliche/Beauftragte der SZS, S. 4). Dieser Datensatz umfasst 21.799 Fälle. Da bei mehreren Kindern in einem Haushalt keine Unterscheidung auf Basis der Mergeid zwischen den einzelnen Kindern getroffen werden kann, wurde das Kinder-File nach der laufenden Nummer der Kinder im Haushalt gesplittet. Diese laufende Nummer der Person im Haushalt wurde - da im Personen-Ausgangsdatensatz nicht enthalten - von uns erzeugt. Auf diese Weise wurden neun Kinderfiles erzeugt, da maximal bis zu neun Personen eines Haushaltes in die Befragung aufgenommen worden waren und ein Kind sowohl als erste Person im Haushalt als auch als letzte (oder auf jeder anderen beliebigen Position) erfasst worden sein konnte. Unbedingt erfasst sein mussten der HEB und sein Ehepartner. Ausgeschlossen wurden - falls notwendig - Haushaltsmitglieder ohne Einkommen (z. B. Schulkinder) (Prüf- und Signieranweisung für die EKS 1988, S. 2). Diese neun Datenfiles enthalten wiederum die individuellen Merkmale der Kinder aus dem Ausgangsdatensatz. Die Kindermerkmale wurden entsprechend der laufenden Nummer der Kinder im Haushalt umbenannt. War ein Kind im Ausgangsdatensatz bspw. die laufende Nummer 1, wurde die Variable V1 z. B. als 'KID1V1' bezeichnet. War das Kind die laufende Nummer 2, z. B. nach dem HEB, wurde diese Variable als 'KID2V1' bezeichnet. Das bedeutet, dass die Merkmale der Kinder danach durchnumeriert sind, an welcher Position sie innerhalb der Reihenfolge der Haushaltsmitglieder erfasst worden waren, diese Nummerierung aber nichts über die tatsächliche Anzahl der Kinder im Haushalt aussagt.
Mit den 'übrigen Personen' im Haushalt (gekennzeichnet durch v1=0) wurde in gleicher Weise wie mit den Kindern verfahren. Zur Kategorie der 'übrigen Haushaltsmitglieder' zählen - wie oben bereits erwähnt - sowohl Kinder des HEB, die älter als 17 Jahre alt sind wie auch andere Personen, die laut Definition (s. o.) zum Haushalt gehören. Dieses File umfasst 8.368 Fälle. Auch hier wurde nach dem gleichen Prinzip wie beim Kinder-File gesplittet. Es ergaben sich demnach neun Datenfiles für die übrigen Personen im Haushalt, deren Merkmale nach dem gleichen Kriterium wie bei den Kindern umbenannt wurden (z. B. ub1v1, ub2v2, ...). In einem letzten Schritt wurden die einzelnen Datensätze mit Hilfe der Mergeid zu einem einzigen Datensatz zusammengespielt, dessen einzelne Fälle die Merkmale aller Haushaltsmitglieder sowie die Merkmale des Haushalts umfassen. In dem neuen haushaltsorientierten Datenfile sind die Variablen v1 bis v30 für die einzelnen Haushaltsmitglieder in einem einzigen Haushaltsrecord enthalten. Wie bereits erwähnt, sind diese Variablen so umbenannt, dass erkennbar ist, ob sie sich auf den HEB, den Ehepartner, die Kinder oder die übrigen Personen des Haushalts beziehen. Vor die Bezeichnung der Variablen, die sich auf den HEB beziehen, wurden die Buchstaben 'heb' gesetzt, so dass z. B. die Variable 'v3' des Ausgangsdatensatzes jetzt 'hebv3' heißt. Das gleiche wurde für die Variablen, die sich auf den Ehepartner beziehen, durchgeführt, allerdings wurden die ursprünglichen Variablennamen um die Buchstaben 'ep' erweitert, also heißt die ehemalige v3 des Ehepartners jetzt 'epv3'. Nach dem gleichen Prinzip wurde mit den Variablen der Kinder und der übrigen Personen verfahren, wobei diese noch mit einer Ziffer von 1 bis 9 versehen wurden, je nachdem, welche laufende Nummer im Haushalt die Person, auf die sich die Variable bezieht, hatte (s. o.). So heißt die Variable v3 für ein Kind, das die laufende Nummer 1 im Haushalt hatte, 'kid1v3', für ein Kind mit der laufenden Nummer 2 'kid2v3' u. s. w. Für eine 'übrige Person' mit der laufenden Nummer 1 heißt diese Variable ub1v3, hatte die übrige Person die laufende Nummer 8, so lautet der Variablenname ub8v3.