Sie sind hier: Dienstleistungen / Daten / Amtliche Mikrodaten / Mikrozensus / Stata-Einleseroutinen
08.01.09

STATA-Setup zum Einlesen der Rohdaten des Mikrozensus 2000

Nachfolgend finden Sie das STATA-Setup, das Ihnen dabei helfen kann, die Rohdaten des Mikrozensus 2000 einzulesen und eine STATA-Datei zu erstellen.

Das STATA-Setup setup_00.do und das STATA-Dictionary setup_00.dct erfüllen folgende Aufgaben:

  • Einlesen der Rohdaten, wie sie vom StBA bereitgestellt werden
  • Ersetzen von fehlenden Werten (Blanks, @)
  • Hinzufügen der Variable Label
  • Hinzufügen der Value Labels


Das STATA-Setup sowie eine Kurzbeschreibung des Mikrozensus 2000 (stata_readme_setup00.pdf), stehen als ZIP-Datei (132 KB) (Version: 12/2005)  zum Herunterladen bereit.

Hinweis: Das Rohdatenfile des Scientific Use Files des Mikrozensus 2000 enthält gegenwärtig (22.03.2004) in zwei Personensätzen Sonderzeichen:

 - Zeile 205191, Spalte 272, Variable EF351
 - Zeile 215862, Spalte 125, Variable EF139

Das Sonderzeichen in Zeile 205191 verhindert ein fehlerfreies Einlesen der Rohdaten in Stata. Derzeit besteht mit Stata nur die Möglichkeit, dieses Sonderzeichen mit Hilfe des Kommandos "filefilter" zu ändern. Dies wird in dem file setup_00.do vorgenommen. Als Ergebnis der Einleseprozedur steht ein korrigiertes Rohdatenfile zur Weiterverarbeitung zur Verfügung. Das zweite Sonderzeichen (Zeile 215862, Spalte 125) wird von Stata als Missing Value erkannt und verursacht außer einem Hinweis keine Verarbeitungsprobleme. Für die Prozedur „filefilter“ ist der Einsatz von Stata 8 notwendig, bei Stata 7 ist eine automatische Korrektur nicht möglich, die Sonderzeichen müssen dann manuell mit einem Editor durch Blanks ersetzt werden.

 

Um eine reibungsfreie Aufbereitung der Daten zu gewährleisten, empfiehlt es sich, die in dem Setup vorgesehenen Voreinstellungen zu berücksichtigen und je nach Leistung des verarbeitenden Systems das Setup schrittweise durchführen zu lassen. Sind die Daten eingelesen und ist das entsprechende Systemfile erstellt, kann die folgende Fallzahl (ohne Gewichtung, ohne Selektion) zur Kontrolle, ob der Rohdatensatz fehlerfrei eingelesen wurde, mit der des eingelesenen Datensatzes verglichen werden. Unterscheiden sich die Fallzahlen, weist dies auf einen Fehler beim Einlesen hin.

(Anmerkung: Handelt es sich um unterschiedliche Stichproben, können sich die Fallzahlen ebenfalls unterscheiden.)

Fallzahl Mikrozensus 2000 (ohne Gewichtung, ohne Selektion)= 503185