German Microdata Lab

Analysebeispiele

Beispiel zur Datendokumentation und Analyse der mehrdimensionalen Tabellendaten

 

Datenhandbuch (Kleber/Willms, 1982: 48-59)  

 Tabellenname: BZ.07.T01
1.ERHEBUNGBerufs- und Betriebszählung vom 12.Juni 1907
2.INHALTEs handelt sich um die zusammengefasste soziodemographische Haupttabelle der Berufszählung 1907. In ihr wird die Bevölkerung des deutschen Reichs nach Geschlecht, Altersgruppe, Familienstand, Beruflicher Stellung und Berufsgruppe aufgegliedert.
3.QUELLE Tabelle "Die Bevölkerung nach Hauptberuf, Alter und Familienstand", in: Statistik des Deutschen Reichs, Band 203, Seite 4-23.
4.KOMMENTAR ZURERZEUGUNG (...) [Ausführliche Beschreibung der verschiedenen Arbeitsschritte bis zur endgültigen maschinenlesbaren Datei]
5.DATENQUALITÄTDie Mithelfenden Familienangehörigen werden in der Berufszählung 1907 zwar umfassender erfasst als in den Zählungen zuvor, aber immer noch weniger gut als in den folgenden Zählungen, wobei insbesondere Frauen untererfasst sind.
6.WEITERE VERSIONEN DERTABELLEAls weitere Version gibt es den Datensatz BZ.07.T03. Es handelt sich um eine zusammengesetzte Tabelle, die aus Teilen der Tabelle BZ.07.T01.DAT10 sowie der gesamten Tabelle BZ.07.T02.DAT6 besteht.
7.EINSCHLÄGIGEVERÖFFENTLICHUNGEN STATISTISCHES REICHSAMT, Statistik des Deutschen Reichs, Band 202, 203 (Tabellenbände), 211 (Einführungs- und Textband). H. LOSCH, Berufsprobleme und berufsstatistische Probleme. In: Württembergische Jahrbücher für Statistik und Landeskunde, Jahrgang 1919/1920, Stuttgart 1922, Seite 259-267. OHNE VERFASSERANGABE, Entscheidungen und Grundsätze für die Ausführung der Zählung, in: "Statistische Korrespondenz" vom 5. Juni 1907, abgedruckt in: Zeitschrift des Königlich Preußischen Statistischen Landesamtes. (A. PETERSILIE), Erfahrungen und Beobachtungen bei der Berufs- und Betriebszählung vom 12.Juni 1907, in: Zeitschrift des Preußischen Statistischen Landesamtes, 49.Jahrgang (1909), Seite 1-24. Friedrich ZAHN, Beruf und Berufsstatistik. In: Handwörterbuch der Staatswissenschaften, 4.Auflage, Jena: Fischer 1924, Seite 524-579. Helene SIMON, Der Anteil der Frau an der deutschen Industrie nach den Ergebnissen der Berufszählung von 1907. Jena: Fischer 1910.

 

 

    N %
  I N S G E S A M T 61720529 100.00
  VARIABLE # 1 : STELLUNG ZUM ERWERBSLEBEN    
1 ERWERBSPERSON MIT HAUPTBERUF 26827362 43.47
2 DIENENDER 1264755 2.05
3 BERUFSLOSER SELBSTÄNDIGER 3404983 5.52
4 HAUSHALTSANGEHÖRIGER (VORSPALTE) 30223429 48.97
       
  (...)    
       
  VARIABLE # 8 : BERUFLICHE STELLUNG RECODIERT    
1 A.1+EIGENTUEMER UND MITEIGENTUEMER 4866926 7.89
  (...)    
22 ANGEHÖRIGE 30223429 48.97
       
  VARIABLE # 9 : GEWICHTUNG    
  DARSTELLUNGSFORM DES DATENSATZES IST BYTE    
  DIE RECORDS HABEN FESTE SATZLÄNGE    

 

Tabellendaten t01_1.dat (Auszug: sechs von insgesamt 10.897 Datensätzen)
111010101010100000041
121010101010100000004
111010101020200000001
(...)
221122934182000000008
411123141202200000005
421123141202200000025

Datenbeschreibung für das Statistikprogramm TASUS t01_1.reg Spalte 1: Speicherformat der Variablen (Integer)
Spalte 2: Spaltenbreite der Variablen
Spalte 3: unterster gültiger Wertebereich (Minimum)
Spalte 4: oberster gültiger Wertebereich (Maximum)
Spalte 5: Variablenname

I114STELLUNG ZUM ERWERBSLEBEN
I112GESCHLECHT
I113FAMILIENSTAND
I2112ALTERSGRUPPEN
I2131BERUFSGRUPPEN
I2141BERUFSGRUPPEN RECODIERT
I2120BERUFLICHE STELLUNG
I2122BERUFLICHE STELLUNG RECODIERT
I81999GEWICHTUNG
*   CHARAKTER

SPSS-Programmanweisungen t01_1.sps**)

DATA LIST
     FILE = 'bz/07/t01_1.dat'
     FIXED
     RECORDS = 1
     TABLE
     /1
     V1 1-1
     V2 2-2
     V3 3-3
     V4 4-5
     V5 6-7
     V6 8-9
     V7 10-11
     V8 12-13
     V9 14-21.

VARIABLE LABELS
    V1 'STELLUNG ZUM ERWERBSLEBEN'
    V2 'GESCHLECHT'
    V3 'FAMILIENSTAND'
    V4 'ALTERSGRUPPEN'
    V5 'BERUFSGRUPPEN'
    V6 'BERUFSGRUPPEN RECODIERT'
    V7 'BERUFLICHE STELLUNG'
    V8 'BERUFLICHE STELLUNG RECODIERT'
    V9 'GEWICHT'.

MISSING VALUES
    V1 ( 9 )
    V2 ( 9 )
    V3 ( 9 )
    V4 ( 99 )
    V5 ( 99 )
    V6 ( 99 )
    V7 ( 99 )
    V8 ( 99 ).

WEIGHT BY V9 .

EXECUTE .

Randverteilung V1 (zum Vergleich mit univariater Randverteilung im Datenhandbuch; s.o.)
Beispiel wurde mit obigem SPSS-Programm und Fallzahlgewicht (V9) erzeugt. Die Value-Labels wurden aus dem Datenhandbuch nachträglich eingefügt

V1 STELLUNG ZUM ERWERBSLEBEN

    Frequency Percent Valid Percent Cumulative Percent
1 ERWERBSPERSON MIT HAUPTBERUF 26827362 43,5 43,5 43,5
2 DIENENDER 1264755 2,0 2,0 45,5
 3 BERUFSLOSER SELBSTÄNDIGER 3404983 5,5 5,5 51,0
 4 HAUSHALTSANGEHÖRIGER (VORSPALTE) 30223429 49,0 49,0 100,0
  Total  61720529 100,0 100,0