Analysebeispiele
Beispiel zur Datendokumentation und Analyse der mehrdimensionalen Tabellendaten
Datenhandbuch (Kleber/Willms, 1982: 48-59)
Tabellenname: | BZ.07.T01 | |
1. | ERHEBUNG | Berufs- und Betriebszählung vom 12.Juni 1907 |
2. | INHALT | Es handelt sich um die zusammengefasste soziodemographische Haupttabelle der Berufszählung 1907. In ihr wird die Bevölkerung des deutschen Reichs nach Geschlecht, Altersgruppe, Familienstand, Beruflicher Stellung und Berufsgruppe aufgegliedert. |
3. | QUELLE | Tabelle "Die Bevölkerung nach Hauptberuf, Alter und Familienstand", in: Statistik des Deutschen Reichs, Band 203, Seite 4-23. |
4. | KOMMENTAR ZURERZEUGUNG | (...) [Ausführliche Beschreibung der verschiedenen Arbeitsschritte bis zur endgültigen maschinenlesbaren Datei] |
5. | DATENQUALITÄT | Die Mithelfenden Familienangehörigen werden in der Berufszählung 1907 zwar umfassender erfasst als in den Zählungen zuvor, aber immer noch weniger gut als in den folgenden Zählungen, wobei insbesondere Frauen untererfasst sind. |
6. | WEITERE VERSIONEN DERTABELLE | Als weitere Version gibt es den Datensatz BZ.07.T03. Es handelt sich um eine zusammengesetzte Tabelle, die aus Teilen der Tabelle BZ.07.T01.DAT10 sowie der gesamten Tabelle BZ.07.T02.DAT6 besteht. |
7. | EINSCHLÄGIGEVERÖFFENTLICHUNGEN | STATISTISCHES REICHSAMT, Statistik des Deutschen Reichs, Band 202, 203 (Tabellenbände), 211 (Einführungs- und Textband). H. LOSCH, Berufsprobleme und berufsstatistische Probleme. In: Württembergische Jahrbücher für Statistik und Landeskunde, Jahrgang 1919/1920, Stuttgart 1922, Seite 259-267. OHNE VERFASSERANGABE, Entscheidungen und Grundsätze für die Ausführung der Zählung, in: "Statistische Korrespondenz" vom 5. Juni 1907, abgedruckt in: Zeitschrift des Königlich Preußischen Statistischen Landesamtes. (A. PETERSILIE), Erfahrungen und Beobachtungen bei der Berufs- und Betriebszählung vom 12.Juni 1907, in: Zeitschrift des Preußischen Statistischen Landesamtes, 49.Jahrgang (1909), Seite 1-24. Friedrich ZAHN, Beruf und Berufsstatistik. In: Handwörterbuch der Staatswissenschaften, 4.Auflage, Jena: Fischer 1924, Seite 524-579. Helene SIMON, Der Anteil der Frau an der deutschen Industrie nach den Ergebnissen der Berufszählung von 1907. Jena: Fischer 1910. |
N | % | ||
I N S G E S A M T | 61720529 | 100.00 | |
VARIABLE # 1 : STELLUNG ZUM ERWERBSLEBEN | |||
1 | ERWERBSPERSON MIT HAUPTBERUF | 26827362 | 43.47 |
2 | DIENENDER | 1264755 | 2.05 |
3 | BERUFSLOSER SELBSTÄNDIGER | 3404983 | 5.52 |
4 | HAUSHALTSANGEHÖRIGER (VORSPALTE) | 30223429 | 48.97 |
(...) | |||
VARIABLE # 8 : BERUFLICHE STELLUNG RECODIERT | |||
1 | A.1+EIGENTUEMER UND MITEIGENTUEMER | 4866926 | 7.89 |
(...) | |||
22 | ANGEHÖRIGE | 30223429 | 48.97 |
VARIABLE # 9 : GEWICHTUNG | |||
DARSTELLUNGSFORM DES DATENSATZES IST BYTE | |||
DIE RECORDS HABEN FESTE SATZLÄNGE |
Tabellendaten t01_1.dat (Auszug: sechs von insgesamt 10.897 Datensätzen)
111010101010100000041
121010101010100000004
111010101020200000001
(...)
221122934182000000008
411123141202200000005
421123141202200000025
Datenbeschreibung für das Statistikprogramm TASUS t01_1.reg Spalte 1: Speicherformat der Variablen (Integer)
Spalte 2: Spaltenbreite der Variablen
Spalte 3: unterster gültiger Wertebereich (Minimum)
Spalte 4: oberster gültiger Wertebereich (Maximum)
Spalte 5: Variablenname
I | 1 | 1 | 4 | STELLUNG ZUM ERWERBSLEBEN |
I | 1 | 1 | 2 | GESCHLECHT |
I | 1 | 1 | 3 | FAMILIENSTAND |
I | 2 | 1 | 12 | ALTERSGRUPPEN |
I | 2 | 1 | 31 | BERUFSGRUPPEN |
I | 2 | 1 | 41 | BERUFSGRUPPEN RECODIERT |
I | 2 | 1 | 20 | BERUFLICHE STELLUNG |
I | 2 | 1 | 22 | BERUFLICHE STELLUNG RECODIERT |
I | 8 | 1 | 999 | GEWICHTUNG |
* | CHARAKTER |
SPSS-Programmanweisungen t01_1.sps**)
DATA LIST
FILE = 'bz/07/t01_1.dat'
FIXED
RECORDS = 1
TABLE
/1
V1 1-1
V2 2-2
V3 3-3
V4 4-5
V5 6-7
V6 8-9
V7 10-11
V8 12-13
V9 14-21.
VARIABLE LABELS
V1 'STELLUNG ZUM ERWERBSLEBEN'
V2 'GESCHLECHT'
V3 'FAMILIENSTAND'
V4 'ALTERSGRUPPEN'
V5 'BERUFSGRUPPEN'
V6 'BERUFSGRUPPEN RECODIERT'
V7 'BERUFLICHE STELLUNG'
V8 'BERUFLICHE STELLUNG RECODIERT'
V9 'GEWICHT'.
MISSING VALUES
V1 ( 9 )
V2 ( 9 )
V3 ( 9 )
V4 ( 99 )
V5 ( 99 )
V6 ( 99 )
V7 ( 99 )
V8 ( 99 ).
WEIGHT BY V9 .
EXECUTE .
Randverteilung V1 (zum Vergleich mit univariater Randverteilung im Datenhandbuch; s.o.)
Beispiel wurde mit obigem SPSS-Programm und Fallzahlgewicht (V9) erzeugt. Die Value-Labels wurden aus dem Datenhandbuch nachträglich eingefügt
V1 STELLUNG ZUM ERWERBSLEBEN
Frequency | Percent | Valid Percent | Cumulative Percent | ||
1 | ERWERBSPERSON MIT HAUPTBERUF | 26827362 | 43,5 | 43,5 | 43,5 |
2 | DIENENDER | 1264755 | 2,0 | 2,0 | 45,5 |
3 | BERUFSLOSER SELBSTÄNDIGER | 3404983 | 5,5 | 5,5 | 51,0 |
4 | HAUSHALTSANGEHÖRIGER (VORSPALTE) | 30223429 | 49,0 | 49,0 | 100,0 |
Total | 61720529 | 100,0 | 100,0 |