Mit welchem Programm können Berufsvercodungen
durchgeführt werden?
Eine Vercodung von Berufsangaben (oder anderen Texte) erfordert mehr als den
Erwerb eines Programms, wie aus den im folgenden skizzierten Arbeitsschritten zu
erkennen ist:
1. Die Texte müssen für das jeweilige Programm speziell aufbereitet werden
(Formate, Identifikatoren u.a.).
2. Es muß ein validiertes Wörterbuch (Diktionär) vorliegen. Darin sind nur
die Textangaben aufgeführt, die für sich allein genommen aussagekräftig genug
sind, um sie eindeutig einer Kategorie zuweisen zu können. Beim ZUMA werden 4
Wörterbücher mit je ca. 4000 Einträgen permanent gepflegt (ergänzt, überprüft,
korrigiert): ISCO-68, ISCO-88, STABU-75 und STABU-92. Sie werden allerdings
nicht verkauft oder weitergegeben.
3. Codierung mit einem Textanalyseprogramm. In emprischen Erhebungen lassen
sich aufgrund der unzureichend informativen Angaben nur ca. 50 bis 60% der
Angaben automatisch codieren, bzw. einige Kategorien erfordern immer gewisse
Hintergrundinformationen (wie z.B. Selbständigkeit, Betriebsgröße oder Stellung
im Beruf), die selten in der Anwort selbst gegeben werden, sondern aus anderen
Teilen des Fragebogen genommen werden müssen.
4. Aufbereitung der nicht automatisch codierten Angaben, so daß sie von
geschulten Codiererinnen bearbeitet werden können.
5. Zusammenfügen der computer- oder codergestützt codierten Daten.
6. Generierung der Prestigewerte.
Allgemein verfügbar ist nur das Programmpaket TEXTPACK (vgl. http://www.gesis.org/software/textpack/index.htm):
dieses Programm oder ein anderes - vgl. http://www.intext.de/dindex.html -
dient lediglich dazu, den einzelnen Angaben die Codes entsprechend dem
Wörterbuch zuzuweisen. Alle übrigen Arbeiten werden mit üblicher Büro-Software
oder mit eigens entwickelten (nicht übertragbaren) Routinen bearbeitet.
Selbst wenn Erfahrung in der Inhaltsanalyse und im Umgang mit
Textanalyse-Software vorliegt, die Einarbeitung in die Methode und Technik also nur
wenige Tage in Anspruch nimmt, bleibt immer noch der nicht zu unterschätzende
Arbeitsaufwand für die inhaltlich korrekte Bearbeitung der Berufsangaben.
Angabe "Sachbearbeiter" führt zu unterschiedlichen
Codes
| ISCO68
|
ISCO88
|
Stellung i. Beruf Branche |
| 39-
|
4000
|
o.n.A. |
| 39-
|
3439
|
i. Arbeitsamt StiB 52 |
| 310
|
3443
|
i. Jugendamt StiB 53 |
| 39
|
3432
|
b. Justiz |
| 582
|
5162
|
b. Polizei |
| 39-
|
4000
|
b. Post 20 |
| 393
|
3432
|
b. Versicherung 23
|
| 310
|
3443
|
b. Sozialversicherung 34 |
| 39-
|
3430
|
b. Stadtverwaltung StiB 53 |
| 39-
|
4130
|
f. Logistik |
| 392
|
4132
|
f. Materialwirtschaft |
| 022
|
2142
|
f. Straßenbau (Ingenieur) 14 |
| 339
|
4122
|
b. Bank 22 |
| 39-
|
3439
|
i. Bezirksamt (spezifische
Angabe) |
| 331
|
3433
|
i. Buchhaltung StiB 52 |
| 39-
|
3439
|
i. Entwicklungshilfeamt |
| 39-
|
3439
|
i. Stadtverwaltung StiB 52 |
| 129
|
2429
|
f. Unternehmensrecht (Jurist) |
Angabe "Erzieher/in" führt zu unterschiedlichen Codes
im ISCO-68
~ ohne nähere Angaben: 13-
~ an Berufsschulen/Gymnasien: 132
~ an Grund- und Hauptschulen bzw. "Horterzieher" in der alten DDR: 133
~ im Kindergarten, Krippe: 134
~ in Sonderschulen (mit Lehrauftrag): 135
~ für geistig Behinderte (Sozialarbeiter), ohne Sonderschullehrbefähigung
bzw. Lehrauftrag: 193
Was sind Entscheidung nach Erfahrung?
Beispiele:
| Angabe
|
Annahme
|
Code |
| Gästehaus
|
Pensionsinhaber
|
510/1315 |
| Steuerfachgehilfin
|
o.n.A. bei
Steuerberater beschäftigt |
331/4121 |
| Firmenberater
|
Unternehmensberater
|
090/2419 |
|
Außendienstmitarbeiter |
im Verkauf
Handelsvertreter |
432/3415 |
|
Landschaftsgärtnermeister |
o.n.A. angestellt
|
627/6113 |
| Betonfacharbeiter
|
meist Bau, nicht
Fabrik |
952/7123 |
| Oberstudiendirektor
|
Schuldirektor
|
139/1229 |
| Verkaufsberater
|
o.n.A. Verkäufer
|
451/5220 |
| Müllabfuhr
|
o.n.A. Müllwerker,
nicht Fahrer |
999/9161 |
| Fahrmeister
|
Fahrzeugmeister,
Werkstattmeister |
700/7900 |
| i. Gastronomie besch.
|
Bedienung
|
532/5123 |
| Kfz-Sachverständiger
|
meist
Maschinenbauingenieur |
024/2145 |
| Taxiunternehmer
|
mehr als 5
Beschäftigte |
211/1317 |
| Anlagenbetreuer
|
o.n.A.
Bankangestellter |
339/4122 |
| Sozialvers.
Angestellte |
o.n.A. i.
Krankenkasse |
393/3432 |
| Musiklehrerin
|
nicht an Schule
|
171/2453 |
Wofür wird die Branchenangabe gebraucht?
Branchen sind zu beachten bei Angaben wie
- Finanzangestellter (bes. beim KldB)
- Verwaltungsangstellte: Industrie = Büro, öffentl. Dienst = Verwaltung
- Hauspfleger (??)
- Fußbodenleger: Bau oder Raumaustatter
Der Umsteigeschlüssel vonS92 auf I88 im KldB-92-Buch gibt nicht den absolut
richtigen Code an.
Zu beachten sind die in der ausführlichen Auflistung vorne genannten
spezifischen Klassifikationen; z.B. sind bei Verkäufer und Schlosser die Branche
bzw. die Ausbildung zu berücksichtigen
Wieso steht der Kaufmann so viel schlechter da als
der Werbekaufmann?
Die MPS von Wegener wurde über 50 abgefragte Berufe mit Hilfe von darauf
aufbauenden Algorithmen entwickelt, ein Vorgang, der nicht bis ins einzelne
immer nachvollziehbar ist; unübersehbar sind darin einige Inkonsistenzen,
weshalb ich zur Korrektur/Kontrolle immer die anderen Prestige-Werte mitliefere.
Den niedrigen Wert für einen Beruf, von dem man nur weiß, daß er etwas mit dem
Verkaufen zu tun hat, erkläre ich mir damit, daß dabei an eine einfache
Verkäufertätigkeit gedacht wurde. Näheres müßten Sie bei Wegener selbst
nachlesen.
Weitere Werte, die prima vista sehr niedrig erscheinen, sind
1061 Journalist/Verleger 22.4 - ISCO-66: 49-
1058 Stahlkaufmann 22.4 - ISCO-66: 49-
Bei ID 1025: Vater ist selbst. Gärtner (54.1), Mutter ist Angestellte (68.3).
Es erscheint wenig plausibel, dass ein Selbständiger unterhalb einer
Angestellten rangiert.
Eine Angabe "Angestellte" ist nicht codierbar, weil es sich hierbei nicht um
eine Berufstätigkeit, sondern um die Beschreibung des Arbeitsverhältnisses
handelt, bekommt also den Code 004, dem Wegener den Durchschnittswert über alle
Berufe hinweg, 68.3, zugeordnet hat, während ein selbst. Gärtner- ISCO-68 = 612
- tatsächlich nur 54.1 bekommt.
Das Problem resultiert also neben den unzureichenden MPS-Werten (auch die
anderen Prestige-Skalen haben Mängel!) vor allem aus den ungenauen
Befragtenangaben, die zu Allgemeincodes und damit zu Durchschnittswerten mit den
damit verbundenen Ungenauigkeiten führen. Für große Datenmengen spielt dies
gewöhnlich keine so große Rolle, in der Einzelfallbetrachtung müßte man ggf.
selbst korrigierend eingreifen.
Blank (Leerzeichen) im ISCO-68
In der ISCO-68 dient ein Blank (Leerstelle oder „-" ) auf der dritten Stelle
dazu, in der Angabe nicht weiter spezifizierte oder spezifizierbare Berufe
(allgemeine Angaben) zu kennzeichnen.
a. Kann nur die Berufshauptgruppe, die oberste Hierarchie des dreistelligen
Codes, sicher verschlüsselt werden, dann werden die „Einsteller" mit folgenden
Codes dargestellt:
19- nicht weiter spezifizierte Wissenschaftler usw. (Berufshauptgruppe 1)
39- nicht weiter spezifizierte Bürokräfte (Berufshauptgruppe 3)
49- nicht weiter spezifizierte Handelsberufe (Berufshauptgruppe 4)
59- nicht weiter spezifizierte Dienstleistungsberufe (Berufshauptgruppe 5)
99- nicht weiter spezifizierte gütererzeugende Tätigkeiten usw.
(Berufshauptgruppe 9)
b. Kann auch die (zweistellige) Berufsuntergruppe verschlüsselt werden, aber
noch nicht die (dreistellige) Berufsgattung, dann wird die dritte Stelle der
Untergruppe durch ein Blank ersetzt; z.B.: Spinnereiarbeiter = 75-, denn dieser
Beruf gehört zur Gruppe 75 (Spinner, Weber, Stricker usw.), kann aber dort nicht
lokalisiert werden.
c. Wenn die angegebene Berufsbezeichnung mehrere Tätigkeitsuntergruppen
einschließt, ist nur der Code 99- möglich. Nicht weiter spezifizierte Arbeiter
(z.B. Fabrikarbeiter) werden unter 99- verschlüsselt. Desgleichen alle Arbeiter,
die nur ihren Arbeitsplatz angeben; z.B.: Arbeiter in einer Spinnerei = 99-,
aber Spinnereiarbeiter = 75-
Das ganze System stammt noch aus einer Zeit, als die Programme noch jedes
Blanks als Blanks lasen. Zunächst läge es nahe, anlog zur I88 bei unzureichenden
Angaben eine Null auf die entsprechende Stelle zu setzen. Das ist nicht
durchgängig möglich, weil diese Codes manchmal inhaltlich belegt sind und weil
auch weiterhin unterschieden werden sollte zwischen Angaben mit ungenau
beschriebenem Beruf (Allgemeinangaben) und spezifizierten Berufen, für die keine
Kategorien vorliegen, sonstige (spezifische) Angaben. Was dann z.B. nicht passen
würde: Code 300 sind Bürovorsteher. Gäbe es den Code 390, so würde er sonstige
spezifische Bürokräfte beschreiben, die sonst nicht einzuordnen sind. 490 sind
auch genau beschriebene Verkaufskräfte, für die es keine Kategorie gibt.
Um eine Verschiebung beim Einlesen zu vermeiden, muß der Code aufgeteilt
eingelesen werden, wie ich ihn nach Wunsch auch liefern kann (bes. im
Zusammenhang mit den alten OSIRIS-Variablen, wie sie noch immer im ALLBUS und
beim SOEP Verwendung finden) den I68-Code zweiteilig: 1. und 2. Stelle zusammen
und die die 3. Stelle erweitert auf 2 Stellen, wobei das Blank durch "10"
wiedergegeben wird und die anderen Ziffern eine führende Null erhalten (vgl.
Info OSIRIS.DOC).
Welche Leistungen bietet ZUMA an?
GESIS-ZUMA codiert seit den 70er Jahren Berufsangaben, meist nach der
ISCO, bei Bedarf auch nach der KldB des Statistischen Bundesamtes. Die ISCO -
International Standard Classification of Occupation - ist, wie der Name sagt,
international angelegt und anwendbar. Ein weiterer Vorteil ist, daß sich mit den
ISCO-Codes Prestige- und Statuswerte bilden lassen: SIOPS (Standard
International Occupation Prestige-Scale) nach Treiman, MPS (Magnitud-Prestige-Skala)
nach Wegener und ISEI (International Socio-Economic Index of
Occupational Status) nach Ganzeboom u.a. Wenn Angaben über Anzahl der
Mitarbeiter/Untergebenen und Selbständigkeit vorliegen, kann auch EGP (nach
Erikson, Goldthorpe und Portocarero) erstellt werden. Die ISCO-68 wird
dann gewählt, wenn ein Vergleich mit älteren Studien angestrebt ist, ansonsten
ist die ISCO-88 die gebräuchlichere. Beide Klassikationen sind trotz ihres
Namens nicht unmittelbar kompatibel; deshalb ist ggf. jeweils eine .eigene
codierung erforderlich.
Die ISEI-Skala wurde in den 90er Jahren entwickelt, die anderen noch
früher. Auch sonst sind die Skalen nicht bedenkenlos anzuwenden. Eine ernst zu
nehmende Alternative gibt es aber nicht. Weitere Informationen finden sich in
den Literaturhinweisen.
Kosten:: Für die Codierung von 1000 Berufsangaben nach der ISCO-88 mit
Generierung der ISEI- und SIOPS-Werte müssen mit ca. 400 EURO gerechnet werden,
zusammen mit der ISCO-68 und drei weiteren Prestigewerten (Treiman, Wegener,
Ganzeboom) belaufen sich die Kosten auf ungefähr 500 EURO. Genauere
Kalkulationen lassen sich erst machen, wenn u.a. die Qualität der Angaben
hinsichtlich ihrer Codierfähigkeit (auch mit Computerunterstützung) bekannt ist.
Branchencodierungen gehören auch zu unseren Serviceleistungen, nach einem
auf der NACE 2005 (Nomenclature générale des activités économiques dans les
Communautés Européennes) basierenden Schlüssel mit 35 Kategorien, aber auch nach
der NACE-Klassifikation (Statistisches Bundesamt und EU), wiederum nur
zweistellig - 60 Kategorien. Hierbei sind mit Kosten von ca. 300 Euro je 1000
Angaben zu rechnen.
Wie wird „Hausfrau und Mutter" klassifiziert?
Es ist ja nicht in den Klassifikationssystemen drin, und doch suchen wir nach
einem Weg, um z. B. zu ISEI und SIOPS-Werten zu gelangen. Gibt es z. B. einen
offiziellen Beruf, der als Annäherung an „Hausfrau" herangezogen wird?
Von den ausgeübten Tätigkeiten her entspricht die Hauswirtschafterin (Code
5121) ziemlich genau dem, was eine Hausfrau macht; bezüglich der Prestige- oder
der Statuszuweisung ist eine Gleichsetzung weniger möglich, denn die Kriterien,
nach denen die Skalenindizes gebildet werden, sind nicht erfüllt
(Erwerbstätigkeit, Einkommen, gesellschaftliche Anerkennung u.ä.)
Gibt es typische und häufig verwendete Fragen zur
Erhebung der Berufsbiographie? Gibt es einen Standard?
Es gibt nur einen Standard für die Berufsabfrage zur Codierung nach ISCO, die
idealerweise in einem Dreierschritt erfolgt:
1) Welche berufliche Tätigkeit üben Sie zur Zeit aus?
2) Bitte beschreiben Sie mir diese Tätigkeit genau.
3) Hat dieser Beruf noch einen besonderen Namen?
Als Interviewerhinweis: 'Bitte genau nachfragen'. Die Erfahrung hat gezeigt, daß
die Informationsmenge und -genauigkeit größer sind, wenn diese drei Fragen
getrennt nacheinander gestellt und ihre Antworten separat notiert werden.
Bei der Interviewerschulung muß darauf hingewiesen werden, daß nicht Titel oder
berufliche Stellung, sondern das, was jemand konkret tut, angegeben werden soll.
Demnach sind folgende Angaben nicht zulässig: Angestellter, Beamter,
Eisenbahner, Postbeamter, Technischer Angestellter, Abteilungsleiter,
Selbstständiger usw.
Im übrigen ist ihre Forschungsfrage maßgeblich, ob für Sie z.B. Lernberuf,
Einstiegsberuf, Beruf bei Veränderungen (Arbeitgeber, Position, Gehalt, Funktion
u.ä.) oder der aktuelle Beruf wichtig ist.
Vielleicht sind auch formale Zeitabschnitte (immer nach x Jahre nach Beginn der
Berufstätigkeit) oder bestimmte Lebenssituationen (Heirat, Umzug, bestimmes
Lebensalter u.ä.) wichtige Meßpunkte.
Als Hintergrundsvariablen für die Berufstätigkeit kommen in Frage: Schul- und
Berufsabschluß, Dauer, Branche, Betriebsgröße, Arbeitsstunden/-zeiten,
Vorgesetztenfunktion, Autonomie am Arbeitsplatz, Einkommen.
Zu typischen Fragesets kann ich nichts sagen, dazu müßten Sie in den
Methodenberichten von Lebensverlaufsstudien nachsehen.
Qualifikationsspezifische Merkmale über die KldB-92
Die KldB92 ist bezüglich einer qualifikationsspezifischen Klassifikation
völlig ungeeignet (leicht zu erkennen, wenn man sich einmal all die Berufe
anschaut, die unter ein und derselben Kategorie subsumiert werden); da hilft es
auch nicht viel, auf die ISCO-88 umsteigen zu wollen. Informationen, die in den
KldB-Kategorien nicht enthalten sind, kommen durch eine Umschlüsselung auch
nicht hinein, die Unschärfe wird eher größer.
Das Statistische Bundesamt stellt zwar einen Umsteigeschlüssel von KldB92 zu
ISCO88 zur Verfügung, die Validität des Schlüssels ist aber höchst fragwürdig.
Nähere Informationen zur Kompatibilität der Klassifikationen finden Sie in einem
ZUMA-Nachrichten-Beitrag von Alfons J. Geis und Jürgen H.P. Hoffmeyer-Zlotnik:
http://www.gesis.org/Publikationen/Zeitschriften/ZUMA_Nachrichten/documents/pdfs/48/zn48_11-mitteilungen-HZ.pdf
In welcher Form müssen die Daten für die
Berufsvercodung vorliegen?
Neben der Identifikation (Fragebogen-/Personenkennziffer) und dem Text der
Berufsangabe sind weitere Merkmale zum beruflichen Kontext sehr nützlich. Dazu
gehören, etwa in der Rangfolge ihrer Wichtigkeit: Stellung im Beruf
(ausführliche Gliederung), schulische, berufliche Ausbildung/Abschluß,
Betriebsgröße, Aufsichtsfunktion, Branche (auch Öffentlicher
Dienst/Privatwirtschaft), Einkommen, Alter/Geburtsjahr und was sonst an
Informationen zum beruflichen Hintergrund zur Verfügung steht. Mit diesen
Informationen kann bei weniger informativen Textangaben sicherer entschieden
werden bzw. die Quote der Missings oder unvollständigen Codes gering gehalten
werden. Notfalls ist auch eine Codierung ohne Zusatzinformationen möglich,
allerding mit den genannten Einschränkungen.
Die Daten sollten eines der folgenden Formate haben: ASCII/EBCDIC mit fixer
Struktur, SPSS, EXCEL, WORD-Tabelle und nach Absprache.
Geliefert wird i.d.R. ein ASCII-Datensatz mit fixer Struktur, der
Identifikation, Berufecodes und Prestige-/Status-Werte enthält.
Ergänzungen zur ISCO-Klassifikation
Missing-Werte
Die Werte für fehlende Angaben stellen keine Berufskategorien im engeren
Sinne dar, sind aber für ein problemfreies Datenmanagement und die korrekte
Auswertung unerläßlich. Dazu zählen 0001 (Soldat, einschließlich
Hauptfeldwebel), 0002 (Offizier - ab Leutnant), 0004 (nicht codierbar), 0005 (in
schulischer Ausbildung), 0006 (Hausfrau/-mann), 0007 (Rentner), 0008 (weiß
nicht) und 0009 (keine Angabe vorhanden oder verweigert).
ZUMA-Sondercodes
Es gibt häufig auftretenden Berufsangaben, die nicht genügend genau sind, um
sie einer ISCO-Kategorie eindeutig zuzuordnen. Um Missing-Werte zu vermeiden,
wurden für diese Angaben Sondercodes eingeführt:
2470 (wissenschaftliche Verwaltungskräfte, eine Kategorie der ISCO(COM)),
7510 (Schlosser, Betriebsschlosser), 7900 (Aufsichtskräfte, Meister in der
Produktion)
Restkategorien
Wenn Berufsangaben zu allgemein und ungenau sind - es liegt eine
Informationsdefizit auf Seiten des Befragten vor -, um sie einer Berufsgattung
(vierstelliger Code) zuordnen zu können, kann die Berufsuntergruppe,
Berufsgruppe oder die Berufshauptgruppe gewählt werden, wobei die nicht
spezifizierte Ebene durch Nullen dargestellt wird.
Im umgekehrten Fall, es liegen präzise Angaben vor, wofür es aber keine
Kategorien gibt - das Defizit liegt auf Seiten der Klassifikation, muß eine
Restkategorie (auch Auffangkategorie, Kategorie für sonstige Angaben) gewählt
werden. In der ISCO-Klassifikation sind diese Restkategorien nur ansatzweise
vorhanden, obwohl die Dezimalsystematik Platz dafür böte. Beispiel: In der
Berufsgruppe 32 (Biowissenschaftliche und Gesundheitsfachkräfte) werden auf der
Ebene der Berufsuntergruppe lediglich Biotechniker (321), moderne medizinische
Fachberufe (322), nicht-wissenschaftliche Krankenpflegekräfte (323) und
Heilpraktiker (324) aufgeführt. Um auch Gesundheitsfachkräfte, die keiner der
vier Gruppen angehören, codieren zu können, wurde die Kategorie 3290 (Sonstige
Biowissenschaftliche und Gesundheitsfachkräfte, anderweitig nicht genannt)
eingeführt. Insgesamt wurden in dieser Weise 90 zusätzliche Kategorien
eingeführt. In den Übersichten sind diese Kategorien i.d.R. typographisch
(Courier-Schrift) gekennzeichnet.
Aktualität der ISCO-Klassifikation - neue Berufe