Kurzskalen psychologischer Merkmale

Entwicklung und Validierung

Ziel der vorliegenden Arbeit war es, ein ökonomisches, valides und reliables Messinstrument für die Erfassung der Lebenszufriedenheit zu entwickeln und zu evaluieren. Dabei stand die Erfassung der Allgemeinen Lebenszufriedenheit im Fokus. Die Entwicklung einer oder mehrerer Messinstrumente für die Messung domainspezifischer Aspekte der Lebenszufriedenheit wurde nicht angestrebt. Vielmehr sprechen die in Abschnitt 2 dargestellten Befunde dafür, dass die Allgemeine Lebenszufriedenheit als globale Bewertung der Lebensqualität einen wertvollen Beitrag für die Prädiktion und Deskription sozialwissenschaftlicher Inhaltsvariablen leisten kann. Eine weitere Differenzierung der Messung schien an dieser Stelle deshalb nicht nötig.

Ausgangspunkt für die Skalenentwicklung der L-1 war die erstmals im Jahre 1978 im Wohlfahrtsstaatsurvey und anschließend im SOEP eingesetzte Einzelitem-Skala zur Messung der Lebenszufriedenheit (Wagner, 2007). Die Operationalisierung im SOEP beinhaltet dabei folgenden Itemwortlaut: „Wie zufrieden sind Sie gegenwärtig, alles in allem, mit Ihrem Leben?“. Die Befragten werden gebeten, die Frage auf einer bipolaren, 11-stufigen Antwortskala mit den Endpunkten (0) „ganz und gar unzufrieden“ und (10) = „ganz und gar zufrieden“ zu beantworten. Neben der 11-stufigen Antwortskala werden häufig 7-stufige Antwortskalen zur Messung der Allgemeinen Lebenszufriedenheit verwendet (z.B. British Household Panel Study, International Social Survey Programme, The Household, Income, and Labor Dynamics in Australia Study; Lucas & Donellan, 2012; Kroh, 2006).

Kroh (2006) hat die im SOEP realisierte Single-Item-Skala zur Erfassung der Allgemeinen Lebenszufriedenheit in Bezug auf die Anzahl der Antwortkategorien hin systematisch untersucht. Seine Befunde zeigen, dass die 11-stufige Antwortskala der 7-stufigen Alternative in Bezug auf die Reliabilität und die Validität überlegen ist. Die 11-stufige Antwortskala erlaubt darüber hinaus eine differenziertere Messung im hohen bzw. niedrigen Merkmalsbereich (Stichwort: Decken- bzw. Bodeneffekte). Surveyforscher weisen jedoch darauf hin, dass die kognitive Belastung des Befragten mit der Anzahl der Antwortkategorien zunimmt (Krosnick & Presser, 2010; Maitland, 2009). Vor diesem Hintergrund wurden in der vorliegenden Arbeit beide Antwortskalen-Alternativen miteinander verglichen (vgl. Tabelle 1, Stichprobe 2).

Die Entwicklung und Evaluation der Kurzskala zur Allgemeinen Lebenszufriedenheit erfolgte anhand dreier umfangreicher Stichproben. Die Charakteristika dieser Stichproben können Tabelle 2 entnommen werden. Stichprobe 1 ist eine Quotenstichprobe, geschichtet nach den Merkmalen Geschlecht, Alter, Bildung und Bundesland (N = 539). Die Grundgesamtheit war definiert als „alle in der Bundesrepublik Deutschland in Privathaushalten lebenden deutschsprachigen Personen ab 18 Jahren“. Die Erhebung erfolgte in zwei Wellen mit einem zeitlichen Abstand von 6 bis 10 Wochen. An Welle 2 nahmen N = 338 Befragungspersonen der Welle 1 teil. Die Daten wurden im Rahmen eines persönlich-mündlichen Interviews (CAPI) oder durch die Vorgabe eines Papierfragebogens erhoben. Die Erhebung dauerte im Mittel 53 Minuten (SD = 12). Bei Stichprobe 2 handelt es sich ebenfalls um eine Quotenstichprobe, geschichtet nach Geschlecht, Alter und Bildung (N = 741), die im Internet erhoben wurde (CAWI). Grundgesamtheit waren die Teilnehmer eines Online-Access-Pools im Alter von 18 Jahren oder älter, die in Deutschland leben. Die Bearbeitung des Onlinefragebogens dauerte im Mittel 23 Minuten (SD = 8). Stichprobe 3 mit N = 1134 Befragungspersonen ist eine Zufallsstichprobe, die repräsentativ für die Wohnbevölkerung in Deutschland über einem Alter von 18 Jahren ist. Sie wurde mithilfe des ADM-Stichprobensystems F2F (Random Route) der Arbeitsgemeinschaft deutscher Marktforschungsinstitute gezogen. Die Daten dieser Interviews wurden vollständig im CAPI-Modus erhoben (Dauer: M = 43, SD = 13).

Tabelle 2: Charakteristika der drei Stichproben
Stichprobe 1 Welle 1
Stichprobe 1 Welle 2Stichprobe 2Stichprobe 3
Stichprobe

Umfang [N]

5393387411134
ArtQuoteQuoteQuoteZufall
ModusCAPI, PapierCAPI, PapierCAWICAPI
Zusammensetzung
Geschlecht [% Frauen]52.552.151.855.6
Alter [M(SD)]47.2 (15.2)46.7 (15.1)48.3 (13.0)53.3 (18.4)
Bildung ≤ 9 Jahre44.745.340.137.2
10 Jahre30.227.929.137.0
≥ 11 Jahre23.725.430.825.8

Anmerkung: CAPI = Computer Aided Personal Interview, CAWI = Computer Aided Web Interview, Papier = Papierversion (Selbstausfüller)

Zunächst wurde eine Modifikation des SOEP-Einzelitems zur Allgemeinen Lebenszufriedenheit vorgenommen: Es wurde in Stichprobe 1 eine unipolare 7-stufige anstelle einer biploaren 11-stufigen Antwortskala verwendet. Hierfür wurden folgende Endpunkte gewählt: (0) „überhaupt nicht zufrieden“, (10) „völlig zufrieden“. Auf Basis von Stichprobe 1 wurde eine Item- bzw. Verteilungsanalyse der Itemrohwerte der Itemversion mit 7-stufiger Antwortskala vorgenommen (Zentrale Tendenz, Streuung, Schiefe, Exzess). Die Ergebnisse der Itemanalyse aus Stichprobe 1 (sowie den weiteren Stichproben) sind in Tabelle 1 dargestellt. Wie erwartet, ist die Verteilung der Itemrohwerte linksschief. Das Item hat folglich einen hohen Schwierigkeitsindex. Dies bedeutet, dass es den Befragten leicht fällt, dem Item im Sinne des Konstrukts zuzustimmen. Durch die eingeschränkte Streuung im oberen Merkmalsbereich ist die Differenzierbarkeit zwischen Personen mit Merkmalsunterschieden bei hohen Ausprägungen der Lebenszufriedenheit eingeschränkt. Auf der Basis der Befunde aus Stichprobe 1 wurde das Item in Stichprobe 2 den Befragten in zwei verschiedenen Versionen vorgelegt. Im Rahmen eines Within-Designs wurden die Befragten einmal zu Beginn und einmal zum Ende der Erhebung gebeten, das Item zu beantworten. Dabei wurde die Reihenfolge der Vorgabe der 7- bzw. der 11-stufigen Antwortskalenversion zufällig zwischen Personen variiert, um Reihenfolgeeffekte bei der Beantwortung der beiden Skalenversionen berücksichtigen zu können. Gruppe 1 beantwortete zu Beginn der Befragung die 7-stufige und zum Ende die 11-stufige Skalenversion. Gruppe 2 wurden die Skalenversionen in umgekehrter Reihenfolge präsentiert. Die Reihenfolge der Beantwortung der beiden Skalenversionen hatte keinen systematischen Effekt auf die Messwerte in den beiden Gruppen (7-stufig: M Gruppe1 = 3.64, SD Gruppe1 = 1.22; M Gruppe2 = 3.81, SD Gruppe2 = 1.13; t 7-stufig [658] = -1.87, p = .06; 11-stufig: M Gruppe1 = 6.71, SD Gruppe1 = 2.52; M Gruppe2 = 6.50, SD Gruppe2 = 2.29; t 11-stufig [626] = 1.10, p = .27). Beide Skalenversionen korrelierten mit r = .85 (p < .001, n = 571) stark positiv miteinander. Da die 11er-Antwortskala eine bessere Differenzierung im höheren Merkmalsbereich erlaubt, wurde diese als finale Skalenversion in Stichprobe 3 eingesetzt und evaluiert.    

Die Fragebogenbatterie in Stichprobe 3 beinhaltete neben der L-1 umfangreiche soziodemographische Maße, weitere psychologische Messinstrumente sowie einige sozialwissenschaftliche Validierungsmaße. Die Items zu den soziodemographischen Angaben wurden größtenteils den demographischen Standards des Statistischen Bundesamtes (2010) entnommen. Für die Validierung kamen etablierte Standardinstrumente, z. B. zur Erfassung von Allgemeiner Lebenszufriedenheit (SWLS, Diener et al. 1985; nur in Stichprobe 1), verschiedene Maße zur domainspezifischen Lebenszufriedenheit (in Anlehnung an SOEP 2010), Optimismus (SOP2, Kemper et al., 2013), den Hauptdimensionen der Persönlichkeit nach dem Fünf-Faktoren-Modell (BFI-10, Rammstedt & John, 2007), Selbstwert (Rosenberg, 1989; nur in Stichprobe 2), allgemeine Selbstwirksamkeitserwartung (Schwarzer & Jerusalem, 1999; nur in Stichprobe 1) und eigens entwickelte Skalen zum Einsatz (siehe Publikationen auf der GESIS Kurzskalenwebsite). An für die sozialwissenschaftliche Forschung relevanten Maßen wurde unter anderem die Größe des sozialen Netzwerks, die Effort-Reward-Imbalance (Siegrist et al., 2004), der Gesundheitszustand (SF-12; Bullinger & Kirchberger, 1998) und das Einkommen erhoben. Alle Erhebungen wurden von unabhängigen kommerziellen Anbietern durchgeführt. Um die psychometrische Güte der konstruierten Skala zu überprüfen, wurden auf der Grundlage der oben beschriebenen Stichproben Kennwerte für die Reliabilität und verschiedene Aspekte der Validität berechnet (für Details zur Validierung von Persönlichkeitsskalen siehe Bühner, 2011; Lienert & Raatz, 1998).