Neue Publikation: Axenfeld, Bruch & Wolf: General-purpose imputation of planned missing data in social surveys: Different strategies and their effect on correlations.


Kategorien: GESIS-News

Axenfeld, Julian, Christian Bruch, and Christof Wolf. 2022. "General-purpose imputation of planned missing data in social surveys: Different strategies and their effect on correlations." Statistics Surveys 16 182-209. doi: https://doi.org/10.1214/22-SS137.

Geplant fehlende Werte in sozialwissenschaftlichen Befragungen, beispielsweise infolge eines Split Questionnaire Designs, treten in der Umfrageforschung immer häufiger auf. Um hinlänglich analysierbare Daten zu erhalten, ist hierbei oftmals eine Imputation erforderlich. Die statistische Modellierung bei der Imputation solcher Daten kann jedoch aufgrund niedriger Korrelationen, einer Großzahl möglicher Prädiktoren und begrenzter Stichprobengrößen mit enormen Herausforderungen verbunden sein. Der vorliegende Beitrag stellt Ergebnisse aus einer Monte-Carlo-Simulation vor, in der basierend auf Daten des German Internet Panels (GIP) die Validität von Korrelationsschätzungen in einem Split Questionnaire Design unter Verwendung verschiedener Imputationsstrategien untersucht wird. Dabei zeigt sich, dass Ansätze, die die Imputation vereinfachen, zu guten Ergebnissen führen können (z. B. Predictive Mean Matching mit Dimensionsreduktion oder wenigen Prädiktorvariablen). Demgegenüber können insbesondere Generalisierte Lineare Modelle für kategoriale Daten, Klassifikationsbäume (CART) und Imputationsmodelle mit vielen Prädiktorvariablen starke Verzerrungen zur Folge haben.