Folge verpasst? Kein Problem! In unserem Veranstaltungsarchiv finden sie sämtliche Ausgaben unserer Expert*innenreihe zum Nachhören. In den Informationen zur Veranstaltung finden Sie den Link zu den Aufzeichnungen auf Youtube. Zusätzlich haben Sie die Möglichkeit, die Powerpoint-Folien herunterzuladen.

Staffel 4: Umfragedaten durch Verknüpfung und Harmonisierung erweitern 

Diese „Meet-the-Experts“ -Reihe präsentiert einen Überblick über Angebote der Abteilung „Survey Data Curation“.  Wir stellen Angebote vor, die Umfragedatensätze erweitern, indem sie diese mit anderen Datentypen verbinden oder über Umfrage-Wellen und Länder kumulieren. Die Vortragsreihe umfasst Vorträge zur Verbindung von Umfragen mit Geodaten (Geocoder-Software und eine Anwendung mit der GLES) oder mit expertenkodierten Daten, eine Anwendung des kumulierten ALLBUS und das Eurobarometer mit seinen Erweiterungen. 

 Folien  (2,59 MB)  |   Vortrag auf YouTube   |   MTE Playlist

Der Vortrag findet auf Englisch statt.

Traditionell verwenden quantitative Sozialwissenschaftler*innen vor allem Umfragen zur Untersuchung sozialer Phänomene. So nützlich sie sind, erfassen Umfragen zumeist selbstberichtete, retrospektive individuelle Wahrnehmungen in Querschnitten oder in größeren Zeitabständen. Sozialwissenschaftliche Theorien hingegen beschränken sich selten auf individuelle, sich nur langsam verändernde Faktoren. Individuelles Verhalten ist in soziale, zeitliche und räumliche Kontexte eingebettet. Durch die digitale Revolution sind inzwischen große Mengen an Kontextdaten aus amtlichen Statistiken, Sozialversicherungen, Medien und einer Vielzahl anderer Quellen verfügbar. Diese Daten decken wichtige organisatorische, zeitliche oder räumliche Dimensionen des menschlichen Handlungsraums ab. Wissenschaftler*innen haben damit begonnen, diesen neu verfügbaren Datenraum zu nutzen, um Umfragen mit Kontextinformationen anzureichern.

Die Verknüpfung von Umfragedaten mit anderen Datentypen stellt jedoch eine konzeptionelle und praktische Herausforderung dar. In diesem Vortrag geben wir einen Überblick über vier solcher Herausforderungen, die bei der Arbeit mit verschiedenen Datentypen entstehen – und über mögliche Lösungsstrategien. Zunächst erörtern wir die Problematik der Einholung der Zustimmung zur Verknüpfung von Umfragedaten mit dem Internetverhalten. Wir verweisen auf Strategien, um die Verzerrung der Stichprobe durch Selbstselektion zu verringern. Zweitens stellen wir die Herausforderung dar, geeignete Aggregationsebenen für räumliche Daten zu wählen. Geocodierer bieten eine Lösung, indem sie eine maßgeschneiderte Verknüpfung mit Umfragedaten ermöglichen. Drittens diskutieren wir die Herausforderung, den Treatment-Status von Befragten in realen Experimenten zu identifizieren, wenn bedingt durch den Datenschutz eine vollständige Offenlegung nicht möglich ist. Pseudo-Randomisierungstechniken können dafür eine Lösung sein. Viertens stellen wir die Herausforderung dar, Zeiträume der von expertenkodierten Daten mit Umfragedaten in Einklang zu bringen. Durch sorgfältige Dokumentation und Datenverwaltung kann dieses Problem reduziert werden.

Referenten:

Dr. Pascal Siegers

Dr. Sebastian Ziaja 

 Folien (1,49 MB)  |   Vortrag auf YouTube   |   MTE Playlist

Der Vortrag findet auf Englisch statt.

In diesem Vortrag wird ein Ansatz zur Verknüpfung von Daten vorgestellt, der Experteneinschätzungen zur Integrität von Wahlen mit Umfragedaten kombiniert, um zu untersuchen, wie die Integrität von Wahlen die Art und Weise beeinflusst, wie sich Wahlergebnisse in den Einstellungen der Bürger*innen zum politischen System niederschlagen. Es wird ein kausaler Mechanismus vorgestellt, der politische Niederlagen über die Bewertung der Wahlfairness mit politischem Vertrauen verknüpft: Bürger*innen, die für das unterlegene Lager gestimmt haben, empfinden den Wahlprozess mit größerer Wahrscheinlichkeit als unfair als Bürger*innen, die für das siegreiche Lager gestimmt haben, was zu politischem Misstrauen führt. Die Studie legt ferner nahe, dass die Auswirkungen politischer Niederlagen vom Grad der Integrität der Wahlen abhängen. Wenn die Wahlen frei und fair durchgeführt werden, haben selbst diejenigen, die für das unterlegene Lager gestimmt haben, wenig Grund, Wahlbetrug zu vermuten. Wenn es jedoch tatsächlich Anzeichen für Unstimmigkeiten im Wahlablauf gibt, haben die politischen Verlierer viel mehr Grund, an der Integrität des Wahlprozesses zu zweifeln als diejenigen, die mit dem Wahlergebnis zufrieden sind. Das Projekt nutzt einen speziell angereicherten Datensatz, der Umfragedaten aus drei länderübergreifenden Umfrageprojekten (Asian Barometer Survey, European Social Survey, Latinobarómetro) ex-post harmonisiert und diese Umfragedaten mit Experteneinschätzungen zur Integrität von Wahlen verknüpft, die vom Varieties-of-Democracy-Projekt (V-Dem) für 45 Demokratien in Europa, Ostasien und Lateinamerika bereitgestellt wurden. Der Vortrag beschreibt, wie die Befragten (in den Umfragedaten) den Wahlen (in den V-Dem-Daten) zugeordnet wurden, und erörtert die Herausforderungen, die sich daraus ergeben, dass die Zeiträume der Datenerhebung nicht mit den Wahlzyklen übereinstimmen.

Referentin:

Dr. Marlene Mauk 

 Folien (1,68 MB)   |   Vortrag auf YouTube   |   MTE Playlist

Der Vortrag findet auf Englisch statt.

Die Analyse des weltweiten Anstiegs politischer Ressentiments und Unterstützung für rechtsradikale Parteien zeigt starke räumliche Muster innerhalb der betroffenen Länder. Vor diesem Hintergrund gehen einige Wissenschaftler*innen so weit, von der "revenge of the places that don't matter" (Rodríguez-Pose 2018) zu sprechen und zeigen, dass abgehängte Orte als Nährboden für Unzufriedenheit dienen.

Dieses Phänomen, das auch unter "Land-Stadt-Gefälle", "räumliche Polarisierung", "Geografie der Unzufriedenheit" oder "abgehängte Orte" bekannt ist, hat in den letzten Jahren zunehmend die Aufmerksamkeit der Wissenschaft auf sich gezogen. Die Analyse der Mechanismen dieser ortsbezogener Effekte auf der Mikroebene erfordert jedoch die Verknüpfung von Umfragedaten mit kleinräumigen Kontextinformationen.

Dieser Vortrag stellt geokodierte Umfragedaten der German Longitudinal Election Study (GLES) vor und gibt einen Überblick über den Datenaufbereitungsprozess, die Datensatzstruktur und den Datenzugang. Mit einem Fokus auf der Bundestagswahl 2021 zeigt der Vortrag die Anwendungsmöglichkeiten für die Forschung auf, die sich aus der Verknüpfung dieser georeferenzierten Umfragedaten mit administrativen Daten ergeben. Es werden empirische Ergebnisse präsentiert wie Kontextfaktoren die Einstellungen von Individuen beeinflussen und zur rechtsradikalen Wahl beitragen.        

Referentin:

Anne-Kathrin Stroppe

 Folien (3,11 MB)   |   Vortrag auf YouTube   |   MTE Playlist

Der Vortrag findet auf Deutsch statt.

Die Allgemeine Bevölkerungsumfrage der Sozialwissenschaften (ALLBUS) stellt einen zentralen Bestandteil der sozialwissenschaftlichen Infrastruktur in Deutschland dar. Seit dem Jahr 1980 werden im Rahmen wiederholter Querschnittsbefragungen alle zwei Jahre Einstellungen, Verhaltensweisen und soziodemografische Merkmale der deutschen Bevölkerung erhoben. Die Replikation von Fragekomplexen und ein konstantes soziodemografisches Fragemodul bieten ein reichhaltiges Datenangebot zur Untersuchung der deutschen Gesellschaft und ihres sozialen Wandels. Im Mittelpunkt jeder ALLBUS-Erhebung stehen ein oder zwei wechselnde Themenschwerpunkte. Für Themenschwerpunkte wird im Allgemeinen ein 10-jähriger Replikationszyklus angestrebt. Der Vortrag bietet eine Einführung in die Analysepotentiale des ALLBUS und stellt das vorliegende Datenangebot vor. Hierbei liegt ein besonderer Schwerpunkt auf dem Datenangebot der ALLBUS-Kumulation, deren lange Zeitreihen eine Analyse des sozialen Wandels von bis zu 40 Jahren ermöglichen. Ebenfalls werden zentrale Änderungen in der ALLBUS-Methodik und dem Stichprobendesign beleuchtet. Konkrete Anwendungsbeispiele bieten einen Einstieg in den Datensatz der Kumulation und die Berücksichtigung von Veränderungen bezüglich der ALLUS-Methodik bei längsschnittlich orientierten Analysen.

Referentin:

Dr. Sonja Schulz

 Folien (1,82 MB)   |   Vortrag auf YouTube   |   MTE Playlist

Der Vortrag findet auf Englisch statt.

Das Eurobarometer, welches im Auftrag der Europäischen Kommission und des Europäischen Parlaments durchgeführt wird, ist eines der am längsten laufenden internationalen Umfrageprogramme. Die Befragung erstreckt sich über fünf Jahrzehnte und mehr als 200 Wellen von Standard- und Spezial-Eurobarometer-Umfragen. Darüber hinaus gibt es mehr als 500 so genannte Flash-Eurobarometer sowie weitere Erhebungen wie das Mittel- und Osteuropa-Eurobarometer, das Eurobarometer der Beitrittsländer und die jüngst erhobenen COVID-19-Umfragen, die im Auftrag des Europäischen Parlaments durchgeführt wurden.

Im Rahmen des „Meet the Experts“-Vortrags wird ein Überblick über diese Daten, ihre Geschichte und thematische Breite sowie ihre wichtigsten Vorteile gegeben. Die Präsentation wird dabei auch auf Forschungspublikationen zurückgreifen, die die spezifischen Vorteile dieser Erhebung für eine ganze Reihe von Themen und methodischen Ansätzen veranschaulichen. Zudem werden auch einige der besonders außergewöhnlichen Varianten der Eurobarometer-Datenbestände erwähnt, wie z. B. Umfragen bei Jugendlichen, Unternehmen oder in Ländern außerhalb des europäischen Kontextes. Schließlich ist geplant, eine Auswahl von nutzergenerierten und bei GESIS verfügbaren Kumulationen dieser Umfragen zu präsentieren. Damit gibt der Vortrag einen Überblick über die Möglichkeiten des Eurobarometers für eine Vielzahl von Themen und Disziplinen.

Referent:

Dr. Boris Heizmann

 Folien (9,11 MB)   |   Vortrag auf YouTube   |   MTE Playlist

Der Vortrag findet auf Englisch statt.

Geodaten sind in den Sozialwissenschaften zunehmend verbreitet. Die Anwendungen erstrecken sich nicht nur auf die Analyse klassischer geografischer Einheiten (z. B. die Verbreitung politischer Maßnahmen in räumlich nahe beieinander liegenden Ländern), sondern auch auf die Analyse von Daten auf Mikroebene, einschließlich Befragungsdaten aus georeferenzierten Umfragen oder Nutzerdaten aus sozialen Medien. Die Georeferenzierung von Erhebungs- und digitalen Verhaltensdaten eröffnet neue Möglichkeiten für die räumliche Verknüpfung mit Kontextvariablen, wie z. B. Emissionswerten aus Industrie oder Verkehr, Flächennutzungsindikatoren oder sozioökonomischen Variablen. Gleichzeitig bringt die räumliche Verknüpfung aber auch neue Herausforderungen mit sich, insbesondere im Hinblick auf Aspekte des Datenschutzes.

Dieser Vortrag stellt aktuelle Projekte zur Geokodierung bei GESIS vor. Vorgestellt wird zudem ein Geokodierungstool, das auf den Daten des Bundesamtes für Kartographie und Geodäsie (BKG) in Deutschland basiert: den bkggeocoder. Der bkggeocoder ermöglicht den Zugriff auf die geokodierte Adressdatenbank des BKG über eine R-Schnittstelle. Registrierte Nutzer*innen der BKG-Dienste, wie z.B. GESIS, können die API des BKG direkt nutzen, um geokodierte Adressinformationen in einer aufgeräumten Datentabelle zu erhalten, einschließlich wichtiger Informationen zur Datenqualität. Alternativ dazu bietet ein Offline-Interface feinere Methoden zur Bewältigung von Datenschutzproblemen für Fälle, in denen eine API die Anforderungen eines bestimmten Projekts an die Datenspeicherung nicht erfüllen kann. 

Referent:

Dr. Stefan Jünger

 Folien  (1,06 MB)  |   Vortrag auf YouTube   |   MTE Playlist

Der Vortrag findet auf Deutsch statt.

Alle personenbezogenen Umfragen messen grundlegende soziodemographische Merkmale der Befragten. Zur Erhebung dieser Merkmale in deutschen Umfragen liegen mit den „Demographischen Standards“ seit den späten 1970er Jahren Empfehlungen vor. Jedoch können nicht alle Umfragen die dort empfohlenen Standarditems einsetzen. Die Daten unterschiedlicher Umfragen können daher nicht ohne weiteres miteinander verglichen oder verknüpft werden (s. auch doi.org/10.5281/zenodo.6810973). Für einzelne soziodemographische Merkmale liegen bereits amtliche Klassifikationen vor (bspw. die Klassifikation der Berufe KldB). Für die meisten Merkmale ist dies jedoch nicht der Fall. KonsortSWD hat sich zum Ziel gesetzt, diese Lücke zu schließen. Dazu wurden für Merkmale, für die bislang keine allgemein akzeptierte Zielvariable bzw. Klassifikation vorliegt, Spezifikationen für Standardvariablen entwickelt bzw. vorhandene Standards für die Anwendung auf Umfragedaten angepasst. Diese wurden einer umfangreichen empirischen Validierung und Diskussion mit Experten und potenziellen Nutzenden unterzogen. Im Rahmen des Vortrags werden die entwickelten soziodemographischen Standardvariablen sowie die Validierungsergebnisse vorgestellt. 

Referenten:

Dr. Silke Schneider, Lennart Palm

 Folien (1,61 MB)   |   Vortrag auf YouTube   |   MTE Playlist

Der Vortrag findet auf Englisch statt.

Da Wissenschaftler*innen zunehmend den potenziellen Nutzen erkennen, der sich aus der Kombination verschiedener Erhebungsdatenquellen ergibt, hat GESIS in den letzten Jahren begonnen, sein Angebot an harmonisierten Datensätzen zu erweitern (manchmal in Form von Syntax-Files, die die Harmonisierung auf der Seite der Nutzenden durchführen). Ziel ist es, den Wissenschaftler*innen den oft sehr mühsamen und fehleranfälligen Prozess der nachträglichen Harmonisierung und Zusammenführung großer Datensätze zu ersparen, indem harmonisierte Datensätze zur sofortigen Nutzung in Bereichen zur Verfügung gestellt werden, in denen wir die größte Nachfrage erwarten oder relevante Forschungsmöglichkeiten sehen.  

In diesem Vortrag wird die Bandbreite solcher Angebote insbesondere im Bereich der ländervergleichenden Erhebungen dargelegt und es werden einige Beispiele für harmonisierte Datensätze und Projekte vorgestellt, die im GESIS-Datenarchiv zur Wiederverwendung zur Verfügung stehen. Anschließend werden wir die potenziellen Probleme im Zusammenhang mit der Erstellung und folglich auch mit der Nutzung großer harmonisierter Datensätze eingehender erörtern, um ein besseres Verständnis für den Nutzen solcher Datensätze, aber auch für die damit verbundenen methodischen Einschränkungen zu ermöglichen. Wir werden diese Thematik anhand von Beispielen behandeln, die mehrere Erhebungsquellen mit unterschiedlichem Grad an Heterogenität kombinieren.   

Der Vortrag kann somit als eine Anleitung zum kompetenten Umgang mit solchen Datensätzen verstanden werden, die potenzielle Nutzende sowohl auf Möglichkeiten als auch auf praktische Fallstricke im Umgang mit solchen Daten aufmerksam macht. 

Referenten:

Markus Quandt, Ivet Solanes Ros