39. GESIS Methodenseminar (2019)

08.07. - 26.07.2019, Köln

Das GESIS-Methodenseminar (früher: ZHSF-Herbstseminar) vermittelt – forschungsbasiert und praxisnah – Grundlagenwissen und -fertigkeiten im Umgang mit quantitativen Forschungsdaten. Die deutsch- und englischsprachigen Kurse sind modular strukturiert und interdisziplinär ausgerichtet.

Die deutschsprachigen Basis- und Aufbaumodule vermitteln die Grundlagen der uni- und bivariaten Statistik sowie die Theorie und Anwendung grundlegender Verfahren der multivariaten Datenanalyse. Die englischsprachigen Big Data-Module vermitteln die Grundlagen von Verfahren aus dem Bereich der Data Science, wie sie bei der Analyse von Big Data zum Einsatz kommen.

Modulbeschreibung

Das Modul vermittelt analysepraktische und mathematische Grundlagen der uni- und bivariaten Statistik. Im Zentrum des Kurses stehen dabei ausgewählte Koeffizienten der bivariaten Zusammenhangs- und Regressionsanalyse, aber auch parametrische und nonparametrische Tests zur Unterschiedsprüfung werden vorgestellt. Alle Analysen werden mit dem Statistikpaket Stata durchgeführt, einige grundlegende Koeffizienten werden zusätzlich „per Hand“ berechnet. Nötiges Wissen für eine inferenzstatistische Interpretation der Koeffizienten wird ebenfalls vermittelt. Darüber hinaus vermittelt der Kurs Techniken zum Datenmanagement und zur Datenaufbereitung mit Stata und gibt einen Ausblick auf weiterführende multivariate Verfahren.

Lernziele

Am Ende des Moduls sollen Teilnehmende anhand der Eigenschaften des Datenmaterials und der Forschungsfrage geeignete Koeffizienten der uni- und bivariaten Statistik auswählen, mit Stata berechnen und interpretieren können. Die im Kurs vermittelten Grundlagen der bivariaten Zusammenhangs- und Unterschiedsprüfung können in weiterführenden Kursen über Regressions- und Varianzanalysen ausgebaut werden.

Referent*innen

Katja Salomo ist seit 2012 wissenschaftliche Mitarbeiterin am Institut für Soziologie der Friedrich-Schiller-Universität Jena am Arbeitsbereich Methoden der empirischen Sozialforschung und Sozialstrukturanalyse. Sie forscht zu anti-demokratischen und rechtsextremen Einstellungen, Partizipation und politischer Gewalt, insbesondere deren Determinanten auf Individual- und Kontextebene in Europa. Durch Mitarbeit in zahlreichen Projekten hat sie Erfahrung mit empirischer sozialwissenschaftlicher Forschung von der Datenerhebung bis zur Publikation gesammelt. Ihre Lehrerfahrung im Bereich der Methodenausbildung umfasst mehr als 20 Seminare für Anfänger und Fortgeschrittene.

Björn Seipelt ist seit 2018 wissenschaftlicher Mitarbeiter am Institut für Soziologie der Friedrich-Schiller-Universität Jena am Arbeitsbereich Methoden der empirischen Sozialforschung und Sozialstrukturanalyse. Außerdem arbeitet er seit 2017 in einem interdisziplinär angelegten Projekt am Leibniz Center for Science and Society (LCSS) in Hannover. Er forscht zu herkunftsspezifischen sozialen Ungleichheiten. Seit 2017 führt er regelmäßig Lehrveranstaltungen zu quantitativen Methoden der empirischen Sozialforschung durch.

Modulbeschreibung

In the wake of the digital revolution, masses of Digital Behavioral Data (DBD) are becoming available for social research. Typically, this data has a relational dimension. As a consequence, network analysis is becoming increasingly important as a social science method. The social networks constructed from DBD, however, are much larger than the small-scale structures classically studied in the past. They give rise to higher-order structures and functionalities (complexity) that spring from lower-order processes. Plus, DBD typically allows for the analysis of the dynamics of these so-called complex networks. In this course, we present a basic understanding of social relations, the structures and dynamics which they collectively self-organize into, and how network methods and programming in Python can be deployed in practical application scenarios. Following an introduction to data formats, network construction, and plotting, the first day covers node-level measures such as centrality. The second day deals with community detection and stochastic blockmodeling, the main classes of methods at the meso-scale of analysis. The third day focuses on macro-scale structures and dynamics. It covers the small-world and scale-free properties that make networks complex and why these are relevant for the social sciences. The fourth day is dedicated to simulations of social mechanisms (network generation) and dynamics on networks. The last day is reserved for group projects. The program plan alternates between demonstrations and exercises. The former presents the theoretical and technical background of network analysis, while the latter allows participants to apply acquired knowledge with code directly.

Lernziele

Participants will obtain profound knowledge of relational methods integrated with social theory. The course includes material typically taught in Social Network Analysis classes but goes beyond it regarding the topic of complexity. Hence, it is aimed at scholars who are interested in the potential of BDB and how networks can be analyzed in an interdisciplinary way. Throughout the course, the Python libraries are used that are most suited for the respective analysis task. For example, community detection will be done with networkx while graph-tool is the library of choice for stochastic blockmodeling. To ease access to network analysis, well-known, also small, datasets are used. Participants are strongly encouraged to bring their own datasets to be analyzed in group projects or during the course.

Referent*innen

Dr. Fariba Karimi is a postdoctoral researcher at the Computational Social Science department at GESIS. She received her PhD in Physics and Computational Science from Umea University. Her research interests lie in network analysis, complex systems, and data science.

Dr. Haiko Lietz is a sociologist with an engineering background. His dissertation at the University of Duisburg Essen is about network theory and analysis of scientific practice (2016). He is a post-doc researcher at the Computational Social Science department at GESIS, focussing on complex systems approaches, analytical and relational sociology.

Dr. Marcos Oliveira is a postdoctoral researcher at the Computational Social Science department at GESIS. He received his PhD in Computer Science from the Florida Institute of Technology. His research interests lie in complex systems, city science, human dynamics, and self-organizing mechanisms.

Modulbeschreibung

In the digital age, large collections of text are an increasingly attractive data source for analysis in the social sciences. Corpora from thousands up to several millions of retro-digitized or natively digital documents cannot be investigated with conventional, manual methods alone. (Semi-)automatic computational analysis algorithms, also known as text mining, provide interesting opportunities for social scientists to extend their toolbox. To realize complex designs in empirical social research, scientists need basic knowledge of computational algorithms to be able to select those appropriate for their needs. Specific projects may further require certain adaptations to standard procedures, language resources or analysis workflows. Instead of relying on off-the-shelf analysis software, using script programming languages is a very powerful way to fulfill such requirements. The course teaches an overview of text mining in connection with data acquisition, preprocessing and methodological integration using the statistical programming language R (www.r-project.org). In sessions alternating between lectures and tutorials, we teach theoretical and methodological foundations, introduce exemplary studies and get hands on programming to realize different analyses.

Lernziele

Participants will learn about opportunities and limits of text mining methods to analyze qualitative and quantitative aspects of large text collections. With example scripts provided in the programming language R, participants will learn how to realize single steps of such an analysis on a specific corpus. We cover a range of text mining methods from simple lexicometric measures such as word frequencies, key term extraction and co-occurrence analysis, to more complex machine learning approaches such as topic models and supervised text classification. The goal is to provide a broad overview of several technologies already established in social sciences. Participants will be enabled to identify their own priorities and to lay foundations for further independent studying tailored to their individual needs.

Referenten

Dr. Gregor Wiedemann works in the Language Technology processing (NLP) group at Hamburg University. He studied political science and computer science in Leipzig and Miami. In 2016, he received his doctoral degree in computer science for his dissertation “Text Mining for Qualitative Data Analysis in the Social Sciences”. Wiedemann has worked in several projects in the fields of digital humanities and computational social science where he developed methods and workflows to analyze large text collections.

Dr. Andreas Niekler is a researcher at Leipzig University. He studied media technology at HTWK Leipzig and the University of West Scotland. After two years working as a freelance programmer and teacher at the Leipzig School of Media, he joined the NLP group at Leipzig University. In his dissertation project he worked with automated methods for content and topic analyses in news-oriented text sources.

Modulbeschreibung

Konfirmatorische Faktorenanalysen, explorative Faktorenanalysen (Hauptkomponenten-/Hauptachsenanalysen) und Clusteranalysen (hierarchisch, partitionierend) sind die am weitesten verbreiteten Verfahren zur Komplexitätsreduktion und kommen insbesondere im Rahmen der Skalenkonstruktion bzw. Typenbildung zum Einsatz. Wenngleich sich Faktoren- und Clusteranalysen sinnvoll ergänzen lassen, werden sie häufig auch gewinnbringend unabhängig voneinander angewandt. Ausgehend von „einfacher“ Indexbildung über additive Skalen (z.B. Mittelwertskala) oder Mehrfeldertafeln zur Typenbildung werden im Seminar zunächst die Grenzen dieser einfachen Vorgehensweisen aufgezeigt. Darüber werden die Einsatzfelder von Faktoren- und Clusteranalysen vorgestellt, und in den Kontext weiterer komplexitätsreduzierender Verfahren eingeordnet. Nebenbei wird so auch in grundlegende Begriffe der Operationalisierung und Indexbildung eingeführt, sowie für die Umsetzung in Stata relevantes Randwissen wiederholt (Datengewichtung, Umgang mit fehlenden Werten, etc.). Im Anschluss widmet sich das Seminar den einzelnen Verfahren und deren Umsetzung in Stata. Schwerpunkt konfirmatorischer Faktorenanalysen ist das Testen von theoretisch begründeten Annahmen hinsichtlich der Existenz und dimensionalen Struktur latenter Konstrukte, auf die sich eine Anzahl konkret gemessener Indikatoren zurückführen (reduzieren) lassen. Die größte Herausforderung stellt hier meist die richtige Übersetzung dieser theoretischen Annahmen in geeignet modellierte Faktorenmodelle dar, was entsprechend ausführlich und stets anwendungsorientiert im Seminar besprochen wird. Verfahren der explorativen Faktorenanalyse setzen weniger konkrete Annahmen voraus, was die Wahl des statistischen Modells unter Umständen erleichtert, jedoch die Interpretation erschwert und folglich im Seminar geübt wird. Aus der Familie der Clusteranalysen liegt der Schwerpunkt auf hierarchischen Verfahren, während partitionierende Verfahren (k-Means Algorithmus) als Ergänzung zu hierarchischen Verfahren (oder als einzige Alternative zu diesen bei sehr großen Datenmengen) vorgestellt werden. Zur Verbesserung der Interpretationsmöglichkeiten der Ergebnisse von Clusteranalysen werden zudem grundlegende Verfahren zum Vergleich von Gruppen vorgestellt. An Beispielen aus dem Thüringen-Monitor 2015 und anderen sozialwissenschaftlichen Datensätzen wird den Teilnehmenden ein sicherer Umgang mit den genannten Verfahren vermittelt.

Lernziele

Das Seminar vermittelt folgende Kompetenzen: (1) Einschätzung (ob und) welche der vorgestellten Verfahren zur Komplexitätsreduktion im konkreten Fall gewinnbringend angewandt werden können. (2) Beurteilung, welche Konsequenzen die Eigenschaften von Forschungsfrage und Datenmaterial für die Modellspezifikation haben. (3) Umsetzung dieserart spezifizierten Analysen in Stata. (4) Interpretation der Ergebnisse mit Blick auf die Forschungsfrage. (5) Ableitung des weiteren Vorgehens bis zur zufriedenstellenden Beantwortung der Forschungsfrage im Rahmen der Möglichkeiten. Das Seminar legt die Grundlagen für eine vertiefende Beschäftigung mit den vorgestellten Verfahren im Frühjahrseminar oder einem GESIS Workshop.

Referentinnen

Katja Salomo ist seit 2012 wissenschaftliche Mitarbeiterin am Institut für Soziologie der Friedrich-Schiller-Universität Jena. Sie forscht zu anti-demokratischen und rechtsextremen Einstellungen, Partizipation und politischer Gewalt, insbesondere deren Determinanten auf Individual- und Kontextebene in Europa. Durch Mitarbeit in zahlreichen Projekten hat sie Erfahrung mit empirischer sozialwissenschaftlicher Forschung von der Datenerhebung bis zur Publikation gesammelt. Ihre Lehrerfahrung im Bereich der Methodenausbildung umfasst mehr als 20 Seminare für Anfänger und Fortgeschrittene.

Janka Goldan ist seit 2015 wissenschaftliche Mitarbeiterin am Wuppertaler Institut für bildungsökonomische Forschung (WIB) und an der School of Education der Bergischen Universität Wuppertal. Ihr thematischer Forschungsschwerpunkt ist die schulische Inklusion, welche sie sowohl auf der Makro- als auch auf der Mikroebene untersucht, sodass sie über Erfahrung quantitativer empirischer Methoden für unterschiedliche Anwendungsgebiete verfügt. Sie hat in zahlreichen Projekten mitgewirkt und Erfahrung im gesamten Forschungszyklus sammeln können. Ihre Lehrtätigkeit konzentrierte sich bislang auf Diagnostik und diagnostische Methoden für Lehramtsstudierende.

Modulbeschreibung

Das Aufbaumodul II führt grundlegend in die multiple lineare Regressionsanalyse ein und behandelt darauf aufbauend fortgeschrittene Aspekte der multiplen linearen Regressionsanalyse und der logistischen Regressionsanalyse mit binär-abhängigen Variablen. Ein großer Bestandteil des Kurses ist die praktische Anwendung durch Übungen mit dem Statistikprogramm Stata, inklusive einer kurzen Einführung in Stata zu Beginn des Moduls. Der Ablauf des Aufbaumoduls ist insgesamt durch eine enge Verzahnung von Theorie und praktischen Anwendungen charakterisiert. Vormittags werden im Rahmen einer Vorlesung die theoretischen Grundlagen vermittelt und mit den Teilnehmern diskutiert. Nachmittags findet die praktische Umsetzung der zuvor theoretisch behandelten Themen im Rahmen von Übungen am PC statt. Die praktischen Übungen erfolgen auf Basis aktueller sozialwissenschaftlicher Fragestellungen und Datensätzen.

Lernziele

Im Anschluss an die Veranstaltung können die TeilnehmerInnen grundlegende Konzepte und Annahmen der Regressionsanalyse erläutern, entsprechend der jeweiligen Forschungsfrage geeignete Regressionsmodelle auswählen und spezifizieren, multiple lineare Regressionsanalysen und logistische Regressionsanalysen mit binär-abhängigen Variablen selbstständig mit Stata durchführen und die Ergebnisse der Regressionsanalyse (Regressionsoutput von Stata) verstehen und interpretieren.

Referenten

Prof. Dr. Michael Gebel studierte VWL und Sozialwissenschaften an der Universität Mannheim und der UCL Louvain-la-Neuve und erwarb seinen Doktorgrad in Soziologie an der Universität Mannheim. Er ist Inhaber des Lehrstuhls für Soziologie, insbesondere Methoden der empirischen Sozialforschung an der Universität Bamberg. Seine Forschungsschwerpunkte sind die Lebensverlaufsforschung (insb. Transition to Adulthood), Mehrebenenanalysen mit international vergleichenden Mikrodaten und Verfahren der modernen Kausalanalyse.

Jonas Voßemer studierte Soziologie und Volkswirtschaftslehre an der Universität Mannheim (B.A. 2011) und Soziologie an der Universität Mannheim und Indiana University, IN, USA (M.A. 2014). Zurzeit arbeitet er am Lehrstuhl für Soziologie, insb. Methoden der empirischen Sozialforschung an der Universität Bamberg als wissenschaftlicher Mitarbeiter. In seiner Forschung befasst er sich mit den kurz- und langfristigen Folgen von Arbeitsplatzverlusten und Arbeitslosigkeit für die weitere Karriere und die individuelle Lebenszufriedenheit und Gesundheit.