Forschung

GESIS - für eine forschungsbasierte Infrastruktur

GESIS ist eine forschungsbasierte Infrastruktureinrichtung für die Sozialwissenschaften und führt eigene kontinuierliche und interdisziplinäre Forschung durch. Die Ergebnisse unserer Forschung dienen sowohl der Gewinnung wissenschaftlicher Erkenntnis, als auch der nachhaltigen Verbesserung unserer Angebote für die Sozialwissenschaften.

Für GESIS steht die Qualität von Daten im Mittelpunkt. GESIS strebt danach, qualitativ hochwertige Forschungsdaten sowie Methoden und Tools bereitzustellen, die es Nutzenden ermöglichen, selbst einzuschätzen, wie hoch die Qualität von Forschungsdaten ist. Daher richtet sich der Forschungs- schwerpunkt auch auf dieses Kerninteresse aus. Um einen Beitrag zur Wissensgenerierung rund um Datenqualität leisten zu können, fokussiert GESIS auf die Forschungsbereiche Umfragemethodik, computerbasierte Methoden und Forschungsdatenmanagement. Gemeinsam richten wir unsere methodisch orientierte Forschung darauf aus, Forschende zu unterstützen, die mit quantitativen Daten zu sozialwissenschaftlichen Fragestellungen arbeiten und selbst Beiträge zu grundlegenden inhaltlichen Fragestellungen zu leisten.

Forschungsoutput von GESIS

  • Sack, Harald, Torsten Schrade, Oleksandra Bruns, Etienne Posthumus, Tabea Tietz, Ebrahim Norouzi, Jörg Waitelonis, Heike Fliegl, Linnaea Söhn, Julia Tolksdorf, Jonatan Jalle Steller, Abril Az´ocar Guzm´an, Said Fathalla, Ahmad Zainul Ihsan, Volker Hofmann, Stefan Sandfeld, Felix Fritzen, Amir Laadhar, Sonja Schimmler, and Peter Mutschke. 2023. "Knowledge Graph Based RDM Solutions : NFDI4Culture - NFDI-MatWerk - NFDI4DataScience ." In 1st Conference on Research Data Infrastructure (CoRDI) - Connecting Communities , edited by York Sure-Vetter, and Carole Globe, doi: https://doi.org/10.52825/CoRDI.v1i.371.
  • Otto, Wolfgang, Matthäus Zloch, Lu Gan, Dr. Saurav Karmakar, and Stefan Dietze. 2023. "GSAP-NER: A Novel Task, Corpus, and Baseline for Scholarly Entity Extraction Focused on Machine Learning Models and Datasets." In Findings of the Association for Computational Linguistics: EMNLP 2023, edited by Houda Bouamor, Juan Pino, and Kalika Bali, 8166-8176. Singapore: Association for Computational Linguistics. https://aclanthology.org/2023.findings-emnlp.548.
  • Schoch, David, and Termeh Shafie. 2024. "The interplay of structural features and observed dissimilarities among centrality indices." doi: https://doi.org/10.1016/j.socnet.2023.11.006.
  • Mutschke, Peter. 2023. "Zentralitäts- und Prestigemaße." online first. In Handbuch Netzwerkforschung, edited by Christian Stegbauer, and Roger Häußling, Netzwerkforschung. Wiesbaden: Springer VS. doi: https://doi.org/10.1007/978-3-658-37507-2_33-1.
  • Sen, Indira, Dennis Assenmacher, Mattia Samory, Isabelle Augenstein, Wil van der Aalst, and Claudia Wagner. 2023. "People Make Better Edits: Measuring the Efficacy of LLM-Generated Counterfactually Augmented Data for Harmful Language Detection." 2023. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, EMNLP, edited by Houda Bouamor, Juan Pino, and Kalika Bali, 10480-10504. Singapore: Association for Computational Linguistics.

Ein wesentliches Merkmal von GESIS ist, dass das Institut insbesondere bei den Daten, für die es auch die Erhebung verantwortet, sehr hohe Ansprüche und Standards an die Qualität der bereitge- stellten Daten anlegt. Daher ist es für GESIS zentral, eigene Beiträge zur Untersuchung und Verbes- serung von Aspekten der Datenqualität zu leisten. Die Forschung in den GESIS-Forschungsbereichen trägt deshalb direkt zum Schwerpunkt Datenqualität bei. Dies betrifft sowohl Umfragedaten als auch digitale Verhaltensdaten und relevante Metadaten.

Datenqualität umfasst Aspekte der (a) Kor- rektheit und Repräsentativität von Daten und (b) Nutzbarkeit und FAIRness von Daten. Beispiele für (a) sind die Vollständigkeit, Korrektheit, Provenienz der Repräsentativität von Daten, während (b) Aspekte wie Findbarkeit, Qualität der Dokumentation, Aufbereitung oder die Interoperabilität von Daten und Metadaten berücksichtigt. Damit wird eine wichtige Voraussetzung dafür erfüllt, dass die Bearbeitung inhaltlicher Fragestellungen (Substantive Research) auf Basis dieser Daten zu validen Ergebnissen führt.

Wir forschen bei GESIS grundlagen- und anwendungsorientiert zum Themenbereich Umfragemethodik. Unsere Umfrageforschung gliedert sich in die Schwerpunktbereiche Survey Statistics, Survey Instruments, Survey Operations und Comparative Surveys. Wir verfolgen das Ziel, evidenzbasierte Erkenntnisse darüber zu gewinnen, wie Umfragen und deren Datenqualität optimiert werden können.

Im Rahmen von systematischen Reviews und Meta-Analysen bewerten wir dafür vorhandene Forschung und identifizieren Forschungslücken. Im Forschungsbereich Umfragemethodik erforschen wir zudem die Verbindung von Umfragedaten mit digitalen Verhaltensdaten (z.B. Social Media Profilen, Smartphone-Nutzungsdaten oder Browserverläufen) und prüfen, wie sich diese Datentypen ergänzen und kombinieren lassen. Dafür treiben wir auch die Übertragung von etablierten Konzepten zur Bewertung der Datenqualität von Umfragen auf digitale Verhaltensdaten voran.

Um angesichts des raschen Wandels in den Informations- und Wissenstechnologien ein hohes Qualitätsniveau digitaler GESIS-Produkte und -Dienste sicherstellen zu können, betreibt GESIS Forschung im Bereich der Angewandten Informatik und Informationswissenschaft.

Ziel dieses Forschungsfeldes ist es, neuartige Methoden, Modelle und Algorithmen der Informatik im Anwendungsfeld Sozialwissenschaften zu erproben, zu analysieren, zu adaptieren, weiterzuentwickeln und zu evaluieren. Ein Kernbestandteil dieses Forschungsbereiches ist dabei vor allem die Erschließung von digitalen Verhaltensdaten wie z.B. Daten aus sozialen Medien oder durch Sensoren generierte Daten für die sozialwissenschaftliche Forschung. Denn die Entwicklung und Beurteilung von Methoden zur Erhebung, Aufbereitung und Analyse dieser neuen Daten erweitert die Basis zur Beantwortung sozialwissenschaftlicher Fragen. Durch die Implementierung der gewonnen Erkenntnisse können so in Zukunft auf die Sozialwissenschaften zugeschnittene, innovative und integrierte Forschungsinfrastrukturen und -angebote zu allen Phasen des Forschungsdatenzyklus entstehen.

Das Forschungsgebiet Forschungsdatenmanagement hat in den letzten Jahren an Bedeutung gewonnen und firmiert in der Scientific Community auch unter den Schlagworten Data Access, Data Archiving, Data Infrastructures, Data Preservation, Data Reuse, Data Science, Metadaten, Open Data oder Open Science.

Vor dem Hintergrund des großen und weiter wachsenden Datenbestandes von GESIS, sowie den damit verbundenen Angeboten zum Datenbezug und zur Datenarchivierung ist die Forschung in diesem Themenbereich ein wichtiger Bestandteil zur Erweiterung und zum Ausbau der damit verbundenen Infrastrukturen. Forschung in diesem Themengebiet befasst sich mit der Langzeitarchivierung, der Datendokumentation sowie den rechtlichen Rahmenbedingungen des Datenzugriffes und der Lizenzierung von Daten. Themen dieses Forschungsbereiches adressieren somit die Fragestellungen, die sich aus der gemeinsamen Sekundärnutzung von Daten (Daten teilen) sowie aus der Problematik der Langzeitarchivierung (Langzeitarchivierung) ergeben. Zudem sind in Bezug auf Umfragedaten, vor allem aber für digitale Verhaltensdaten (z.B. Daten aus sozialen Medien oder durch Sensoren generierte Daten) das Erstellen von Datendokumentationsstandards und die Vernetzung von Daten (Metadaten) sowie ebenso wie die Datensicherheit (Datensicherheit) zentrale Forschungsthemen.

Die inhaltliche Forschung bei GESIS ist stark in den GESIS-Datenerhebungsprogrammen verankert. Die Datenerhebungen und unsere damit verknüpfte Forschung orientieren sich an den themati- schen Interessen der Fach-Communities, die durch die Koordinierungsgruppen (KGs) und Einrei- chungen von Nutzenden eingebracht werden. Gleichzeitig wirbt GESIS Drittmittelprojekte zu inhalt- lichen Themen ein, erhebt in diesem Rahmen neue Daten und beforscht aktuelle Fragestellungen. Die inhaltliche Forschung trägt somit zu mehreren Zielen bei.

Durch die Arbeit mit den im Institut erhobenen Daten werden Entwicklungspotentiale der Daten erkannt und deren Qualität und Attrak- tivität erhöht. Die inhaltliche Forschung dient zudem individuellen Qualifikationszielen und der För- derung wissenschaftlicher Karrieren. Schließlich eröffnen unsere inhaltlichen Arbeiten neue Koope- rationspotenziale mit externen Wissenschaftler*innen und Forschungsinstitutionen.