- Home
- Angebot
- Daten finden und abrufen
- Digitale Verhaltensdaten
- GESIS Web Data
Willkommen bei GESIS Web Data
Der Service Web Data vereint verschiedene Aktivitäten rund um die Erhebung digitaler Verhaltensdaten aus dem Web, insbesondere von Social-Media-Plattformen. Der Service bietet langfristige Datensammlungen von bestimmten Plattformen (wie Twitter/X oder Telegram) sowie zusätzliche Datenangebote, die speziell für die Forschung zu aktuellen Themen von gesellschaftlicher Relevanz oder zu akuten Ereignissen erhoben werden. Allgemein basiert die Auswahl der Plattformen und Themen auf ihrer Relevanz für die sozialwissenschaftliche Forschung, der technischen Machbarkeit, rechtlichen und ethischen Erwägungen sowie Input aus der Community.
Wir arbeiten fortwährend an der Erhebung unterschiedlicher Daten von verschiedenen Web-Plattformen. Aktuelle Beispiele sind ein kontinuierlicher Crawl von Telegram-Kanälen sowie eine Sammlung von Social-Media- und weiteren Web-Daten für die deutschen Kandidat:innen für die Europawahl 2024. Aus beiden Sammlungen wurden bereits Datensätze veröffentlicht.
Eine weitere thematische Sammlung wird analog zur EU-Wahl 2024 für die Kandidierenden zur deutschen Bundestagswahl 2025 durchgeführt.
GESIS Web Data besteht aus drei Komponenten:
Was sind die Vorteile dieses Services für die sozialwissenschaftliche Forschung?
Es gibt mehrere Gründe, warum der Service GESIS Web Data für die Forschung wertvoll ist:
- Unabhängigkeit von kommerziellen Anbietern, deren Interessen nicht unbedingt mit den Grundsätzen der offenen Wissenschaft übereinstimmen und die die Zugangsmodalitäten jederzeit ändern können.
- Kontinuierliche Sammlungen von Webdaten stellen sicher, dass historische Daten zu jedem aufkommenden Thema zugänglich sind und dass Forschende nicht auf eine nachträgliche Datensammlung angewiesen sind. Bei der Sammlung historischer Daten besteht insbesondere das Risiko, dass diese (teilweise) gelöscht oder der Zugang zu ihnen (durch Plattform-APIs) eingeschränkt werden kann.
- Ressourcen für groß angelegte und/oder kontinuierliche Sammlungen von Webdaten stehen einzelnen Forschenden oder Forschungsprojekten (insbesondere kleineren) oft nicht zur Verfügung. Ein Infrastrukturinstitut wie GESIS ist jedoch in der Lage, solche Aufgaben zu übernehmen und zudem Daten auch “vorsorglich” zu sammeln.
- Persistenz und Langzeitverfügbarkeit von Daten sind entscheidende Voraussetzungen für Reproduzierbarkeit und Nachnutzbarkeit. Reproduzierbarkeit und Nachnutzbarkeit sind wichtige Aspekte, die durch die Nutzung öffentlicher Datenarchive wesentlich unterstützt werden. Neben der Archivierung können diese auch Transparenz sowohl im Hinblick auf die genutzten Daten als auch die angewandten Methoden (zur Sammlung und Stichprobenziehung) gewährleisten.
Team
Team





Hier erreichen Sie uns
