Meilenstein für TweetsKB - Sammlung enthält als 14 Mrd. Tweets


Kategorien: GESIS-News

Das 1%-Zufallsstichproben-Twitter-Archiv, das bei GESIS gehostet wird, umfasst jetzt mehr als 14 Milliarden Tweets in mehr als 80 Sprachen, die über einen Zeitraum von mehr als zehn Jahren gesammelt wurden – bis zur Schließung der öffentlichen Twitter-API im Juni 2023.

Um die Forschung zu Twitter/X regelmäßig zu unterstützen, hat GESIS TweetsKB veröffentlicht, eine Sammlung von Datensätze englischsprachiger Tweets, die mit Stimmungsannotationen und spezifischen Entitäten angereichert sind. Mit dem zwölften und letzten Teil von TweetsKB, der den Zeitraum von September 2022 bis Juni 2023 abdeckt, ist die Veröffentlichung dieser für die Wissenschaft wertvollen Ressource nun abgeschlossen.