Wissenstechnologien für Sozialwissenschaften

Prof. Dr. Stefan Dietze

Wissenstechnologien für Sozialwissenschaften
Abteilungsleiter

+49 (221) 47694-421
E-Mail
vCard

WTS entwickelt gemeinsam mit den anderen wissenschaftlichen Abteilungen von GESIS digitale Angebote und Forschungsdateninfrastrukturen für die Sozialwissenschaften auf der Grundlage innovativer Technologien. Die Abteilung nimmt eine Querschnittsfunktion in GESIS ein, indem sie zu allen Phasen des Forschungsdatenzyklus Angebote & Infrastrukturen generiert, einen zentralen Zugang zu den Angeboten schafft und deren Anschlussfähigkeit an technologische Entwicklungen und Standards sicherstellt. Einen besonderen Stellenwert nimmt die Schaffung eines integrierten Informationsangebotes bei GESIS durch die Integration von sowohl Daten als auch Infrastrukturen ein.

Um ein hohes Qualitätsniveau und eine fortlaufende Erneuerung digitaler Angebote gewährleisten zu können, betreibt die Abteilung Forschung im Bereich der angewandten Informatik, insbesondere auf den Gebieten Information Retrieval, Informationsextraktion, Mensch-Maschine-Interaktion und semantischen Technologien. Zielstellung für WTS-Forschung ist die Nutzbarmachung von sozialwissenschaftlichen Forschungsdaten nach den FAIR-Prinzipien, z.B. durch deren semantische Verlinkung und Suche. Eine aktuelle Herausforderung in diesem Kontext ist die Unterstützung „neuer“ sozialwissenschaftlicher Forschungsdaten, insbesondere von Daten aus dem (Social) Web, die aufgrund der potentiell großen und heterogenen Datenmengen neue Anforderungen an effiziente Methoden für die Aufbereitung, Verlinkung und Suche stellen. Weitere Herausforderungen sind die Sichtbarkeit und Interoperabilität von GESIS-Forschungsdaten im Web durch die zunehmende Relevanz von Web- und W3C-Standards und Web-basierten Plattformen für die Forschungsdatensuche.

Leitziel der Abteilung ist die Unterstützung der infrastrukturellen Herausforderungen aller GESIS-relevanten Forschungsdaten entlang des Forschungsdatenzyklus zur Unterstützung von Open Science in den Sozialwissenschaften.

Hervorheben möchten wir besonders folgende Angebote unserer Abteilung: 

Information & Data Retrieval

Das Team Information & Data Retrieval bündelt Service- und Forschungsaktivitäten, die sich mit der effizienten Suche nach Forschungsdaten, insbesondere in den Sozialwissenschaften beschäftigen. Dabei soll der Nutzer effizient und effektiv in allen Phasen der Informationssuche unterstützt werden. Dazu forscht das Team in verschiedenen IR-Bereichen, z.B. Interactive Information Retrieval, entitätsbasierte und semantische Suche oder Personalisierung. Spezifisch ist die vertikale Suche in verschiedenen Informationstypen, etwa in Forschungsdaten oder Literaturdaten. Dabei werden die Informationstypen untereinander verlinkt, um dem Nutzer Zusammenhänge zwischen den Daten aufzuzeigen und semantische bzw. entitätsbezogene Suchen über alle Daten hinweg zu ermöglichen (siehe GESIS-weite Suche). Eine aktuelle Herausforderung stellt die temporale Suche in großen Datenmengen, insbesondere Web-Daten und digitalen Verhaltensdaten dar, die als sozialwissenschaftliche Forschungsdaten in der Suche unterstützt werden. Ziel des Teams Information & Data Retrieval ist es, für alle Infrastrukturen bei GESIS, geeignete State-of-the-Art Technologien für die Suche bereitzustellen, und durch Forschung in den o.g. Bereichen innovative Suchlösungen anbieten zu können.

Information Extraction & Linking

Das Team Information Extraction & Linking erforscht Methoden und entwickelt Services zur Integration und Verlinkung von Forschungsdaten und Forschungsinformationen. Kernaufgabe des Teams ist die konsequente Etablierung einer Wissensgraph-Infrastruktur mithilfe etablierter Vokabulare und Standards, um so GESIS Forschungsdaten untereinander und mit etablierten Vokabularen, Wissensgraphen und Datenbeständen zu verknüpfen. Dazu entwickelt das Team innovative Methoden zur Extraktion und Verlinkung von Forschungsdaten und -informationen und betreibt Forschung in den Bereichen Informationsextraktion und Natural Language Processing (NLP), Entity Resolution sowie Interlinking und Datenfusionierung. Aktuelle Herausforderungen ergeben sich z.B. durch das Mining von Forschungsdaten und die Verlinkung von / mit Forschungsdatenreferenzen oder anderen Daten im Web oder die Verlinkung mit grossen Web Archiven, bestehend z.B. aus Twitter-Daten. Neben der Verlinkung von Forschungsdaten und den dazugehörigen wissenschaftlichen Publikationen wird ebenfalls die Verlinkung und Homogenisierung von etablierten Vokabularen und Annotationsframeworks vorangetrieben, die eine ganzheitliche Sicht auf Forschungsdaten entlang der FAIR Prinzipien unterstützt und die übergreifende Suche, z.B. im Rahmen der GESIS-weiten Suche und im Web ermöglicht.

FAIR Data and Human Information Interaction

Ein strategisches Hauptziel von GESIS ist es, Forschungsdaten auf bestmögliche Weise nutzbar zu machen. Das Team stellt sich dieser Herausforderung aus zwei unterschiedlichen Perspektiven: aus der Sicht der FAIR-Prinzipien, die verlangen, dass Forschungsdaten auf einfache Weise auffindbar, zugänglich, interoperabel und wiederverwendbar sein sollen, und aus der Sicht des Forschungsfeldes Human Information Interaction, das den Menschen in den Blick nimmt und nach geeigneten Modellen für die Interaktion von Nutzenden mit Informationssystemen fragt. Schwerpunkt des Teams ist die nutzerzentrierte Entwicklung von digitalen Diensten und Infrastrukturen, die sich sowohl an den FAIR-Prinzipien als auch an den spezifischen Anforderungen von Forschenden in den Sozialwissenschaften orientieren. Dadurch nimmt das Team eine teamübergreifende Rolle in der Abteilung ein.

Data & Services Engineering

Aufgabe des Teams Data & Service Engineering ist die Entwicklung einer gemeinsamen und nachhaltigen Softwarearchitektur auf Basis eines aktuellen Technologiestacks für alle digitalen Angebote und Infrastrukturen der GESIS. Das Team bündelt insbesondere die Softwareentwicklungsexpertise mithilfe zeitgemäßer service-orientierter Methoden und entwickelt und betreibt die verschiedenen Forschungsdatenportale der GESIS, darauf aufbauende Nutzerschnittstellen (z.B. Survey Editoren oder Suchplattformen) sowie Infrastrukturen, die phasenübergreifenden Charakter haben. Der Aufgabenbereich des Teams umfasst daher, neben der fortlaufenden Beobachtung und Evaluierung aktueller Technologien, die federführende technologische Entwicklung von Diensten für die Sozialwissenschaften als auch die IT-Governance um die FAIR Strategie der GESIS zu unterstützen.