GESIS Leibniz-Institut für Sozialwissenschaften: Homepage aufrufen

Knowledge Technologies for the Social Sciences (KTS)

KTS entwickelt gemeinsam mit den anderen wissenschaftlichen Abteilungen von GESIS digitale Angebote und Forschungsdateninfrastrukturen für die Sozialwissenschaften auf der Grundlage innovativer Technologien. Die Abteilung nimmt eine Querschnittsfunktion in GESIS ein, indem sie zu allen Phasen des Forschungsdatenzyklus Angebote & Infrastrukturen generiert, einen zentralen Zugang zu den Angeboten schafft und deren Anschlussfähigkeit an technologische Entwicklungen und Standards sicherstellt. Einen besonderen Stellenwert nimmt die Schaffung eines integrierten Informationsangebotes bei GESIS durch die Integration von sowohl Daten als auch Infrastrukturen ein.

Um ein hohes Qualitätsniveau und eine fortlaufende Erneuerung digitaler Angebote gewährleisten zu können, betreibt die Abteilung Forschung im Bereich der angewandten Informatik, insbesondere auf den Gebieten Information Retrieval, Informationsextraktion, Mensch-Maschine-Interaktion und semantischen Technologien. Zielstellung für KTS-Forschung ist die Nutzbarmachung von sozialwissenschaftlichen Forschungsdaten nach den FAIR-Prinzipien, z.B. durch deren semantische Verlinkung und Suche. Eine aktuelle Herausforderung in diesem Kontext ist die Unterstützung „neuer“ sozialwissenschaftlicher Forschungsdaten, insbesondere von Daten aus dem (Social) Web, die aufgrund der potentiell großen und heterogenen Datenmengen neue Anforderungen an effiziente Methoden für die Aufbereitung, Verlinkung und Suche stellen. Weitere Herausforderungen sind die Sichtbarkeit und Interoperabilität von GESIS-Forschungsdaten im Web durch die zunehmende Relevanz von Web- und W3C-Standards und Web-basierten Plattformen für die Forschungsdatensuche.

Leitziel der Abteilung ist die Unterstützung der infrastrukturellen Herausforderungen aller GESIS-relevanten Forschungsdaten entlang des Forschungsdatenzyklus zur Unterstützung von Open Science in den Sozialwissenschaften.

Hervorheben möchten wir besonders folgende Angebote unserer Abteilung: 

Das Team Information & Data Retrieval bündelt Service- und Forschungsaktivitäten, die sich mit der effizienten Suche nach Forschungsdaten, insbesondere in den Sozialwissenschaften beschäftigen. Dabei soll der Nutzende effizient und effektiv in allen Phasen der Informationssuche unterstützt werden. Dazu forscht das Team in verschiedenen IR-Bereichen, z.B. Interactive Information Retrieval, entitätsbasierte und semantische Suche oder Personalisierung. Spezifisch ist die vertikale Suche in verschiedenen Informationstypen, etwa in Forschungsdaten oder Literaturdaten. Dabei werden die Informationstypen untereinander verlinkt, um dem Nutzenden Zusammenhänge zwischen den Daten aufzuzeigen und semantische bzw. entitätsbezogene Suchen über alle Daten hinweg zu ermöglichen (siehe GESIS-weite Suche). Eine aktuelle Herausforderung stellt die temporale Suche in großen Datenmengen, insbesondere Web-Daten und digitalen Verhaltensdaten dar, die als sozialwissenschaftliche Forschungsdaten in der Suche unterstützt werden. Ziel des Teams Information & Data Retrieval ist es, für alle Infrastrukturen bei GESIS, geeignete State-of-the-Art Technologien für die Suche bereitzustellen, und durch Forschung in den o.g. Bereichen innovative Suchlösungen anbieten zu können.

Das Team Information Extraction & Linking erforscht Methoden und entwickelt Services zur Integration und Verlinkung von Forschungsdaten und Forschungsinformationen. Kernaufgabe des Teams ist die konsequente Etablierung einer Wissensgraph-Infrastruktur mithilfe etablierter Vokabulare und Standards, um so GESIS Forschungsdaten untereinander und mit etablierten Vokabularen, Wissensgraphen und Datenbeständen zu verknüpfen. Dazu entwickelt das Team innovative Methoden zur Extraktion und Verlinkung von Forschungsdaten und -informationen und betreibt Forschung in den Bereichen Informationsextraktion und Natural Language Processing (NLP), Entity Resolution sowie Interlinking und Datenfusionierung. Aktuelle Herausforderungen ergeben sich z.B. durch das Mining von Forschungsdaten und die Verlinkung von / mit Forschungsdatenreferenzen oder anderen Daten im Web oder die Verlinkung mit grossen Web Archiven, bestehend z.B. aus Twitter-Daten. Neben der Verlinkung von Forschungsdaten und den dazugehörigen wissenschaftlichen Publikationen wird ebenfalls die Verlinkung und Homogenisierung von etablierten Vokabularen und Annotationsframeworks vorangetrieben, die eine ganzheitliche Sicht auf Forschungsdaten entlang der FAIR Prinzipien unterstützt und die übergreifende Suche, z.B. im Rahmen der GESIS-weiten Suche und im Web ermöglicht.

Das Team FAIR Data verbessert die Nutzbarkeit von Forschungsdaten entlang der FAIR-Prinzipien durch die forschungsbasierte Konsolidierung und Integration digitaler GESIS-Dienste sowie die Verbesserung der Sicht- und Auffindbarkeit von GESIS-Daten im Web. Hierfür betreibt das Team Forschung an der Schnittstelle von Informationsextraktion, Wissensgraphen, Datenintegration und Information Retrieval und bringt diese konsequent in die Verbesserung von Forschungsdaten und Diensten ein. Im Rahmen der Weiterentwicklung des Integrierten Informationsangebots von GESIS arbeitet das Team kontinuierlich mit anderen Teams bei KTS und Abteilungen bei GESIS zusammen. Darüber hinaus stellt die Zusammenarbeit mit nationalen und internationalen Forschungsdateninfrastrukturinitiativen (insbesondere NFDI) eine zentrale Aufgabe dar, durch die Transfer in die Community und die Anschlussfähigkeit an Standards und Innovationen aus der Community (z.B. zu FAIR Assessment) sichergestellt wird. Das Team ist an drei NFDI-Konsortien beteiligt.

Aufgabe des Teams Data & Service Engineering ist die Entwicklung einer gemeinsamen und nachhaltigen Softwarearchitektur auf Basis eines aktuellen Technologiestacks für alle digitalen Angebote und Infrastrukturen der GESIS. Das Team bündelt insbesondere die Softwareentwicklungsexpertise mithilfe zeitgemäßer service-orientierter Methoden und entwickelt und betreibt die verschiedenen Forschungsdatenportale der GESIS, darauf aufbauende Nutzungsschnittstellen (z.B. Survey Editoren oder Suchplattformen) sowie Infrastrukturen, die phasenübergreifenden Charakter haben. Der Aufgabenbereich des Teams umfasst daher, neben der fortlaufenden Beobachtung und Evaluierung aktueller Technologien, die federführende technologische Entwicklung von Diensten für die Sozialwissenschaften als auch die IT-Governance um die FAIR Strategie der GESIS zu unterstützen.

Das Team Big Data Analytics befasst sich mit Forschung und Dienstleistungen im Zusammenhang mit groß angelegter Datenverarbeitung. Ziel ist es, die (skalierbare) Analytik im Sinne einer verantwortungsvollen Datenwissenschaft FAIR zu machen (Findable, Accessible, Interoperable and Reproducible). Unsere Aktivitäten reichen vom Entwurf skalierbarer Infrastruktur für die Verarbeitung großer Datenmengen bis zur Entwicklung von Analysemethoden für die Sozialwissenschaften. Ziel ist es, diese Methoden, wo immer möglich, öffentlich zugänglich, reproduzierbar und erklärbar zu machen. Das Team arbeitet an der Schnittstelle von Wissensgraphen, verteilter Analytik und Big Data.

Das Team Human Information Interaction (HII) arbeitet und forscht an der Schnittstelle zwischen Human Computer Interaction und Machine Learning. Mithilfe von Methoden der nutzendenzentrierten Entwicklung bezieht das Team Nutzende aktiv in den Entwicklungsprozess mit ein und trägt somit dazu bei, digitale Dienste mit überzeugender Usability und User Experience zu entwickeln. Ein Beispiel dafür ist die GESIS Suche, unsere integrierte Suche über verschiedene Informationstypen. Ein weiteres Ziel besteht darin, mit Hilfe von Machine Learning aus digitalen Verhaltensdaten Erkenntnisse zu kognitiven Prozessen zu generieren und in User Models abzubilden. In der Forschung beschäftigt sich das Team unter anderem mit Online-Diskurs Verhalten und wie dieses verbessert werden kann, was Eyetracking und physiologische Daten (z.B. EEG) über kognitive Prozesse beim Lesen und Verstehen von Texten (z.B. Fragebögen oder Web-Inhalten) verraten und wie Nutzende mit eher vagen Informationsbedürfnissen besser bei der Informationssuche unterstützen werden können.