Data Mining und Knowledge Discovery

Markus Strohmaier

Präsidialbüro
Scientific Coordinator for Digital Behavioral Data

+49 (221) 47694-225
E-Mail
vCard

Markus Strohmaier

Knowledge Discovery (KD) beschäftigt sich damit, Wissen aus großen (strukturierten oder unstrukturierten) Datensätzen zu gewinnen. Unterbereiche von Knowledge Discovery, denen das Forschungsinteresse von GESIS und speziell vom Team KD gilt, sind Ontology-Based Information Extraction, Social Tagging und Semantic Annotation. Die Forschung wird praxisnah und mit Fokus auf den Einsatz in realen Anwendungsszenarien betrieben, um später sowohl den Nutzerinnen und Nutzern als auch den Betreibern von Informationssystemen zugute zu kommen. Diese Anwendungen finden ihren Einsatz in den Bereichen webbasierter Informationssysteme (Web-based Information Systems), Informationsgewinnung (Information Retrieval), Digitale Bibliotheken (Digital Libraries) oder Empfehlungssysteme (Recommender Systems).

GESIS forscht aktiv in den verschiedenen Bereichen von Knowledge Discovery. Die Ergebnisse der Forschung werden im Rahmen eigener Informationssysteme und Datenbanken angewendet und evaluiert. Verschiedene Methoden lassen sich nutzen, um die Erschließung von Datenbanken zu optimieren. Dabei reicht die Palette der Techniken von sozialgestützten Erschließungsmethoden (im Social Web), über lexikalische, regelbasierte Methoden bis hin zu vollautomatischer, statistischer, maschinell erlernter Methodik.

Neben der bei GESIS etablierten intellektuellen Indexierung für sozialwissenschaftliche Dokumente werden auch neue Methoden für halb- bzw. vollautomatische Indexierung getestet und optimiert.