Unterstützung von Vagheit bei der interaktiven Text- und Faktensuche (VACOS)



Projektbeschreibung

Bei der Suche nach Objekten wie Produkten oder Forschungsdatensätzen spezifizieren Benutzer oft eine Reihe von gewünschten Eigenschaften von denen einige explizit oder implizit vage sind (z.B. ”Preis bis 100 Euro“, ”lange Batterielaufzeit“, ”hohe Leistung“, ”Veröffentlicht innerhalb des letzten Jahres“). Einige dieser Formulierungen spezifizieren Bedingungen für bestimmte Attributwerte. Aktuelle Systeme unterstützen bei Fakten aber nur Boolesche Bedingungen, was zu Problemen führen kann, wenn die Bedingungen prinzipiell in Konflikt zueinander stehen (z.B. ”niedriger Preis“ vs. ”hohe Leistung“) oder wenn Objekte mit knapp verfehlten Bedingungen einfach aus der Treffermenge eliminiert werden. Textuelle Bedingungen sind zudem vom Vokabular-Problem betroffen, da die oftmals kurzen Beschreibungen der relevanten Objekten die Suchterme nicht enthalten.

Im Rahmen dieses Vorhabens sollen neue Methoden zur Behandlung vager Text- und Faktenbedingungen entwickelt werden. Für textuelle Vagheit sollen verschiedene Methoden eingesetzt werden, um verwandte Terme aus Textkorpora der Anwendungsdomäne zu generieren. Diese Terme werden dann als Anfrageerweiterung dem Nutzenden vorgeschlagen. Vage Faktenbedingungen werden als ’Fuzzy-Prädikate’ interpretiert, die Gewichte zwischen 0 und 1 liefern, und damit noch hohe Gewichte für knapp verfehlte Bedingungen; ferner können damit generelle Präferenzen wie ”niedriger Preis“ modelliert werden. Ferner sollen Methoden zur Abbildung von typischen Textphrasen auf Faktenbedingungen entwickelt werden (z.B. ”kürzlich veröffentlicht“ wird abgebildet auf ”Veröffentlichungsdatum möglichst groß“). Fragebedingungen können entweder notwendig oder optional sein. Es sollen verschiedene Gewichtungsfunktionen für die einzelnen Arten von Bedingungen untersucht werden, ebenso wie die Retrievalfunktion zur Gesamtgewichtung der Antwortobjekte. Benutzer sollen die Möglichkeit haben, diese Funktionen auf verschiedene Arten zu beeinflussen (z.B. durch klassisches ”Relevance Feedback“, oder durch die Manipulation der Gewichtungsfaktoren). Hierzu müssen geeignete Nutzeroberflächen entwickelt werden. Die entwickelten Verfahren sollen für zwei Anwendungsfälle benutzerorientiert entwickelt und evaluiert werden und zwar zum einen für die Produktsuche in einem Online-Shop, und zum anderen für die Suche nach sozialwissenschaftlichen Umfragedaten.


Projektlaufzeit

2019-04-01 – 2022-05-31

Förderung



Deutsche Forschungsgemeinschaft