Dr. Philipp Mayr

Wissenstechnologien für Sozialwissenschaften
Information & Data Retrieval
Teamleiter

+49 (221) 47694-533
E-Mail
vCard

Effizientes Retrieval auf Web of Science-Daten mit Elasticsearch (WoS-Solr)

Bearbeitung: Zeljko Carevic
Leitung: Dr. Philipp Mayr
Wissenschaftlicher Arbeitsbereich: Abt. Wissenstechnologien für Sozialwisseschaften (WTS)

Projektbeschreibung

Im Projekt „Effizientes Retrieval auf Web of Science-Daten mit Elasticsearch“ ist geplant, die umfangreichen XML-Daten des Web of Science (WoS), die aktuell in einer SQL-Datenbank vorliegen, in einen performanten Elasticsearch Index zu überführen. Dadurch werden diese Daten leichter recherchierbar und zugänglich. Der Elasticsearch-Index soll beim Projektpartner FIZ Karlsruhe für die KB-Partner zur Verfügung gestellt werden.

Während sich relationale Datenbanken zum Abbilden und Abfragen von relationsstarken Daten eignen, zeichnen sich Suchindizes durch eine höhere Performanz bei relationsarmen Daten aus. Weiterhin ermöglichen Suchindizes einen zielgerichteten Umgang mit Suchanfragen. Bei relationalen Datenbanken erfolgt eine Abfrage auf Basis von SQL-Queries die entweder ein Grundwissen über Datenbankabfragen oder eine limitierte Benutzungsschnittstelle benötigt bei der die Suchanfragen eines Nutzers in SQL-Queries überführt werden. Suchindizes hingegen sind eigens für diesen Use Case entwickelt und ermöglichen unter anderem: Stemming, Facettierung, boolsche Operatoren und erhöhte Fehlertoleranz bei Anfragen.

Projektlaufzeit

01.10.2018-31.12.2018

Gefördert durch