|
Forschungsübersichten
¬
Rough Set Theory based Automatic Text Categorization...
Xueying Zhang
Rough Set Theory based Automatic Text Categorization and the Handling of Semantic Heterogeneity
Social Science Information Centre, Bonn, Germany,
Nanjing University of Science and Technology, P.R. China and
Nanjing Normal University, P.R. China
Bonn: Informationszentrum Sozialwissenschaften 2006
(Forschungsberichte; Band 8), 151 Seiten, kart., in englischer Sprache
ISSN 1431-5114, ISBN 3-8206-0149-X
Schutzgebühr EUR 15,-
Mit der zunehmenden Zahl an elektronisch zugänglichen Informationen aus unterschiedlichen Quellen steigt der Bedarf an Technologien, mit denen diese Informationen automatisch klassifiziert und organisiert werden können. Das zurzeit gängigste Verfahren ist die automatische Kategorisierung von Texten, das heißt die automatische Zuordnung vordefinierter Kategorien zu Textdokumenten mit unbekanntem Inhalt. Eine Alternative zu traditionellen statistischen Verfahren und Methoden der Wissensverarbeitung für die automatische Textkategorisierung sind Methoden des maschinellen Lernens, zum Beispiel die Rough Set Theory (RST), die heute mehr und mehr Beachtung findet.
Dieser Forschungsbericht stellt die neuesten Ergebnisse der Forschung im Bereich der automatischen Textkategorisierung vor. Schwerpunkte sind die sprachenunabhängige Textrepräsentation und die Anwendung eines RST-Modells, welches Information Retrieval Theorien und die Grundlagen der Rough Set Theory bei der Behandlung semantischer Heterogenität in Informationssystemen vereint. Zudem konzentriert sich die Arbeit auf die Verbesserung der automatischen Textklassifizierung mithilfe von Textkategorisierung auf der Basis der Rough Set Theory, dynamischer Kategorienerweiterung und Synonymerkennung.
Der Forschungsbericht entstand durch eine Kooperation zwischen dem Informationszentrum Sozialwissenschaften in Bonn und der Nanjing University of Sciences and Technology / Nanjing Normal University in China. Diese wurde vom Deutschen Akademischen Austauschdienst DAAD im Rahmen des Sandwich-Programms unterstützt. Der Forschungsbericht ist die englische Version der chinesischen Doktorarbeit von Xueying Zhang.
Bestellformular
© GESIS Sabine Trenkler
11.06.2007
Forschungsübersichten
¬
Rough Set Theory based Automatic Text Categorization...
|