Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen
SuchenSitemapHilfe
GESIS Servicestelle Osteuropa Informationszentrum Sozialwissenschaften  
Zentralarchiv für Empirische Sozialforschung, Universität zu Köln Zentrum für Umfragen, Methoden und Analysen

Literatur- & Forschungsinformation

Datenbank SOLIS

Datenbank SOFIS

Host-Zugänge

CD-ROM WISO III

Rechercheunterstützung

Datenbank SOFO

Datenbanken zu Osteuropa

Zeitschriftendatenbank

sowiNet - Aktuelle Themen

soFid - Fachinformationsdienst

Forschungsübersichten

Newsletter Osteuropa

Auftragsrecherchen

Beratung

Datenservice & Archivierung

Dauerbeobachtung

Methodenberatung

Forschung & Entwicklung

Software

Publikationen

 

Bestellen & Downloads

Veranstaltungen

GESIS-Bibliotheken

Linksammlung SocioGuide

 

Kooperationen

Beratung

Mitarbeiter & Adressen

Presse

Organisation

 

Impressum


 

 

Forschungsübersichten ¬ Rough Set Theory based Automatic Text Categorization...


Xueying Zhang
Rough Set Theory based Automatic Text Categorization and the Handling of Semantic Heterogeneity

Social Science Information Centre, Bonn, Germany,
Nanjing University of Science and Technology, P.R. China and
Nanjing Normal University, P.R. China

Bonn: Informationszentrum Sozialwissenschaften 2006
(Forschungsberichte; Band 8), 151 Seiten, kart., in englischer Sprache
ISSN 1431-5114, ISBN 3-8206-0149-X
Schutzgebühr EUR 15,-

Mit der zunehmenden Zahl an elektronisch zugänglichen Informationen aus unterschiedlichen Quellen steigt der Bedarf an Technologien, mit denen diese Informationen automatisch klassifiziert und organisiert werden können. Das zurzeit gängigste Verfahren ist die automatische Kategorisierung von Texten, das heißt die automatische Zuordnung vordefinierter Kategorien zu Textdokumenten mit unbekanntem Inhalt. Eine Alternative zu traditionellen statistischen Verfahren und Methoden der Wissensverarbeitung für die automatische Textkategorisierung sind Methoden des maschinellen Lernens, zum Beispiel die Rough Set Theory (RST), die heute mehr und mehr Beachtung findet.
Dieser Forschungsbericht stellt die neuesten Ergebnisse der Forschung im Bereich der automatischen Textkategorisierung vor. Schwerpunkte sind die sprachenunabhängige Textrepräsentation und die Anwendung eines RST-Modells, welches Information Retrieval Theorien und die Grundlagen der Rough Set Theory bei der Behandlung semantischer Heterogenität in Informationssystemen vereint. Zudem konzentriert sich die Arbeit auf die Verbesserung der automatischen Textklassifizierung mithilfe von Textkategorisierung auf der Basis der Rough Set Theory, dynamischer Kategorienerweiterung und Synonymerkennung.
Der Forschungsbericht entstand durch eine Kooperation zwischen dem Informationszentrum Sozialwissenschaften in Bonn und der Nanjing University of Sciences and Technology / Nanjing Normal University in China. Diese wurde vom Deutschen Akademischen Austauschdienst DAAD im Rahmen des Sandwich-Programms unterstützt. Der Forschungsbericht ist die englische Version der chinesischen Doktorarbeit von Xueying Zhang.

Bestellformular

© GESIS Sabine Trenkler 11.06.2007

Forschungsübersichten ¬ Rough Set Theory based Automatic Text Categorization...