Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen
SuchenSitemapHilfe
GESIS Servicestelle Osteuropa Zentrum für Umfragen, Methoden und Analysen
Informationszentrum Sozialwissenschaften Zentralarchiv für Empirische Sozialforschung, Universität zu Köln

Literatur- & Forschungsinformation

Datenservice & Archivierung

Dauerbeobachtung

Methodenberatung

Forschung & Entwicklung

Software

DDI Tools

Exanda

NSDstat Pro

Schildkröte

TEXTPACK

Beschreibung

Aktuelles

FAQ

Preise

Bestellung

Demo-Version

Publikationen

Forschung

Publikationen

 

Bestellen & Downloads

Veranstaltungen

GESIS-Bibliotheken

Linksammlung SocioGuide

 

Kooperationen

Beratung

Mitarbeiter & Adressen

Presse

Organisation

 

Impressum

 

 

 

 

Beispiel-Datensätze

Im TEXTPACK Unterverzeichnis DEMO finden Sie Beispieldatensätze für das Arbeiten mit TEXTPACK. Zu den Beispielen gehören SENTENCE- und SPLIT-Dateien, ein Dictionär zum Testen der Codierung und der KWIC-Routine, STOP-Wörter-Dateien und die ursprünglichen Texte.

  • Beispiel-Text "Präsidentschaftsdebatten"
    Die Texte sind Transcripte der Fernsehdebatten vom 11. Oktober 1992 in St. Louis, Missouri. Die Präsidentschaftskandidaten, die an der Debatte teilnahmen, waren Bill Clinton, George Bush und Ross Perot. Die Texte wurden von Net.Capitol Inc. verschriftet.
    Die Geschichte der Face-to-face Präsidentschaftsdebatten im 20. Jahrhundert begann im Jahre 1948 als die beiden  Republikaner Thomas Dewey und Harold Stassen einander in einer Radiodebatte während des "Oregon Republican Presidential Primary" gegenüberstanden. Der Text wurde für TEXTPACK vorbereitet: er enthält eine Identifikation (ID1), die aus einer fortlaufenden Nummerierung der Redeeinheiten  (erste Ziffern der ID1) und aus der Sprecher ID (letzte Ziffer der ID1) zusammengesetzt ist. Die Sprecher sind: Moderator Jim Lehrer (1), Bill Clinton (2), Ross Perot (3), George Bush (4), Journalisten (5, drei fragende Journalisten: John Mashek vom The Boston Globe, Ann Compton von ABC News und Sander Vanocur, freier Journalist). Im Beispieltext werden die Journalisten nicht unterschieden und sie sind alle mit 5 kodiert.
    Die Textdatei heißt debate.txt, die SENTENCE-Datei debate.sen, die SPLIT-Datei debate.spl. Die SPLIT-Datei ist durch eine Stop-Wortliste (debate.stp) reduziert. Zusätzlich enthält das Verzeichnis ein kleines Dictionär (debate.dic) mit einigen Kategorien für die Codierung von sozialen Gruppen, wie junge Menschen, Familien, reiche Menschen, das amerikanische Volk.
  • Beispieltexte "Partei-Programme"
    Das zweite Beispiel beinhaltet zwei unterschiedliche Texte: die Partei-Programme  von zwei amerikanischen Parteien - den Demokraten und den Republikanern- aus dem Jahr 1996. Die Texte sind als SENTENCE- (democrat.sen, republic.sen) und als SPLIT-Dateien  (democrat.spl, republic.spl) gespeichert. Die einzige Identifikation ist eine Satznummer (ID1). Die SPLIT-Dateien wurden durch eine Stop-Wortliste (parties.stp) reduziert.

 



© GESIS Cornelia Züll 14.06.06