|
Beispiel-Datensätze
Im TEXTPACK Unterverzeichnis DEMO finden Sie Beispieldatensätze für
das Arbeiten mit TEXTPACK. Zu den Beispielen gehören SENTENCE- und SPLIT-Dateien, ein
Dictionär zum Testen der Codierung und der KWIC-Routine, STOP-Wörter-Dateien und die
ursprünglichen Texte.
- Beispiel-Text "Präsidentschaftsdebatten"
Die Texte sind Transcripte der Fernsehdebatten vom 11. Oktober 1992 in
St. Louis, Missouri. Die Präsidentschaftskandidaten, die an der
Debatte teilnahmen, waren Bill Clinton, George Bush und Ross Perot.
Die Texte wurden von Net.Capitol Inc. verschriftet.
Die Geschichte der Face-to-face Präsidentschaftsdebatten im 20.
Jahrhundert begann im Jahre 1948 als die beiden Republikaner Thomas Dewey
und
Harold Stassen einander in einer Radiodebatte während des "Oregon
Republican Presidential Primary" gegenüberstanden. Der Text wurde für TEXTPACK
vorbereitet: er enthält eine Identifikation
(ID1), die aus einer fortlaufenden Nummerierung der Redeeinheiten (erste
Ziffern der ID1) und aus der Sprecher ID (letzte Ziffer der ID1)
zusammengesetzt ist. Die Sprecher sind:
Moderator Jim Lehrer (1), Bill Clinton (2), Ross Perot (3), George Bush (4),
Journalisten (5, drei fragende Journalisten: John Mashek
vom The Boston Globe, Ann Compton von ABC News und Sander Vanocur, freier
Journalist). Im Beispieltext werden die Journalisten nicht unterschieden und sie sind alle
mit 5 kodiert.
Die Textdatei heißt debate.txt,
die SENTENCE-Datei debate.sen, die SPLIT-Datei debate.spl. Die SPLIT-Datei ist durch eine
Stop-Wortliste (debate.stp) reduziert.
Zusätzlich enthält das Verzeichnis ein kleines Dictionär (debate.dic)
mit einigen Kategorien für die Codierung von sozialen Gruppen, wie
junge Menschen, Familien, reiche Menschen, das amerikanische Volk.
- Beispieltexte "Partei-Programme"
Das zweite Beispiel beinhaltet zwei unterschiedliche Texte: die Partei-Programme
von zwei amerikanischen Parteien - den Demokraten und den Republikanern-
aus dem Jahr 1996.
Die Texte sind als SENTENCE- (democrat.sen, republic.sen) und als SPLIT-Dateien
(democrat.spl, republic.spl) gespeichert. Die einzige Identifikation ist
eine Satznummer (ID1). Die SPLIT-Dateien wurden durch eine Stop-Wortliste (parties.stp) reduziert.
© GESIS Cornelia Züll 14.06.06
|