>Info zum Stichwort Auswahl | >diskutieren | >Permalink 
solarschule schrieb am 19.2. 2003 um 05:21:34 Uhr über

Auswahl






Burstiness

Herbert Hasenbein 19.02.2003

Schlüsselworte, welche das Reden der Politiker, die Tagesnachrichten und die
E-Mails beherrschen

Die explosionsartige Zunahme bestimmter Worte in Reden oder Artikeln zeigt
wachsendes Interesse oder die Hinwendung zu einem neuen Thema. Deshalb verrät die
Analyse des Wortstroms die beherrschenden Gedanken, im historischen Zusammenhang
ebenso wie im Austausch von Emails.







Sie treten zunächst sporadisch auf, werden immer häufiger und bestimmender, um nach der
Lösung oder weil das Interesse abflaut, in den normalen Redefluss zurückzufallen: gemeint
sind Schlüsselworte, die das Reden der Politiker, die Tagesnachrichten oder die Diskussion
mit Freunden wie eine aufsteigende und wieder auslaufende Welle beherrschen. Jon
Kleinberg, Professor für Computer Science an der Cornell University, Ithaca, N.Y., hat eine
Methode entwickelt, um die Themen der Zeit festzumachen. Er analysierte die Ansprachen
(State of the Union Addresses) der amerikanischen Präsidenten seit 1790 und fand eine Liste
von Worten, die Historikern als Zeitspiegel dienen können.



Häufigkeit und Aufeinanderfolge des Wortes »prelim« im
Emailverkehr




Der Algorithmus sucht nach »Burstiness«: das meint nicht nur die Häufigkeit der Worte,
sondern die Zunahme im Gebrauch des Wortes über eine Zeitperiode. "Die Methode ist aus
der Wahrscheinlichkeitsberechnung entstanden wie man sie für das Verhalten in einem
Netzwerk benutzt, wo der Verkehr zu Staus oder heißen Zonen führt," erklärt Jon Kleinberg.


france
1834-1835
war
1942-1945
freedom
1985-1991
slavery
1857-1860
aggression
1949-1955
bipartisan
1995-
slaves
1859-1863
defense
1951-1952
challenge
1996-
emancipation
1897-1863
korea
1951-1954
kids
1987-1995
cuba
1897-1899
oil
1974-1981
parents
1990-
depression
1930-1937
afghanistan
1980-1988
schooks
1996-
japanese
1942-1945
women
1981-1984
teachers
1996-



Diese Sicht schafft bemerkenswerte Einsichten. Die Auswahl in der Tabelle lässt erkennen,
dass Frankreich nur vor 180 Jahren von Interesse war, Kuba nicht zur Zeit der Kuba-Krise,
sondern 1897-99. Japaner und Krieg fanden das größte Interesse während des 2. Weltkrieges,
Korea tatsächlich zur Zeit des Koreakrieges und Afghanistan beschäftigte die Präsidenten
ganze acht Jahre. Öl war im Gespräch, als es knapp zu werden drohte. Das Interesse an
Freiheit ist seit 10 Jahren unbedeutend geworden, dafür werden die gemeinsamen Ziele von
Republikanern und Demokraten (bipartisan) anhaltend beschworen, ebenso die politische
Herausforderung (challenge). Kids fanden erst vor wenigen Jahrzehnten beschränktes
Interesse, noch später, allerdings weiter anhaltend Eltern seit 1990, Schulen und Lehrer seit
1996.

Müsste man der Meinung der Präsidenten nicht Zeitungsartikel aus überregionalen und
regionalen Zeitungen gegenüberstellen, damit die brennenden Probleme der Bevölkerung zu
Worte kommen? »Eine gute Ideeantwortet Jon Kleinberg, "die sich mit meinen
Beobachtungen an meinen Emails deckt. In den Emails mit Kollegen kristallisieren sich
relativ schnell brennende Themen heraus. In den Emails der Studenten nimmt das Wort
»prelim« vor den Examina explosionsartig zu." Und er fährt fort:


Bei der Suche nach Terroristen oder bisher unbekannten terroristischen Zellen
könnte es hilfreich sein, das »e-mail chatter« zu verfolgen. Der »burst«
ungewöhnlicher Worte als Grund für die weitere Analyse unserer Sicherheitskräfte.


Jon Kleinberg gehört zu den Wissenschaftlern, die nicht von der Anarchie des Internets
sprechen, sondern von der spontanen Selbstorganisation. Jede Webseite kann irgendwie von
anderen erreicht werden, womit das Web eher einer Milchstraße mit Galaxien ähnelt.


Da gibt es einen dichten Kern eng miteinander verzahnter Webseiten, die von
weniger verbundenen umgeben sind. Webseiten, die von vielen anderen »gelinkt«
werden, sind möglicherweise »Authorities«. Webseiten, die zu vielen anderen
linken, sind »Hubs«. Folglich ist die in der Meinung führende Webseite, die mit den
meisten Hubs. Von dieser Überlegung macht Google Gebrauch, und die neue
Suchmaschine Teoma.


Dennoch wäre es falsch, nur auf die Zentren zu blicken.


Die Knoten außerhalb lassen sich drei Kategorien zuordnen: »upstream«, wenn der
Link nur einer Richtung, nämlich zum Zentrum führt; »downstream« für das
umgekehrte Verhalten, und »tendrils«, die überhaupt nicht zum Kern linken.


Betrachtet man das durch die aktiven Hyperlinks charakterisierte Netzwerk zusätzlich aus der
Sicht der dominierenden Worte, lichtet sich der galaktische Nebel: jetzt werden
»communities« erkennbar, die sich bestimmten Interessen widmen.

Die Untersuchungsergebnisse werden nicht zufällig auf der diesjährigen Jahrestagung der
American Association for the Advancement of Science in Denver, Colorado vorgestellt. Die
schwelende Unsicherheit vor »Schläfern« im eigenen Lande wollen die
Sicherheitsverantwortlichen mit den besten Techniken unserer Zeit in den Griff bekommen.

Nichts soll mehr dem Zufall überlassen bleiben. So tun sich Krankenhäuser zusammen und
analysieren Tag für Tag sowohl die Art wie auch die Häufigkeit von Neuzugängen, um eine
Pockenepedemie oder andere bioterroristische Erkrankungen frühzeitig zu erkennen.
Emailfilter wie sie von Jon Kleinberg vorgeschlagen werden, sollen »Ersatzworte« erkennen
lassen, so wie das Pentagon den ersten Irakkrieg mit dem Begriff »desert storm« vorbereitete.

















Kommentare:
Und (robert alexander, 19.2.2003 4:03)
nene (robert alexander, 19.2.2003 4:00)
Anschlag Bombe Flugzeug Entführung Anthrax Vergiften Djihadd (Commander, 19.2.2003 2:53)
mehr...










Copyright © 1996-2003. All Rights Reserved. Alle Rechte vorbehalten
Heise Zeitschriften Verlag GmbH & Co.KG
last modified: 18.02.2003
Privacy Policy / Datenschutzhinweis






   User-Bewertung: -2
Wenn Dir diese Ratschläge auf den Keks gehen dann ignoriere sie einfach.

Dein Name:
Deine Assoziationen zu »Auswahl«:
Hier nichts eingeben, sonst wird der Text nicht gespeichert:
Hier das stehen lassen, sonst wird der Text nicht gespeichert:
 Konfiguration | Web-Blaster | Statistik | »Auswahl« | Hilfe | Startseite 
0.0171 (0.0048, 0.0101) sek. –– 463018470