Erster Bericht von der Web-Konferenz WWW2010 in Raleigh, NC, USA
Zum neunzehnten mal treffen sich Fachleute aus der ganzen Welt zum Gedankenaustausch bezüglich World Wide Web. Dieses Jahr wurde die Stadt Raleigh in North Carolina im Osten der USA als Austragungsort gewählt.
Noch vor einer Woche habe ich mit Bangen alle paar Stunden die Websites der Zeitungen und vorallem von Swiss konsultiert, um abzuschätzen, ob die Webkonferenz nach 16 Jahren Präsenz meinerseits tatsächlich zum ersten Mal ohne mich stattfinden würde. Doch um es mit der Flughafensprecherin von Reykjavik zu formulieren: Die Götter waren mir gut gestimmt und liessen mich nicht zuhause festsitzen.
Beim Einsteigen am Gate gab es dann aber doch noch eine Überraschung. Als die Dame meine Boardingcard unter den Scanner hielt, spuckte das Kästchen einen Zettel aus, auf welchem stand „You have been upgraded to Business class“ – wow! So flog ich dann wie ein kleiner König über den Atlantik, mit beliebig viel Platz (3 Fenster) und wurde dabei erst noch kulinarisch verwöhnt. Die Weiterreise von JFK nach Raleigh an Bord eines American Eagle ging dann deutlich gedrängter von statten. Das Flugzeug war so niedrig, dass selbst ich mit meinen 176 cm mit dem Kopf an die Decke stiess und für eine Gepäckablage über dem Sitz gab es auch keinen Platz. Immerhin hatte ich einen Einzelsitz, auf der anderen Gangseite mussten sich die Passagiere zu zweit hineinquetschen (das macht 3 Sitze pro Reihe, das muss das kleinste Passagierflugzeug sein, in dem ich je gesessen bin). Entsprechend unruhig war der Flug, aber es ging ja auch nur 90 Minuten.
Auf den Nummernschildern der Autos im Staat North Carolina steht „First in Flight“. Gemeint sind damit die vier Flüge der Gebrüder Wright, welche am 17. Dezember 1903 in Kitty Hawk als erste Menschen erfolgreich mit einem motorgetriebenen Flugzeug geflogen sind. Kitty Hawk liegt an der Küste, gut 250 km östlich von Raleigh. Trotz der Distanz liess ich es mir nicht nehmen, am Samstag mit einem Mietwagen zum Wright Brothers National Monument zu fahren. Einige Bilder dazu findet man in meiner Galerie unter http://www.gallery.ethz.ch/ra/view_album.php?set_albumName=album02
Heute nun hat die Konferenz begonnen. Ich besuchte das Tutorial mit dem Titel „Introduction to Social Recommendation“. „Sozial“ ist das Schlagwort dieser Konferenz. In der Einleitung wurde erwähnt, dass Facebook mit 400 mio Subscribers die drittgrösste „Nation“ auf unserem Planet darstellt (die USA haben 308 mio Einwohner, China und Indien über 1000 mio). Es scheint mir zwar etwas vermessen, die Facebook Community mit einer Nation zu vergleichen, aber die Zahl ist schon beeindruckend. Dem Autor ging es auch vorallem darum zu zeigen, wie weitgefächert die sozialen Kontakte heute Dank dem Web sind und noch mehr, was man mit solchen Informationen anstellen kann. Angefangen bei ganz banalen Auswertungen von bei Google benutzten Suchbegriffen. Erstellt man z.B. eine Grafik, wo in den USA Worte rund um den Begriff „Grippe“ eingegeben werden, so kann man die Ausbreitung einer Grippewelle besser lokalisieren als über die Daten der Gesundheitsbehörde. Wenn die Leute Symptome einer Grippe erkennen, suchen sie zum einen nach deren Beschreibung und zum anderen nach Medikamenten. Die Gesundheitsbehörden dagegen sammeln die Daten bei Ärzten und Spitälern und hinken dadurch um etwa 2 Wochen der tatsächlichen Ausbreitung hinterher. Der Zugriff auf bei Suchmaschinen benutzte Begriffe kann eine äusserst wertvolle und hilfreiche Datenquelle sein. Sollte die ETHZ irgendwann wieder einmal den Betrieb einer eigenen Suchmaschine in Erwägung ziehen, so sollte dieser Aspekt nicht vernachlässigt werden.
Allerdings ging es in diesem Tutorial ja nicht um Suchmaschinen, sondern um „Social Recommendation“, also um „soziale Empfehlungssysteme“. Der Übergang scheint mir allerdings fliessend, denn GoogleAds und „Sponsored Links“ sind ja nichts anderes als Empfehlungen, welche den Suchresultaten mehr oder weniger offensichtlich beigemischt werden. Auch sind gerade in der Schweiz Websites wie toppreise, preisvergleich usw. in Suchresultaten häufig sehr penetrant vertreten. Diese sind auch eine Art von Empfehlungs-Systeme, allerdings fehlt hier noch die soziale Komponente. Diese soll nun die Empfehlungen für ein einzelnes Individum noch mehr verbessern. Dazu braucht es zum einen das Profil der Zielperson (was mag sie, was mag sie nicht) und zum anderen die Profile der Freunde der Zielperson. Die Empfehlungssysteme analysieren dann die Resultate der Suche und bringen Sie in einen Zusammenhang mit dem Profil der Zielperson und deren Freunde. Letzteres verbessert die Empfehlungen deshalb, weil die Informationen über die Zielperson häufig knapp und unvollständig sind. Wenn man aber die Vorlieben und Abneigungen der Freunde der Zielperson kennt, so kann man diese zusätzlich einbringen. Wenn viele Freunde der Zielperson etwas mögen, dann ist die Wahrscheinlichkeit gross, dass auch die Zielperson dieses etwas mag. Das gleiche gilt für Abneigungen. Der Kreis lässt sich noch erweitern, wenn man auch noch die Freunde der Freunde miteinbezieht. Schwierig wird es, wenn die Zielperson etwas mag, der Freund der Zielperson nicht, der Freund des Freundes aber schon. Die Annahme, „the enemy of my enemy is my friend“ ist in diesem Zusammenhang sehr gewagt und kann die Resultate falsch beeinflussen.
Im Laufe des Tutorials wurde viele statistische Formeln präsentiert. Wer sich für diese im Speziellen oder das Tutorial im Allgemeinen interessiert, findet die 216 Folien unter www.ra.ethz.ch/www/www2010/2010-04-26/www2010tutorial.pdf