Offene Daten – offene Gesellschaft

Ja, wo twittern sie denn?

Von 11. Januar 2013 um 17:10 Uhr
Tweets über Manchester United (rot) und Manchester City (blau)

Tweets über Manchester United (rot) und Manchester City (blau)

Wo sind die wahren Fans von ManU? Oder die von Arsenal? Ist Manchester City wirklich der beliebteste Club in der Region von Manchester, oder ist es nicht doch eher Manchester United? Wissenschaftler am Oxford Internet Institute haben Tweets ausgewertet, um darüber eine Aussage treffen zu können.

Dazu analysierten sie alle Tweets, die zwischen dem 18. August und dem 19. Dezember 2012 versendet wurden und die sich einer Geokoordinate zuordnen ließen, weil der Twitterer das eingestellt hatte. Gesucht wurden Botschaften, die sich mit einem der Clubs der britischen Premier League beschäftigten. Anschließend wurden sie nach Postleitzahlen sortiert. Auf der daraus erstellten interaktiven Karte ist zu sehen, in welchen Postleitzahlenbereichen Botschaften zu welchem Club überwogen.

Auch haben sie klassische Rivalitäten visualisiert, wie eben die zwischen ManU und Manchester City. Oder die zwischen Arsenal und Tottenham.

Und so ist man offensichtlich im Westen von Manchester eher für ManU und im Osten eher für Manchester City. Die Forscher schreiben: “In Manchester gibt es das oft zitierte Stereotyp, Manchester City seien die wahren Lokalhelden, Manchester United werde eher von Leuten unterstützt, die woanders lebten. Unsere Karte unterstützt diese Sicht nicht unbedingt. Es gibt nur wenige Orte in der Region, wo Manchester City signifikant häufiger in Tweets erwähnt wurde als ihr Rivale. Seltsamerweise sehen wir in Schottland und Merseyside mehr Unterstützung für Manchester City, und in Nordirland mehr für Manchester United.”

Das mag wie eine Spielerei wirken. Doch es belegt, dass Twitter dazu dienen kann, ein Stimmungsbild zu zeigen. Zumindest ein ungefähres. Denn die Stimmungsanalyse von Tweets ist nicht so einfach. Der Algorithmus muss erkennen, ob der Text wirklich einen Verein unterstüzt, oder sich nur über ihn lustig macht. Daher schreiben die Wissenschaftler auch, dass ihre Daten unsauber sind. Trotzdem sind sie überzeugt, dass sich so Mythen widerlegen und Einsichten gewinnen lassen.

Kategorien: Datenvisualisierung
Leser-Kommentare
  1. 1.

    Die Einsichten, die sich so gewinnen lassen halte ich für ziemlich fragwürdig. Letztes Jahr hab ich nach den NBA-Playoffs irgendwo eine Vergleichsanalyse gesehen zwischen den Twitter-Unterstützern der Miami Heat und Oklahoma Thunder, der klar zugunsten der (letztlich siegreichen) Miami Heat ausging. Da konnte man auch in den Datenfeed reinschauen – und dabei feststellen, dass es in etwa jedem dritten Tweet, der in die Auswahl gekommen war eigentlich um irgendwelche Wetterphänomene ging. “The intense heat” oder “scorching heat” trat dabei so oder ähnlich deutlich häufiger auf als irgendwas im Zusammenhang mit “thunder”. Trotzdem wurde daraus darauf geschlossen, dass die Heat-Anhänger fleißiger twitterten als die von Oklahoma.

    • 11. Januar 2013 um 20:10 Uhr
    • Helge Holler
  2. 2.

    Anders als der Text vermuten lässt, handelt es sich hierbei keineswegs um eine Sentiment Analysis. Es wird lediglich gezählt, wie häufig die jeweiligen Hashtags in Tweets auftauchen, und dann ein Ranking erstellt (sieht man ja beim Überfahren der Distrikte). So eine Analyse ist a) ziemlich simpel und b) ziemlich aussagelos.

    • 15. Januar 2013 um 15:31 Uhr
    • Winston Smith
  3. 3.

    Weiß jemand, wie man solche Daten vernünftig auslesen kann? Oder muss ich da bei Twitter in jedem Fall die Postleitzahl eingeben und dann die Tweets von Hand auszählen?
    Ich gehe mal schwer davon aus, dass das auch einfacher gehen muss und würde gerne wissen wie.

  4. 4.

    Postleitzahlen gibt es bei Twitter nur, wenn jemand sie im Tweet erwähnt. Eher selten, also. Viel häufiger sind die Geokoordinaten, die mit vielen Twitteranwendungen mitübertragen werden können. Die hat das Team der Uni Oxford genutzt – und die einzelnen Tweets also dank ihnen auf einer Karte lokalisiert und das dann mit den Postleitzahlen verknüpft. Von Hand passiert das alles nicht, nein.

    Beste Grüße
    Kai Biermann

    • 15. Januar 2013 um 22:37 Uhr
    • Kai Biermann
  5. Kommentar zum Thema

    (erforderlich)

    (wird nicht veröffentlicht) (erforderlich)

    (erforderlich)