Offene Daten – offene Gesellschaft

Nate Silver zeigt die Macht der Algorithmen

Von 8. November 2012 um 17:40 Uhr

Der politische Taschenrechner, das Blog von Nate Silver

Wenn Nate Silver fragt “Willst du mit mir wetten?”, sollte man nicht lange überlegen. Die einzig logische Antwort kann nur “Nein! Auf keinen Fall!” lauten. Der Statistik-Guru, dessen Blog FiveThirtyEight die New York Times vor zwei Jahren eingekauft hat, kennt seine Chancen – zumindest, wenn genügend Daten vorliegen.

Wie bei den US-Präsidentschaftswahlen: Silver lag schon 2008 mit seinen Prognosen sehr nah an den Ergebnissen. Diesmal waren sie so genau, dass kein Zweifel mehr an seinen Methoden bleibt. War er in der Woche zuvor noch als Magier belächelt oder sogar verspottet worden, wird er nun als solcher gefeiert. Silver tingelt durch Talkshows, sein im September erschienenes Buch schnellt in den Bestenlisten nach oben. Für jemanden, der so viel Zeit mit Zahlen verbringt, dessen Weg mit der Analyse von Baseball-Statistiken begann, steht er verdammt weit vorn im Rampenlicht.

Kritik hatte er sich vor allem von konservativer Seite eingefangen: Silver sah Obama seit Langem als Favoriten der Wahl, also musste ja irgendetwas nicht stimmen. Provoziert hatte er die Angriffe noch durch eine 1.000-Dollar-Wette mit Fernsehmoderator Joe Scarborough auf eine Wiederwahl des Präsidenten; das Geld des Verlierers sollte Hurrikan-Opfern zugute kommen. Nach einem Rüffel aus der Times-Chefetage spendete er schließlich ohne Wette 2.538 Dollar an das Rote Kreuz. Am Ende aber musste selbst einer seiner größten Kritiker, der Blogger Dean Chambers, zugeben: “Nate Silver hatte recht, und ich lag falsch.”

Dabei ist Silvers Methode alles andere als ein magisches Orakel, sondern mit harter Wissenschaft unterfüttert. Wie genau das Team von FiveThirtyEight mit den Daten umgeht, bleibt zwar selbstverständlich ein Geheimnis. Wäre die Formel hinter den Vorhersagen bekannt, könnte ja jeder zum selben Ergebnis kommen. Doch hinter den Algorithmen steckt eine Reihe von Überlegungen, die völlig nachvollziehbar sind.

Bauchgefühl gegen Statistik

Einen wichtigen Teil der Datenbasis etwa machen die unzähligen Wahlumfragen aus, die regelmäßig zu erstaunlich unterschiedlichen Ergebnissen geführt haben. Man kennt das Spiel: Wer eine bestimmte Botschaft stützen will – etwa “Der Trend spricht für Mitt Romney/Barack Obama” –, der sucht sich aus diesem Angebot eben das Passende aus.

Ein Weg, die Ausschläge nach oben oder unten einzudämmen, ist schlicht, einen Durchschnitt zu bilden. Doch Silver und sein Team gehen noch einige Schritte weiter. Ihr Modell gewichtet zunächst die einzelnen Umfragen unterschiedlich, beziehungsweise versucht, deren ideologisch oder strukturell begründete Abweichungen von einem repräsentativen Ideal herauszurechnen – gemessen vor allem an deren bisheriger Treffsicherheit. Neuere Umfragen erhalten zudem größeres Gewicht. Darüber hinaus zieht Silver noch andere verfügbare Daten für seine Analysen heran, die er zu den Umfragen in Beziehung setzt: etwa das Spendenaufkommen für die einzelnen Kandidaten, demographische Aspekte, Parteistatistiken und langfristige Trends.

Das alles fließt ein in ein komplexes Modell, dessen Ergebnisse ein willkommenes Gegengewicht zu all den politischen Experten bietet, die mit ihren vage fundierten Einschätzungen auf allen Fernsehkanälen so viel Sendezeit füllen, aber offenbar doch nur nach Bauchgefühl argumentieren. Wieder und wieder beteten die Insider das Mantra vom völlig offenen Kopf-an-Kopf-Rennen herunter, in dem der eine oder andere Kandidat aber einen entscheidenden Vorteil haben sollte. Silvers Wahrscheinlichkeiten sprachen hingegen deutlich für Obama. Sein Erfolg zeigt vor allem eines: Wahlen sind weniger überraschend als die meisten glauben – und als Journalisten es sich erhoffen.

Silver ist nur der Anfang

Silver lässt die Zahlen für sich sprechen, zieht seine Schlüsse streng nach analytischen Kriterien. Im Grunde müsste das alles todlangweilig sein. Natürlich steckt hinter dem rasanten Aufstieg des Statistik-Nerds auch das große Talent, sich medial gut zu verkaufen. Er ist lange nicht der einzige in diesem Feld, der das vorhandene Datenmaterial für präzise Vorhersagen nutzbar macht. Aber Drew Linzer, Sam Wang oder Josh Putnam genießen bei Weitem nicht diese Aufmerksamkeit.

In den Tagen vor der Wahl lasen bis zu 20 Prozent der Besucher auf der New York Times-Website auch Silvers Blog, teilweise mehr als 70 Prozent waren es unter denen, die das Politik-Ressort aufsuchten. Den kaum quantifizierbaren Kult um seine Person mal außen vor gelassen, lässt sich erahnen, dass es ein signifikantes Bedürfnis gibt, sich ohne ideologischen Spin mit den nüchternen Fakten auseinanderzusetzen – auch wenn starke Meinungen manchmal unterhaltsamer sein mögen.

Silver ist nur der Anfang. Die Datenmenge wächst, die Algorithmen werden besser und besser werden. Bei der nächsten Wahl in den USA werden die Medien nicht an dieser Entwicklung vorbeikommen: Jeder Sender, jedes Blatt wird einen Statistiker seines Formats haben wollen. Wollen wir wetten?

Leser-Kommentare
  1. 2.

    Wie viele Statistiker haben im Vorfeld der Wahl ihre Prognosen veröffentlicht?
    Und wie wahrscheinlich ist es, daß darunter einer ist, der genau richtig lag?

  2. 3.

    Sie schreiben: “Wahlen sind weniger überraschend als die meisten glauben – und als Journalisten es sich erhoffen.”

    Im Zweifelsfall werden fundierte Analysen wie diese einfach ignoriert. Am Wahltag schrieb ein Großteil der deutschen Presse: “Wahlausgang völlig offen.” Man bezog sich auf einzelne Umfragen, veraltete Daten. Oder ignorierte diese vollkommen. Oder leitete mit reißerischer Überschrift ein um im letzten Abschnitt ein paar nüchterne Fakten zu präsentieren.

    Der Spannungsbogen wurde hoch gehalten (immerhin soll kräftig geklickt werden), bis zuletzt auch in den Livestreams.

    Dass Obama der Favorit ist, stand in den USA auch selbst für seriöse (!) konservative Blätter fest, einzig die Extremen wurden nicht müde, von Romney’s “landslide” u.ä. zu reden.

    • 8. November 2012 um 18:50 Uhr
    • Mannelig
  3. 4.

    In der Tat ist die (mathematische) Statistik die einzige fundierte Methode, um aus real verfügbaren Daten Prognosen zu erstellen. Dass für eine Wahlvorhersage dabei “ein komplexes Modell” verwendet werden muss, liegt auf der Hand. Aber ob ein Modell passt, funktioniert wie in den Naturwissenschaften immer noch mittels Try & Error.
    Ich kann mir auch nicht vorstellen, dass die Vorhersagegenauigkeit durch Verfeinerung der Modelle beliebig gesteigert werden kann. Denn indem die Vorhersagen immer genauer eintreten, würden die Menschen ihr Verhalten sehr wahrscheinlich ändern. Sie werden sich innerlich gegen die Berechenbarkeit wehren und “unberechenbar” werden wollen.
    Ungeachtet dessen ist die Leistung von Nate Silver anzuerkennen und ich kann mir durchaus vorstellen, dass seine Methoden bei der nächsten Wahl bessere Vorhersagen bringen können.

  4. 5.

    Ich möchte ja jetzt nicht Nate Silvers Fähigkeiten in Frage stellen, aber es war doch eigentlich ziemlich klar, dass Obama gewinnt. Wenn man sich ernsthaft angeschaut hat, wie viele “Swing-States” Romney hätte knacken müssen um gewählt zu werden, hätte jedem, der keine Tomaten auf den Augen hat klar sein müssen, dass das unwahrscheinlich war (sicher nicht unmöglich aber eben unwahrscheinlich, wie Silver es ja auch in Zahlen ausgedrückt hat). Wer sich die Hochrechnungen für das Electoral College angesehen hat, brauchte keinen N.Silver für eine solche Aussage. Wer hier von knappen Wahlen gesprochen hat, hat entweder keine Ahnung, oder wollte die Verkaufszahlen für Zeitungen und Anzeigen in die Höhe treiben.

  5. 6.

    und ich als Medienkonsument bin mein eigener Statistiker – ich nehme die Statistik-Algorithmen und vergleiche sie mit meinem erfahrenen Bauchgefühl – und es funktioniert richtig gut

    • 8. November 2012 um 19:32 Uhr
    • uwilein
  6. 7.

    “Wie genau das Team von FiveThirtyEight mit den Daten umgeht, bleibt zwar selbstverständlich ein Geheimnis,..”

    Was heißt hier selbstverständlich. Wenn ihre Methoden so gut sind, wie man hier behauptet, hätten sie die Vorgehensweise längst patentieren und veröffentlichen können.
    Bevor das nicht geschehen ist, kann man die Vorhersagen getrost unter “Glückstreffer/Wahrsagerei” ablegen.

  7. 8.

    Nicht zu vergessen mit seinem Bayesischen Ansatz ist Gianluca Baio’s Tipp: 304 für Obama (beim momentanen Stand von 303 gar nicht schlecht)

    http://gianlubaio.blogspot.de/2012/11/gotcha.html

    Im Gegensatz zu den Herren aus dem Artikel oben (“[...] bleibt zwar selbstverständlich ein Geheimnis. Wäre die Formel hinter den Vorhersagen bekannt, könnte ja jeder zum selben Ergebnis kommen”)

    ist da der Code aber erhältlich, damit “jeder zum selben Ergebnis kommen kann”. Nennt sich Wissenschaft.

    • 8. November 2012 um 19:38 Uhr
    • anmerkung
  8. Kommentar zum Thema

    (erforderlich)

    (wird nicht veröffentlicht) (erforderlich)

    (erforderlich)