Offene Daten – offene Gesellschaft

Nate Silver zeigt die Macht der Algorithmen

Von 8. November 2012 um 17:40 Uhr

Der politische Taschenrechner, das Blog von Nate Silver

Wenn Nate Silver fragt “Willst du mit mir wetten?”, sollte man nicht lange überlegen. Die einzig logische Antwort kann nur “Nein! Auf keinen Fall!” lauten. Der Statistik-Guru, dessen Blog FiveThirtyEight die New York Times vor zwei Jahren eingekauft hat, kennt seine Chancen – zumindest, wenn genügend Daten vorliegen.

Wie bei den US-Präsidentschaftswahlen: Silver lag schon 2008 mit seinen Prognosen sehr nah an den Ergebnissen. Diesmal waren sie so genau, dass kein Zweifel mehr an seinen Methoden bleibt. War er in der Woche zuvor noch als Magier belächelt oder sogar verspottet worden, wird er nun als solcher gefeiert. Silver tingelt durch Talkshows, sein im September erschienenes Buch schnellt in den Bestenlisten nach oben. Für jemanden, der so viel Zeit mit Zahlen verbringt, dessen Weg mit der Analyse von Baseball-Statistiken begann, steht er verdammt weit vorn im Rampenlicht.

Kritik hatte er sich vor allem von konservativer Seite eingefangen: Silver sah Obama seit Langem als Favoriten der Wahl, also musste ja irgendetwas nicht stimmen. Provoziert hatte er die Angriffe noch durch eine 1.000-Dollar-Wette mit Fernsehmoderator Joe Scarborough auf eine Wiederwahl des Präsidenten; das Geld des Verlierers sollte Hurrikan-Opfern zugute kommen. Nach einem Rüffel aus der Times-Chefetage spendete er schließlich ohne Wette 2.538 Dollar an das Rote Kreuz. Am Ende aber musste selbst einer seiner größten Kritiker, der Blogger Dean Chambers, zugeben: “Nate Silver hatte recht, und ich lag falsch.”

Dabei ist Silvers Methode alles andere als ein magisches Orakel, sondern mit harter Wissenschaft unterfüttert. Wie genau das Team von FiveThirtyEight mit den Daten umgeht, bleibt zwar selbstverständlich ein Geheimnis. Wäre die Formel hinter den Vorhersagen bekannt, könnte ja jeder zum selben Ergebnis kommen. Doch hinter den Algorithmen steckt eine Reihe von Überlegungen, die völlig nachvollziehbar sind.

Bauchgefühl gegen Statistik

Einen wichtigen Teil der Datenbasis etwa machen die unzähligen Wahlumfragen aus, die regelmäßig zu erstaunlich unterschiedlichen Ergebnissen geführt haben. Man kennt das Spiel: Wer eine bestimmte Botschaft stützen will – etwa “Der Trend spricht für Mitt Romney/Barack Obama” –, der sucht sich aus diesem Angebot eben das Passende aus.

Ein Weg, die Ausschläge nach oben oder unten einzudämmen, ist schlicht, einen Durchschnitt zu bilden. Doch Silver und sein Team gehen noch einige Schritte weiter. Ihr Modell gewichtet zunächst die einzelnen Umfragen unterschiedlich, beziehungsweise versucht, deren ideologisch oder strukturell begründete Abweichungen von einem repräsentativen Ideal herauszurechnen – gemessen vor allem an deren bisheriger Treffsicherheit. Neuere Umfragen erhalten zudem größeres Gewicht. Darüber hinaus zieht Silver noch andere verfügbare Daten für seine Analysen heran, die er zu den Umfragen in Beziehung setzt: etwa das Spendenaufkommen für die einzelnen Kandidaten, demographische Aspekte, Parteistatistiken und langfristige Trends.

Das alles fließt ein in ein komplexes Modell, dessen Ergebnisse ein willkommenes Gegengewicht zu all den politischen Experten bietet, die mit ihren vage fundierten Einschätzungen auf allen Fernsehkanälen so viel Sendezeit füllen, aber offenbar doch nur nach Bauchgefühl argumentieren. Wieder und wieder beteten die Insider das Mantra vom völlig offenen Kopf-an-Kopf-Rennen herunter, in dem der eine oder andere Kandidat aber einen entscheidenden Vorteil haben sollte. Silvers Wahrscheinlichkeiten sprachen hingegen deutlich für Obama. Sein Erfolg zeigt vor allem eines: Wahlen sind weniger überraschend als die meisten glauben – und als Journalisten es sich erhoffen.

Silver ist nur der Anfang

Silver lässt die Zahlen für sich sprechen, zieht seine Schlüsse streng nach analytischen Kriterien. Im Grunde müsste das alles todlangweilig sein. Natürlich steckt hinter dem rasanten Aufstieg des Statistik-Nerds auch das große Talent, sich medial gut zu verkaufen. Er ist lange nicht der einzige in diesem Feld, der das vorhandene Datenmaterial für präzise Vorhersagen nutzbar macht. Aber Drew Linzer, Sam Wang oder Josh Putnam genießen bei Weitem nicht diese Aufmerksamkeit.

In den Tagen vor der Wahl lasen bis zu 20 Prozent der Besucher auf der New York Times-Website auch Silvers Blog, teilweise mehr als 70 Prozent waren es unter denen, die das Politik-Ressort aufsuchten. Den kaum quantifizierbaren Kult um seine Person mal außen vor gelassen, lässt sich erahnen, dass es ein signifikantes Bedürfnis gibt, sich ohne ideologischen Spin mit den nüchternen Fakten auseinanderzusetzen – auch wenn starke Meinungen manchmal unterhaltsamer sein mögen.

Silver ist nur der Anfang. Die Datenmenge wächst, die Algorithmen werden besser und besser werden. Bei der nächsten Wahl in den USA werden die Medien nicht an dieser Entwicklung vorbeikommen: Jeder Sender, jedes Blatt wird einen Statistiker seines Formats haben wollen. Wollen wir wetten?

Leser-Kommentare
  1. 25.

    Die Medien verkauften uns ein knappes Rennen, um ihre Einschaltquoten zu erhöhen. Die vom Geld dominierte Medienlandschaft kreiert ihre eigene Realität unabhängig der Wirklichkeit, dabei steht der Kampf um Aufmerksamkeit im Mittelpunkt. Leider habe die meisten deutschsprachige Medien dieses künstlich produzierte Kopf-an-Kopf-Rennen kopflos übernommen.

    • 8. November 2012 um 22:33 Uhr
    • Hugo Graf
    • 8. November 2012 um 22:39 Uhr
    • Carsten Luther
  2. 27.

    schön, dass die meisten Leser (Kommentare) schon vor der Wahl klüger waren, als die meisten Journalisten. Wahrheit (kritische Analyse + Informationsrecherche) ist eben doch mehr Wert als Sensationsmache. Bin gespannt auf die zukünftige Entwicklung.

    • 8. November 2012 um 23:28 Uhr
    • Turb
  3. 28.

    ein solches Modell gibt es auch in Deutschland, von der Uni Mannheim.
    Seit ca. 20 Jahren werden bei der Bundestagswahl der Stmmenanteil der jeweiligen Regierungskoalition mit einer Genauigkait von ca. 0,1% vorhergesagt.

    Die Umfragen von ARD, ZDF, Infratest usf. sind mit 1% Genauigkeit ziemlich schwach, sie ignorieren den Stand der Wissenschaft, haben aber wohl einen höheren Unterhaltungswert?

    herzlichen Gruß

  4. 29.

    Das einzige, was ich vorher schon wusste, ist, dass in Florida besonders lang ausgezählt wird ;-). Das ist nämlich der Running Gag bei US-Präsidenten-Wahlen.

    • 9. November 2012 um 01:58 Uhr
    • Bernd Paysan
  5. 30.

    Also ich habe auch gewettet mit 303:235 für Obama, Florida ist ja immer noch nicht ausgezählt und sollte dieser an Romney gehen, habe ich alle 50 Staaten richtig getippt, aktuell 49. War auch diesmal ein Leichtes, dazu brauch man kein großer Zahlenmystiker wie da oben zu sein: einfach auf Realclearpolitics.com mit dem Simulator & Umfragewerten herumspielen … und auf Anhieb kamen 49 richtige Tipps dabei raus. Die einzigen Unsicherheitsfaktoren waren doch Ohio & Florida … Wozu sich die ganze Arbeit machen, wenn sie schon Andere präsentieren?

  6. 31.

    Wie war das noch mit dem Tintenfischorakel?

    Nein, im Ernst: Ich kenne die Methoden von Nate Silver nicht finde es aber auch nicht selbstverständlich, dass sie nicht veröffentlicht werden (weswegen?).

    Der Witz an Statistiken ist – und das ist der Grund, weswegen es NIE eine zuverlässige Statistik geben wird: sobald sie keine Prognosen mehr sind, sondern zutreffen treffen sie nicht mehr zu. Wenn ein Wähler weiß, dass sein Favorit gewinnt steigt die Wahrscheinlichkeit, dass er zuhause bleibt, andere wiederum fühlen sich besonders motiviert und gehen doch… Das ist auch der Grund, weswegen niemand aus dem Obama-Lager “Obama gewinnt” sagen würde: Wenn er oder sie damit überzeugen würde ist die Wahrscheinlichkeit höher, dass die Prognose nicht eintritt. Nennt man self defeating prophecy.

    Ich will nicht ausschließen, dass sich wirklich alles berechnen lässt, aber bis dahin gibt es noch viele Algorithmen zu schreiben. Mein Bauchgefühl und die Stimmung Wochen vor der Wahl sagte Obama gewinnt. Aber wer weiß schon, welcher Skandal sich wann medial niederschlägt? Sicherlich keiner von Nates Algorithmen.

    • 9. November 2012 um 03:46 Uhr
    • Kansaro
  7. 32.

    Der Einfluss der Prognose auf das tatsächliche Verhalten kann auch eingeschätzt/”errechnet” werden, wenn die Prognosezuverlässigkeit der einzelnen Institute über mehrere Präsidentschaftswahlen bekannt ist bzw. annäherungsweise ermittelt werden kann.

    • 9. November 2012 um 06:04 Uhr
    • Hansnuern
  8. Kommentar zum Thema

    (erforderlich)

    (wird nicht veröffentlicht) (erforderlich)

    (erforderlich)