„Fußball ist keine Mathematik“, sagte einst Karl-Heinz Rummenigge, als der Ex-Mathematiklehrer und Bayern-Coach Ottmar Hitzfeld es mit der Strategie einmal übergenau nahm. Dennoch: Auch für ein tieferes Verständnis des Fußballs ist die Mathematik nützlich, wie wir schon im letzten Blog-Beitrag sehen konnten.
Heute schauen wir uns eine erstaunliche Fußball-Formel an, die eigentlich im Baseball ihren Ursprung hat. Der Baseball-Experte Bill James hatte sich in den 1980er Jahren mit der Frage befasst: Was macht den Erfolg eines Teams aus? Wovon hängt seine Punkteausbeute ab?
Im Baseball sind es die Runs (Läufe), die erzielten eigenen und die zugelassenen gegnerischen, die über Sieg oder Niederlage entscheiden. James war aufgefallen, dass der Anteil G gewonnener Spiele einer Mannschaft, die am Saisonende E erzielte und Z zugelassene Runs hatte, sich durch die Formel
G ≈ E2/(E2 + Z2)
annähern ließ. Wegen ihrer Ähnlichkeit mit dem Satz des Pythagoras nannte er sie die Pythagoras-Formel. Wir können sie uns folgendermaßen plausibel machen.
Wir nehmen zum einen an, dass die Gewinnwahrscheinlichkeiten der Mannschaften im Verhältnis ihrer Spielstärken stehen. Zum anderen, dass die Spielstärke einer Mannschaft durch die in der ganzen Saison erzielten und zugelassenen Runs gemessen werden kann. Genauer: Wenn eine Mannschaft A 80 Runs erzielt und 50 zugelassen hat – zwar gegen ihre gesamte Gegnerschaft, die aber gedanklich nur als ein einziger Durchschnittsgegner B gedacht wird –, dann ist die Spielstärkemaßzahl von A gleich 80/50 = 1,6 und die von B ist 50/80 = 0,625. Daraus ergibt sich die Gewinnwahrscheinlichkeit von A gegen B nach Annahme als
1.6/(1.6 + 0.625) = (80/50)/[(80/50) + (50/80)] = 802/(802 + 502).
Die Formel liefert eine gute Annäherung an die tatsächliche Punkteausbeute der Teams in mehr als 100 Jahren Baseball. Noch besser ist allerdings dieselbe Formel mit einem Exponenten 1.82 statt 2. Daraus lässt sich schließen, dass die Zufallsfaktoren im Baseball etwas größer sind, als dass sie ein exaktes Verhältnis zwischen Spielstärkemaßzahl und Gewinnwahrscheinlichkeit zulassen würden.
Die Pythagoras-Formel im Fußball
Das wiederum lässt erwarten, dass bei einer Anwendung der Formel im Fußball der optimale Exponent kleiner als im Baseball ist. Beim Fußball sind die Runs E und Z natürlich Tore und Gegentore. Eine für 37 internationale Fußball-Ligen mit Ergebnissen seit den 1990er Jahren durchgeführte Datenanalyse ergibt 1,32 als bestmöglichen Exponenten. Beim Fußball ist noch zu bedenken, dass für einen Sieg drei Punkte vergeben werden und bei Unentschieden 2 Punkte, je einer an jedes Team. Geht man von 24,7 Prozent unentschiedenen Spielen in der Bundesliga aus und entsprechend 75,3 Prozent entschiedenen, so werden im Schnitt 0,753 x 3 + 0,247 x 2 = 2,753 Punkte pro Spiel vergeben.
All das ermöglicht eine hübsche Anwendung der Pythagoras-Formel im Fußball: Schätzt man am Ende der Hinrunde aus den bis dahin erzielten Toren und zugelassenen Gegentoren die Spielstärke der Mannschaften und errechnet daraus die erwartete Punkteausbeute am Saisonende, so hätte sich für die Saison 2012/13 folgendes ergeben:
Pythagoräische Punktzahl = (Tore)1,32/[(Tore)1,32 + (Gegentore)1,32] x 34 x 2,753
Stand nach Hinrunde | Torverhältnis | Punkte | Doppelte Punktzahl der Hinrunde | Punkte am Saisonende | Pythagoräische Punktzahl |
München | 44 : 7 | 42 |
84 |
91 |
86,0 |
Leverkusen | 33 : 22 | 33 |
66 |
65 |
59,0 |
Dortmund | 35 :20 | 30 | 60 | 66 | 63,3 |
Die Pythagoras-Formel sagt das Endergebnis in der Regel besser vorher als eine simple Verdopplung der Punktzahl nach der Hinrunde. Ein Test dieser Formel an internationalen Ligen zeigt, dass die Formel einen Fehler von im Schnitt nur 4 Punkten hat. Das belegt ihre Qualität. Und auch im obigen Beispiel, „wusste“ sie bereits zur Saisonhalbzeit, dass Dortmund letztlich Vizemeister werden würde und nicht die nach der Hinrunde noch mit 3 Punkten davor platzierten Leverkusener.
Man kann auch von den Ergebnissen nach einem beliebigen Zwischenstand mit dem Torverhältnis den Saison-Endstand der Mannschaften prognostizieren. Nehmen wir ganz beliebig in der gerade zu Ende gegangenen Saison den 22. Spieltag, dessen Ergebnisse am 23.2.2014 vorlagen, und prognostizieren den Stand am Saisonende zweieinhalb Monate später. Es ergibt sich diese Prognose für die Top Drei des 22. Spieltages:
Stand nach 22 Spieltagen | Torverhältnis | Punkte | Hochgerechnete Punktzahl | Tatsächliche Punktzahl am Saisonende | Pythagoräische Punktzahl am Saisonende |
München | 61:9 | 62 | 95,8 | 90 | 86,7 |
Leverkusen | 39:25 | 43 | 66,5 | 61 | 60,2 |
Dortmund | 51:27 | 42 | 64,9 | 71 | 65,4 |
Die „Hochgerechnete Punktzahl“ errechnet sich durch Multiplikation der Punktzahlen nach dem 22. Spieltag mit 34/22. Auch in diesem Fall sagt die Pythagoräische Formel voraus, dass die Borussia aus Dortmund, obwohl nach dem 22. Spieltag nur auf Platz 3, am Ende wiederum Vizemeister sein wird. Und auch hier hat sie, wie wir inzwischen wissen, anders als die simpel hochgerechnete Punktzahl, recht gehabt.
Und so steht auch der Sieger im Pokalfinale bereits fest – so ziemlich. Jedenfalls, wenn es nach der Pythagoras-Formel geht. Aufgrund der Torverhältnisse beider Mannschaften in der gerade abgeschlossenen Saison (Bayern 94:23, Dortmund 80:38) gibt sie den Bayern eine Gewinnwahrscheinlichkeit von 70 Prozent. Interessanterweise ergibt sich ziemlich genau dieselbe Wahrscheinlichkeit, wenn man die Pythagoras-Formel auf das Torverhältnis der insgesamt 105 direkten Begegnungen beider Mannschaften des vergangenen halben Jahrhunderts anwendet. Hier steht es 193:135 zugunsten der Bayern.