Bevor wir auf den Zweiten Weltkrieg zu sprechen kommen, beginnen wir ganz unmartialisch. Angenommen, Sie sind auf Dienstreise in einer großen Stadt. Sie stehen an einer Straßenecke und versuchen ein Taxi zu kriegen. Immer mal wieder fährt ein Taxi mit Fahrgästen vorbei, insgesamt sechs Taxis. Die Taxis in der Stadt sind nummeriert und die vorbeifahrenden trugen die Nummern 696, 119, 864, 296, 548, 431. Wie viele Taxis gibt es wohl in dieser Stadt?
Das ist keine Scherzfrage. Die Anzahl lässt sich anhand der vorhandenen Indizien seriös schätzen. Dazu müssen wir ein mathematisches Modell entwickeln und einige Annahmen treffen: Gehen wir also davon aus, die in der Stadt operierenden Taxis seien von 1, 2, 3 bis N durchnummeriert. Der Wert N ist dann die Anzahl der Taxis, die es insgesamt in der Stadt gibt. Diesen Wert wollen wir schätzen.
Zweitens nehmen wir an, dass die beobachteten Zahlen eine Zufallsauswahl aus allen Taxi-Nummern von 1 bis N darstellen. Das bedeutet: Jedes Taxi mit jeder dieser Zahlen hatte dieselbe Wahrscheinlichkeit, bei Ihnen an der Straßenecke vorbeizukommen.
Diese Annahmen vorausgesetzt, kann N wie folgt geschätzt werden: Wir nehmen einfach die größte der beobachteten Zahlen, also 864, teilen durch die Anzahl 6 der beobachteten Zahlen und multiplizieren mit 7. Das ergibt (864/6) x 7 = 1.008. Und zwar deshalb: Wenn man den größten Wert Max = 864 in der Stichprobe durch den Stichprobenumfang n teilt, ergibt das den mittleren Zwischenraum zwischen den Zahlen in der Stichprobe. Wird anschließend mit n + 1 multipliziert, kann man im Schnitt erwarten, das unbekannte N zu treffen, da es ja von der Zahl 1 über die Werte in der Stichprobe bis zum unbekannten N genau einen Zwischenraum mehr gibt als den Stichprobenumfang n. Damit haben wir eine erste vernünftige Schätzung, wie groß N sein könnte.
Fraglos eine schöne Idee. Es gibt aber noch andere Möglichkeiten. Zum Beispiel kann man auch die unbekannte Lücke zwischen der größten Beobachtung Max und dem Wert N schätzen. Im Schnitt wird diese unbekannte Lücke zwischen Max und dem rechten Rand N des Zahlbereichs aus Symmetriegründen so groß sein wie die bekannte Lücke am anderen Rand, also zwischen dem kleinsten Stichprobenwert Min und der kleinstmöglichen Taxi-Nummer 1. Diese Lücke links von Min hat die Länge Min – 1. Und diese Länge werden wir als Schätzung für die Lücke rechts von Max verwenden und einfach zu Max hinzuaddieren: 864 + 119 – 1 = 982. Bei dieser Methode kommen also etwa weniger Taxis heraus. Aber auch das ist ein guter, seriös ermittelter Wert.
Ein Stück weiterspinnen kann man diese Überlegung dadurch, dass nicht nur die Lücke links vom Minimum benutzt wird, um die Lücke rechts vom Maximum zu schätzen, sondern alle Lücken zwischen allen Stichprobenwerten. Sie alle haben nämlich statistisch gesehen dieselbe durchschnittliche Länge, um die sie jeweils streuen. Dieser Ansatz führt im Wesentlichen wieder auf den ersten Wert, den wir geschätzt hatten.
Mathematiker wären nicht Mathematiker, wenn sie nicht mit einer ausgeklügelten Theorie eine noch optimalere Methode entwickelt hätten. Dabei bedeutet optimal zunächst einmal, dass die Schätzformel im Schnitt die Größe N richtig ermittelt, also langfristig bei vielen Einsätzen die unbekannte Größe weder überschätzt oder unterschätzt. Sie sollte also tendenzfrei sein. Man kann das etwa mit dem Wiegen eines Schnitzels durch einen Metzger vergleichen. Wenn die Waage richtig kalibriert ist, wird sie das Gewicht des Schnitzels nicht häufiger zu hoch als zu niedrig angeben. Wenn aber der Metzger beim Wiegen zum Beispiel immer auch seinen Daumen mit auf die Waage legt, wird das angegebene Gewicht tendenziös überschätzt.
Eine richtig gute Formel sollte darüber hinaus so wenig wie möglich um die unbekannte Größe streuen: Sprich, die bestmögliche Formel spuckt Werte aus, die bei wiederholter Durchführung die kleinste Varianz um N aufweisen.
Wie das dann in unserem Taxi-Setting aussieht, darauf wären Sie vielleicht nicht so ohne Weiteres gekommen. Man muss viel Theorie auffahren, um so eine Formel zu erhalten: Es ist ein Bruch, wobei im Zähler Max hoch (n + 1) minus (Max – 1) hoch (n + 1) steht und im Nenner derselbe Ausdruck, außer dass der Exponent jeweils nicht (n + 1), sondern n ist.
Wenn man das mit Max = 864 anwendet, erhält man bei n = 6 den Schätzwert 1.007.
Die obigen sechs Taxi-Nummern wurden übrigens per Zufallsgenerator aus der Menge der Zahlen von 1 bis N = 1.000 erzeugt. Insofern sind unsere Schätzwerte sehr gut.
Das Ganze ist nicht nur eine nette Spielerei, sondern hat eine reale Anwendung, beziehungsweise Vorgeschichte. Jetzt kommen wir nämlich zum Zweiten Weltkrieg … Damals haben die Alliierten große Anstrengungen unternommen, das Volumen der Kriegsmaschinerie der deutschen Wehrmacht in Erfahrung zu bringen. Unter anderem versuchten sie herauszufinden, wie viele Panzer von der deutschen Kriegsindustrie hergestellt worden waren. Dazu dienten den Verbündeten einerseits Informationen, die durch Spionage geliefert worden waren und andererseits die Seriennummern der während des Krieges von ihren Streitkräften zerstörten Panzer.
Aufgrund dieser Stichproben konnten Mathematiker mit den datenanalytischen Schätzmethoden, die ich oben skizziert habe, das Gesamtvolumen der Panzerproduktion pro Monat abschätzen. Das gab den alliierten Befehlshabern wertvolle Hinweise für die Planung der eigenen Produktion und der zu führenden Kampfeinsätze.
Nach dem Krieg konnten aufgrund von Dokumenten über Produktionszahlen, die inzwischen entdeckt worden waren, die mathematischen Schätzungen mit den Informationen der Spione verglichen werden. Und siehe da: Die Mathematiker lagen dichter an der Wahrheit, wie die folgende Tabelle zeigt:
Monat | Tatsächlich produzierte Panzer | Schätzungen der alliierten Mathematiker | Schätzungen durch Spionage |
Juni 1940 | 122 | 169 | 1000 |
Juni 1941 | 271 | 244 | 1550 |
Sept.1942 | 342 | 327 | 1550 |
Tabelle nach Ruggles, R. & Brodie, H. (1947): An Empirical Approach to Economic Intelligence in World War II. JASA, 42, 72-91.