‹ Alle Einträge

Mit Statistik-Tricks Steuersünder entlarven

 

In letzter Zeit war viel von Steuerhinterziehung die Rede, meist im Zusammenhang mit Uli Hoeneß. Der hat nachweislich Millionen-Gewinne in seinen Steuererklärungen unterschlagen. Heraus kam das durch Recherchen von Journalisten und der schiefgegangenen Selbstanzeige des Fußball-Managers.

Andere Steuersünder sind da vermeintlich geschickter. Sie fälschen und manipulieren ihre Steuererklärungen gezielt, um die Finanzbeamten zu täuschen. Hier kommt die Mathematik ins Spiel – Fahnder nutzen sie sogar, um Steuersündern auf die Schliche zu kommen. Denn es gibt erstaunliche statistische Gesetzmäßigkeiten. Wenn die nicht erfüllt sind, schöpfen Steuerexperten Verdacht.

Aber der Reihe nach.

Es gibt mehr kleine als große Dinge in der Welt. Und auch in der Welt der Zahlen ist das so. Unser Kosmos hat wohl eine Vorliebe für Zahlen mit kleinen Anfangsziffern. Jede Zahl kann man schreiben, indem man einen Wert M zwischen 1 und 10 mit einer Zehnerpotenz multipliziert. Also 3,1 mal 10 hoch 2 statt 310. Kurioserweise treten in der Welt häufig Zahlen auf, deren Faktoren M kleiner als 4 sind. Das sind Zahlen mit Anfangsziffern 1, 2 oder 3.

Das können Sie feststellen, indem Sie eine beliebige Zeitungsseite aufschlagen oder eine Website aufrufen und die Anfangsziffern aller in den Artikeln auftretenden Zahlen oder Zahlwörter notieren. Solche mit kleinen Anfangsziffern bilden die Mehrheit. Genauer: Die Anfangsziffern der Zahlen vieler Datensätze – von Einwohnerzahlen über Naturkonstanten bis hin zu beliebig zusammen gemischten Werten in Nachrichten und Berichten – folgen der Benford-Verteilung, auch Benfordsches Gesetz genannt.

Abbildung: Vlad Sasu
Abbildung: Vlad Sasu

Der Abbildung ist zu entnehmen, dass die relative Häufigkeit der Anfangsziffer 1 mehr als 6 Mal größer ist als die der Anfangsziffer 9.

Für die meisten Menschen kommt das sehr überraschend. Es ist kein Grund erkennbar, warum unsere Welt zum Beispiel die Zahl 1.362 gegenüber der Zahl 9.362 favorisieren sollte. Sie unterscheiden sich nur um eine Ziffer. Und dennoch ist es so: Eine Zählung in einigen willkürlich gesuchten Google-Ergebnissen bestätigt Ihnen das sofort.

Wie kommt es zur Benford-Verteilung?

Wenn es ein allgemeingültiges Verteilungsgesetz der Anfangsziffern gibt, dann kann es nicht davon abhängen, in welchen Einheiten die Zahlen angegeben werden, ob in Celsius oder Fahrenheit, Kilometern oder Meilen, Euro oder Dollar. Das Gesetz muss auf jeder infrage kommenden Mess-Skala gelten, also universell sein. Mathematiker nennen diese Eigenschaft Skaleninvarianz.

Und Skaleninvarianz bedeutet etwas weitergedacht, dass die 10er-Logarithmen der obigen Faktoren M gleichmäßig im Intervall von 0 bis 1 variieren. Diese Gleichverteilung bei den Faktoren M führt dann zur Ungleichverteilung der Anfangsziffern gemäß Benford: Die Wahrscheinlichkeiten für die Anfangsziffern d = 1, 2, …, 9 betragen jeweils log(d + 1) – log(d).

Dieses Verteilungsgesetz gilt auch für die überwiegende Mehrheit von Finanzdaten: Echte, unverfälschte, saubere Finanzdaten folgen der Benford-Verteilung, fabrizierte Daten weichen davon ab.

Der US-Statistiker Mark Nigrini, Professor für Buchhaltungswesen, hat Daten über die Zinserträge, die amerikanische Banken an die Steuerbehörde leiten, statistisch untersucht und fand das Benford-Gesetz sehr genau erfüllt. Doch die von den Steuerpflichtigen in ihren Steuerklärungen angegebenen Beträge wichen oft davon ab.

Nigrini hat eine Software entwickelt, die bereits in vielen Ländern, auch in Deutschland, von Behörden und Wirtschaftsprüfern zum Aufspüren von manipulierten Steuererklärungen und gefälschten Bilanzen eingesetzt wird. Er hat sie an Fällen zugegebener Steuerhinterziehung getestet: Keine der Erklärungen passierte seinen Benford-Test.

Es ist aber auch ziemlich schwierig, Daten so zu fälschen, dass sie weiterhin Benford-artig bleiben. Denn nicht nur die Anfangsziffern, sondern auch die folgenden Ziffern natürlich vorkommender Daten zeigen statistische Auffälligkeiten. Es mag nur ein kleiner Unterschied sein, wenn jemand einen tatsächlichen Gewinn von 16.432 Euro als 9.921 Euro nach unten drückt, doch schon diese eine Manipulation verzerrt das Gefüge der ersten beiden Ziffern erheblich. Und da es hier um die Ziffer „9“ geht, die einen starken Verzerrungshebel hat, kann der Datensatz schon dadurch auffällig werden. Etwas überpointiert könnte man sagen: Einen Daten-Guru kann man nicht belügen.

Wenn Steuererklärungen beim Benford-Test durchfallen, ist das natürlich kein juristisch zwingender Beweis für Fälschung, aber es ist ein Signal für die Steuerbeamten, einmal genauer hinzuschauen, Belege anzufordern, Einträge zu prüfen und eventuell eine Steuerrevision zu veranlassen. Wer denkt, das Finanzamt sei zu blöd, um Fälschungen aufzudecken, kann sich dabei leicht verrechnen.

43 Kommentare

  1.   N.N.

    „Keine der Erklärungen passierte seinen Benford-Test.“ ??
    Ist das aus dem Englischen via Google translator? ;)

  2.   Anonym

    Wird in dem Artikel nun erklärt, „Wie kommt es zur Benford-Verteilung?“, oder übersehe ich das?

    Kann jemand den Satz „Und Skaleninvarianz bedeutet etwas weitergedacht, dass die 10er-Logarithmen der obigen Faktoren M gleichmäßig im Intervall von 0 bis 1 variieren.“ genauer erläutern?

  3.   Florian Rabuza

    Benford’s Law wird auch in vielen anderen Bereichen herangezogen, um Anomalien im Datengenerierungsprozess aufzuspüren. Zum Beispiel in der Forschung zu Wahlbetrug und Wahlfälschung:

    http://blogs.uni-due.de/wissenschaft-politik/2013/11/04/wahlbetrug-bei-bundestagswahlen/

    Auch hier gilt natürlich: Eine Abweichung von der Verteilung allein ist noch keine hinreichende Evidenz für tatsächlichen Betrug, sondern ein Hinweis, genauer hinzusehen.


  4. @2

    wenn sie einen Datensatz Supermarkt DM Preise nehmen und in € umrechnen dann bekommen sie trotzdem die Benford-Verteilung.

  5.   Jan-Christian

    Danke für den Artikel, wirklich faszinierend! Schade finde ich, dass wieder Hoeneß als Aufhänger herhalten muss. Das rückt den schönen wissenschaftlichen Bericht ins Fahrwasser der billigen, pupulistischen Aufmacher der letzten Wochen, mit denen sich die Medien häufig nicht mit Ruhm bekleckert haben.


  6. @ #1 – N.N.: Der Translator gehört wohl zur Kategorie der »Lucky Pig Tomatoes« (Glück-Sau-Tomaten) …

  7.   Chrsitophe

    Mich würde auch die Herleitung und praktische Relevanz der Fibonacci-Folge in einem der kommenden Artikel interessieren!

  8.   Nemo

    Stimmt aber nicht immer, da viele Zahlen nicht „natürlich“ vorkommen… so gibt es deutlich mehr Dinge im Einkaufswagen, die EUR 9,98 kosten, als es Dinge gibt, die EUR 10,xx kosten. Und das zieht sich durch alle Produkte, die auch in einer Steuererklärung auftreten können. Immer, wenn der Mensch (mit seiner psychologie) direkten Einfluß nimmt, dann fällt Benford durch. Daher hat Benford für Steuererklärungen nur einen eingeschränkten Wert.

  9.   math

    Skaleninvarianz bedeutet, dass es für die Verteilung der Zahlen keinen Unterschied machen darf, wenn man z.B. alle Zahlen mit 2 multipliziert.

    Betrachtet man jetzt nicht die Zahlen selbst, sondern nur die Zehnerlogarithmen der Multiplikatoren, so müssen diese auch einer Verteilung auf dem Intervall [0,1] gehorchen. Auch diese Verteilung darf sich nicht ändern, wenn die ursprünglichen Zahlen mit 2 multipliziert werden.

    Da log(2*x)=log(2)+log(x) gilt, wird die Verteilung der Logarithmen aber nur auf dem Intervall [0,1] nach rechts verschoben (was rechts (bei der 1) rausgeschoben wird kommt links (bei der 0) wieder rein). Dabei muss nun das Integral über gewisse Bereiche konstant bleiben, da dies gerade der Wahrscheinlichkeiten der Anfangszahlen der Faktoren entspricht.

    Dies ist nur möglich, wenn die Verteilung eine Gleichverteilung ist (d.h. es ist gleich wahrscheinlich, dass der Logarithmus eines Faktors zwischen 0 und 0.1 oder zwischen 0.1 und 0.2 ist, etc.).

  10.   max

    @2.:
    Nein,es wird nicht erklärt, wie es zu dieser verteilung kommt, sondern gesagt, dass sie praktisch überall vorkommt…

    Und zum satz mit ‚M‘ und ‚log‘ etc.:
    Gib in den taschenrechner die zahlen 10 hoch null, 10 hoch 0.1, 10 hoch0,2 bis 10 hoch 0.9 ein. Nun schau dir die anfangsziffern der ergebnisse an und voila…

 

Bitte melden Sie sich an, um zu kommentieren.

Anmelden Registrieren