Offene Daten – offene Gesellschaft
Kategorie:

Datenjournalismus

Festgenommene in Ferguson

Von 22. August 2014 um 16:11 Uhr
Festnahmen bei Protesten in Ferguson nach Ort der Festnahme Quelle: http://www.washingtonpost.com/wp-srv/special/national/ferguson-arrests/

Festnahmen bei Protesten in Ferguson nach Ort der Festnahme Quelle: http://www.washingtonpost.com/wp-srv/special/national/ferguson-arrests/

Wer wurde bei den Protesten in Ferguson in den USA warum festgenommen? Die Washington Post präsentiert hier die Zahlen. Häufigster Grund: “refusal to disperse“, also die Weigerung, sich zu zerstreuen, auseinander zu gehen.

In der Grafik zu sehen sind nur diejenigen, die ins St. Louis County Jail kamen. Nicht enthalten sind Festgenommene, die in Gemeindegefängnissen sitzen. Hier hat die Zeitung noch eine Auflistung der Festnahmen pro Tag der Proteste.

Festgenommene Journalisten sind nicht extra ausgewiesen.

(via @ChElm)

Kategorien: Datenjournalismus

Adressen der Berliner Arztpraxen sind ein Geheimnis

Von 7. April 2014 um 09:42 Uhr

Die Adressen aller Arztpraxen in vier Städten zu besorgen, wie kompliziert kann das schon sein? Immerhin stehen sie in jedem Telefonbuch. In Hamburg, Köln und München war es auch kein Problem, für unser Projekt zur Praxisdichte von den zuständigen Stellen eine Liste aller Ärzte der jeweiligen Stadt zu erhalten. Es genügten einige Telefonate, dann schickten die Kassenärztlichen Vereinigungen ein entsprechendes Excel-Dokument per E-Mail.

Nur in Berlin weigerten sich Ärztekammer und Kassenärztliche Vereinigung (KV) standhaft, die Adressen der niedergelassenen Ärzte herauszugeben. Beide berufen sich auf den Datenschutz. Von der Ärztekammer heißt es zusätzlich am Telefon, die Presse bekäme solche Daten “schon mal gar nicht”.

Wir stellten daher am 4. März an Ärztekammer und Kassenärztliche Vereinigung einen Antrag nach dem Berliner Informationsfreiheitsgesetz und baten darum, uns die Daten in digitaler Form zu übermitteln.

Von der Ärztekammer hörten wir erst einmal gar nichts. Nach zwei Wochen fragten wir nach, was aus unserer Anfrage wurde, eine weitere Woche später kam die erste Reaktion. Von Datenschutz ist nun nicht mehr die Rede. Man sei nicht zuständig sondern allein die KV, heißt es in der E-Mail. Im Übrigen weise man darauf hin, “dass die von Ihnen erwünschte Information auf der Homepage der Kassenärztlichen Vereinigung Berlin verfügbar ist (Arztsuche der KVB)”.

Angesichts der erklärten Open-Data-Strategie Berlins ist das ein befremdliches Verhalten. Ja, die Daten werden sowohl als kostenpflichtiges Buch “Der Arzt – Handbuch des Berliner Gesundheitswesens” als auch als öffentliche Suche der KV und unter Ärzte-Berlin als Suche angeboten. Warum also nicht einfach ein Excel-Dokument verschicken, oder die Daten gleich für alle zum Download anbieten, wenn sie doch offensichtlich elektronisch vorliegen? Schließlich bedeutet Open Data auch, Daten zur weiteren Verarbeitung bereit zu stellen.

Vielleicht weiß die KV mehr? Die Kassenärztliche Vereinigung meldet sich immerhin eine Woche nach unserer Anfrage per Brief. Der Datenschutzbeauftragte der KV schreibt: “Für eine derartige Datenübermittlung von Informationen, die dem Sozialdatenschutz unterliegen, besteht keine Rechtsgrundlage und somit keine Übermittlungsbefugnis.”

Das Argument ist absurd. Die Daten haben keine datenschutzrechtliche Relevanz. Nicht einmal die Namen der Ärzte werden genannt. Es geht um die Adressen der Arztpraxen – also um eine durchaus wichtige Information für jeden Bürger, der sich krank fühlt.

Das sieht auch der Berliner Datenschutzbeauftragte so. Seine Sprecherin sagt, sie wisse nicht, was aus Sicht des Datenschutzes gegen eine Veröffentlichung sprechen solle.

Noch dazu, da diese Daten als Buch angeboten werden. Womit der Eindruck entstehen könnte, die Daten würden nur deshalb zurückgehalten, um das Geschäftsmodell des Verlages zu schützen. Der verlangt für jedes gedruckte Exemplar der Ärzteliste 53,50 Euro.

Nebenbei: Nach dem Berliner IFG Paragraf 4 Absatz 2 darf eine öffentliche Stelle keinen Vertrag mit einem privaten Anbieter schließen, der dem IFG entgegen steht. Die Daten können zwar verkauft werden, sie dürfen dadurch aber nicht für die Öffentlichkeit unzugänglich werden. So soll verhindert werden, dass Verwaltungen Geschäftsmodelle von Unternehmen schützen.

Aber auch die Berliner Senatsverwaltung für Gesundheit hat keine Handhabe gegen die Ärztevertreter. Man könne daran leider nichts ändern, lautet ihre Antwort. Zumindest lässt man im Senat durchblicken, dass man über das Verhalten nicht erfreut sei.

Die Geschichte hat leider kein happy end. Auch nach einem Monat haben sich die Berliner Ärztevertreter nicht bewegt. Der Berliner Beauftragte für Datenschutz und Informationsfreiheit prüft die Ablehnung unserer IFG-Anfrage. Ausgang unklar.

Wir haben die Berliner Praxisdaten letztlich gescrapt, also mit einem Programm automatisch aus der Website der Arztsuche ausgelesen. Genauso wie die Daten der Berliner Zahnärzte – deren Vertreter wollten uns zwar auch nichts schicken, meinten aber immerhin, sie hätten nichts dagegen, wenn wir die Datenbank selbst auslesen würden.

Damit andere das nicht wieder tun müssen, wenn sie eine Idee haben, wie sich diese Informationen noch sinnvoll einsetzen lassen, stellen wir sie hier in einem öffentlichen Googledoc zum Download bereit.

Kategorien: Datenjournalismus

Wer wie viele Waffen hat, geht die Öffentlichkeit nichts an

Von 16. Januar 2014 um 07:56 Uhr
Sportschütze. Quelle: Lars Baron/Getty Images

Sportschütze. Quelle: Lars Baron/Getty Images

Oft beginnt eine Recherche mit einer simplen Frage: In welchen Städten und Landkreisen gibt es eigentlich die meisten Schusswaffen? Und dann stellt man zum eigenen Erstaunen fest: Das weiß in diesem Land keiner so genau – und die einzige Behörde, die die Daten haben könnte, rückt sie nicht heraus.

Seit Januar 2013 müssen alle Städte und Kreise die in ihrer Region registrierten Waffen von Jägern, Sammlern und Sportschützen an das Nationale Waffenregister (NWR) beim Bundesverwaltungsamt in Köln melden. Allein das ist bereits komplizierter als es klingt, denn die Struktur der Meldebehörden ist von Bundesland zu Bundesland unterschiedlich. In manchen Landkreisen gibt es eine solche Behörde, in anderen mehr als zehn. Insgesamt arbeiten daher in Deutschland gut 550 Waffenbehörden.

Ihre Daten liegen dank des Nationalen Waffenregisters beim Bund gesammelt vor, die oben gestellte Frage müsste sich also einfach beantworten lassen. Doch der Öffentlichkeit will die Behörde (sie sagt: kann), keine Angaben aus dieser zentralen Datenbank zur Verfügung stellen. Das sei im Gesetz leider nicht vorgesehen, lautet die Antwort. Man dürfe lediglich die Kriminalämter und Innenministerien mit Statistiken aus dem Waffenregister beliefern, die Öffentlichkeit aber nicht.

Auch ein Antrag nach dem Informationsfreiheitsgesetz des Bundes wird abgelehnt. Auf eine von vielen E-Mails antwortet das Bundesverwaltungsamt der ZEIT: “Bitte betrachten Sie unsere Ablehnung nicht als unhöfliches Vorgehen. Wir sehen leider keine Möglichkeiten, Ihrem aus öffentlichen Interesse erwachsendem Anliegen geeignet zu entsprechen.” Lediglich zwei Zahlen darf man erfahren: 5,5 Millionen legale Schusswaffen gibt es in Deutschland, sie sind verteilt auf 1,45 Millionen Besitzer. Wer wo wie viele hat, bleibt geheim.

27 Tote durch registrierte Waffen

Wir wenden uns an die nächste Ebene, an die 16 Bundesländer und fragen, ob diese uns Zahlen zu Schusswaffen zur Verfügung stellen können. Typisch für den deutschen Föderalismus: Es gibt einzelne Länder, wie Bayern, das Saarland und Mecklenburg-Vorpommern, die die Daten sofort rüberschicken; andere dagegen, wie Niedersachsen, Baden-Württemberg und Hessen, sehen sich dazu nicht in der Lage. Bei diesen Bundesländern müssen wir noch eine Ebene tiefer gehen und die Landratsämter und Rathäuser einzeln anmailen und abtelefonieren – ziemlich nervig und angesichts eines Nationalen Waffenregisters auch irgendwie absurd.

Nach zwei Monaten haben wir endlich alle Daten zusammen. ZEIT ONLINE hat daraus diese Waffenlandkarte erstellt, auf der zum ersten Mal detailliert die regionale Verteilung legaler Pistolen, Revolver und Gewehre in Deutschland sichtbar wird. Wie viele illegale Waffen es wo gibt, weiß naturgemäß niemand.


Zusätzlich haben wir auf dieser Karte noch Todesfälle durch registrierte Schusswaffen im Jahr 2013 eingezeichnet. Wir haben dafür alle in den Medien bekannt gewordenen Fälle aufgegriffen und im Zweifelsfall bei den Staatsanwaltschaften nachgefragt, ob die Waffe legal war oder nicht.

Eine exakte Wissenschaft ist das nicht. Denn die Behörden haben hier überhaupt keine Statistik parat. Weder das Statistische Bundesamt noch das Bundeskriminalamt erfassen, ob bei tödlichen Schüssen eine legale oder eine illegale Waffe verwendet wurde.

Es ist erstaunlich, auf welch dünner Grundlage in diesem Land öffentliche Debatten geführt werden.

Unser Ergebnis: Mindestens 27 Menschen starben im Jahr 2013 durch registrierte Schusswaffen – Selbstmorde ausgenommen. In 27 weiteren Fällen war die Waffe entweder illegal oder ihre Herkunft ist bisher ungeklärt. Die Hälfte der Schusswaffentoten im vergangenen Jahr war also Opfer legaler Pistolen, Revolver oder Gewehre.

Kategorien: Datenjournalismus

Freedom of the Press Foundation bietet Code für anonymen Briefkasten

Von 16. Oktober 2013 um 16:09 Uhr

Nicht zuletzt Edward Snowden zeigt, wie wichtig sogenannte Whistleblower für eine aufgeklärte Gesellschaft sind. Manche Rechtsbrüche kommen nur ans Licht, wenn ein Insider sie publik macht. Da das – wie ebenfalls Snowden und vor allem Chelsea Manning belegen – gefährlich ist, braucht es anonyme Wege, um Sauereien öffentlich zu machen.

Die amerikanische Freedom of the Press Foundation hat nun ein Werkzeug veröffentlicht, um anonyme Datenspenden möglichst sicher zu machen. Entwickelt hat es der vor einiger Zeit verstorbene Hacker Aaron Swartz.

Swartz war ein begabter Programmierer und ein Aktivist der amerikanischen Netzszene, er hat unter anderem das Format RSS mitentwickelt und war bei Creative Commons beteiligt.

Eine seiner letzten Arbeiten war eben eine anonyme Postbox. Für das Magazin New Yorker entwickelte er das System namens Strongbox – unter der Bedingung, dass dessen Code open source sein solle, also allen zur Verfügung stehen. (Hier der Briefkasten des New Yorker)

Den Open-Source-Gedanken hat die Freedom of the Press Foundation nun vollständig umgesetzt. Sie hat das System geprüft und weiterentwickelt und bietet es unter dem Namen SecureDrop kostenlos jedem Medium auf der Welt an, zusammen mit Unterstützung beim Installieren und Hilfe beim Betrieb. Den Code getestet haben unter anderem der Sicherheitanalyst Bruce Schneier und der Entwickler von TOR, Jacob Applebaum.

New Yorker und Freedom of the Press Foundation sind nicht die Ersten, die erkannt haben, wie wichtig anonyme Kommunikationswege zu Lesern und Informanten sind. In Deutschland haben verschiedene Medien solche Briefkästen zum Teil bereits seit Jahren.

ZEIT ONLINE bietet einen an, der ebenfalls open source ist. Der Code kann von jedem kostenlos heruntergeladen und auf seiner Website installiert werden. Genau wie das System von Swartz steht auch der Code des ZEIT-ONLINE-Briefkastens beim Portal Github.

Kategorien: Datenjournalismus

Wie unsere Leser-Karte zu den Kitagebühren entstand

Von 19. September 2013 um 15:49 Uhr

Jedes Kind unter drei Jahren hat in Deutschland einen Rechtsanspruch auf einen Kitaplatz. So schreibt es das Kinderförderungsgesetz seit August dieses Jahres vor. So einfach es klingt, ist es jedoch nicht. Denn das Gesetz regelt nicht, wie die Kommunen diesen Anspruch umsetzen. Es gibt beispielsweise keine bundesweit einheitliche Gebührenordnung, auch die Betreuungszeiten können die Kommunen eigenständig festlegen.

Wir wollten deshalb wissen, was Eltern in Deutschland für die Kinderbetreuung ausgeben. Wo sind die Gebühren besonders hoch, wo sind sie besonders niedrig? Wie stark wird das Einkommen der Eltern berücksichtigt? Aber kein Experte, kein Institut wagt sich an diese Frage. Wir haben uns deshalb entschieden, Eltern selbst zu befragen.

Wir haben in der ZEIT und bei ZEIT ONLINE dazu aufgerufen, ein entsprechendes Formular auszufüllen. Wir wollten Folgendes wissen: die Postleitzahl der Gemeinde, die Anzahl der Kinder in der Familie, für welches Kind welche Kitagebühr gezahlt wird, das Alter des betroffenen Kindes und wie hoch die Kitagebühren in der Gemeinde maximal sind.

Die Daten liefen in ein Spreadsheet bei Google, welches hier eingesehen werden kann. Das Ergebnis ist beeindruckend: Trotz der komplexen Abfrage meldeten sich mehr als 2.400 Eltern bei uns. Sie haben uns über das Onlineformular nicht nur mitgeteilt, was sie für die Kinderbetreuung ausgeben, sondern auch wichtige Hinweise für unsere Recherche gegeben. Sie erzählten uns von drastischen Gebührenerhöhungen, frechen Stadträten und zu wenigen Betreuern.

Wir sind den Hinweisen der Leser nachgegangen und haben Gebühren in armen und reichen Kommunen verglichen, mit Jugendämtern telefoniert und mit Bildungsexperten diskutiert. Viele Angaben aus dem Datensatz haben wir nachrecherchiert. Durch die Analyse der Daten ist aufgefallen, dass die Eltern im Osten weniger zahlen müssen als im Westen. Wir wollten von den Kommunen wissen: Wie setzen sich die Gebühren zusammen? Was ist der Grund für den Unterschied? Es zeigte sich, dass die Kitagruppen im Osten sehr viel größer sind. Damit spart man Personal.

Auch ist klar geworden: Es scheint eine Rolle zu spielen, wie stark eine Kommune verschuldet ist. Ein Vergleich zwischen den Leserdaten und einer Liste der besonders stark verschuldeten und der schuldenfreien Städte zeigte das deutlich.

Am Ende entstand eine Deutschlandkarte, die zeigt, was die Leser von ZEIT und ZEIT ONLINE für die Betreuung ihrer Kinder unter drei Jahren pro Monat zahlen müssen. Je nach Bundesland unterscheiden sich die Gebühren um mehrere Hundert Euro.

Die Karte erhebt keinen Anspruch auf Vollständigkeit, sie ist weder repräsentativ, noch genügt sie wissenschaftlichen Standards. Aber sie spiegelt die Lebenswirklichkeit unserer Leser wider. Zusätzlich zur Deutschlandkarte gibt es eine ausführliche Analyse und weitere Grafiken, die zeigen, wie stark sich die Gebühren von reichen und armen Kommunen unterscheiden.

Wir wollen weitere solcher Datenprojekte starten. Welche Recherche könnten wir mithilfe unserer Leser als Nächstes angehen? Bei welchem Thema würden Sie uns wieder so engagiert unterstützen? Ihre Vorschläge können Sie gerne in den Kommentaren hinterlassen. Oder sie schreiben uns eine E-Mail an online-wirtschaft@zeit.de.

Kategorien: Datenjournalismus

155.965 Datensätze für eine Abgeordnetenbilanz

Von 25. Juli 2013 um 11:15 Uhr

bundestag-4-540x304Im Deutschen Bundestag ist es ruhig geworden: Die Sitzungstage sind vorbei, nur noch ein paar Ausschüsse werkeln vor sich hin. Die meisten Abgeordneten sind in der Sommerpause oder bereits im Wahlkampf. In gut sechs Wochen, am 22. September, wird der nächste Bundestag gewählt.

Was bleibt von dieser 17. Legislaturperiode? Wie hart haben die Fraktionen gearbeitet? Wie aktiv oder untätig waren die einzelnen Abgeordneten? Hat sich das Engagement der Oppositionspolitiker von denen der Spitzenpolitiker unterschieden, was machen die unterschiedlichen Spitzenpolitiker, und was eigentlich die Hinterbänkler?

Diese Fragen haben uns – Sascha Venohr als Head of Data Journalism, die Entwicklungsredakteure Martina Schories und Paul Blickle und die Politikredakteurin Lisa Caspari – beschäftigt. Auf der Grundlage Zehntausender Daten wollen wir eine Art finden, mit der sich die komplizierte und komplexe parlamentarische Arbeit von Parlamentariern verständlich und anschaulich darstellen lässt.

Die Aktivitäten der Abgeordneten sind öffentlich: Sie werden auf der Website des Deutschen Bundestags bis ins Detail protokolliert. Die Datenquelle heißt Dokumentations- und Informationssystem – kurz DIP. Jeder, der will, kann hier jede Information zu den 620 Abgeordneten erhalten. Theoretisch jedenfalls. In der Praxis ist es nicht nur schwierig, sich auf der Seite zurechtzufinden, sondern auch einen Überblick oder gar Vergleichsmöglichkeiten zu bekommen.

Um die Daten grafisch aufzuarbeiten, haben Martina Schories und Sascha Venohr die Dokumentation des DIP gescrapt. Scrapen bedeutet, dass ein kleines Programm so tut, als wäre es ein Benutzer, der verschiedene Suchanfragen an eine Website stellt und dabei die gewünschten Ergebnisse gesammelt abspeichert. Es wurden alle im DIP dokumentierten Aktivitäten von Abgeordneten zwischen dem 27. September 2009 und dem 28. Juni 2013 abgefragt, von der ersten bis zur letzten offiziellen Sitzungswoche. Wertvolle Ratschläge, das DIP zu verstehen, bekamen wir dabei vom Team von OffenesParlament, das schon länger Daten aus dem Dokumentationssystem des Bundestages auswertet und veröffentlicht.

Die Datenmasse, die ZEIT ONLINE durch die zahlreichen Anfragen an das DIP heruntergeladen hat, war riesig; das Laden der Daten dauerte manchmal mehr als eine Nacht. Insgesamt wurden 155.965 Aktivitäten ausgelesen, jede ist einem Parlamentarier zuweisbar. Zunächst arbeiteten wir mit CSV-Dateien, die zum Schluss für jede Aktivität eine Zeile enthielten. Danach wurden die Daten bereinigt, was an einigen Stellen anspruchsvoll war: Einige Abgeordnete hatten in dieser Legislaturperiode geheiratet und waren deswegen unter zwei verschiedenen Namen zu finden; herausgefiltert werden mussten außerdem Bundesratsmitglieder, die im Plenum tätig geworden waren.

Auch nach dem letzten Sitzungstag trug die Bundesverwaltung noch Daten zur Legislaturperiode nach. Erst am 19. Juli 2013 war die Dokumentation vollständig. Die Größe des Datensatzes sprengt jedes Google-Doc, daher können wir nur eine abgespeckte Version veröffentlichen. Sie ist hier einzusehen. Generell gilt: Die Daten spiegeln ausschließlich die Arbeit der Abgeordneten im Plenum des Bundestages wider. Die Arbeit in den Ausschüssen verzeichnet das DIP hingegen leider nicht.

Politikredakteurin Lisa Caspari hat schließlich die Daten aufgearbeitet und inhaltlich gewichtet. Zum besseren Verständnis bildete sie fünf Oberkategorien für die insgesamt 24 vom DIP erfassten Sorten von Aktivitäten. Die Kategorien heißen Rede, Wortbeitrag, Gruppeninitiative, Frage an die Bundesregierung und Antwort der Bundesregierung.

Rede
Eine im Plenum vorgetragene oder aus Zeitgründen zu Protokoll gegebene Rede eines Abgeordneten wurde als Rede kategorisiert.
Wortbeiträge

Ein Beitrag eines Abgeordneten im Plenum, der keine ausformulierte Rede ist, wird als Wortbeitrag definiert. Dazu gehört ein Antrag zur Geschäftsordnung, eine Zwischenfrage bei einer Rede, eine Zusatzfrage in einer Fragestunde an die Bundesregierung, eine Kurzintervention im Parlament, eine Erwiderung auf die Antwort eines Abgeordneten sowie die Persönliche Erklärung gemäß §32GOBT, die Mündliche Erklärung zur Abstimmung (§31GOBT) und die Schriftliche Erklärung zur Abstimmung (§31 GOBT), in denen Abgeordnete ihre abweichende Meinung zum Thema kundtun. Sowie die mündliche Erklärung gemäß §91 GOBT, die (Mündliche) Erklärung zur Aussprache gemäß §30 GOBT und die Erklärung zum Plenarprotokoll.

Gruppeninitiativen
Ein Gesetzentwurf mehrerer Abgeordneter oder einer Fraktion sowie ein Antrag, Entschließungs- oder Änderungsantrag werden als Gruppeninitiative definiert. Damit eine dieser Vorlagen angenommen wird, muss sie mindestens von fünf Prozent aller Abgeordneten unterschrieben sein. Für seine Fraktion berichtet zumeist ein Abgeordneter im Bundestag aus dem Ausschuss. Auch das wurde als Gruppeninitiative kategorisiert, weil der Abgeordnete stellvertretend für seine Fraktionskollegen spricht.

Frage
Die Opposition kann schriftliche Fragen an die Bundesregierung stellen, die diese zu beantworten hat. Es wird unterschieden zwischen kleinen Anfragen zu Sachthemen und großen Anfragen zu zentralen politischen Debatten. Zudem kann jeder Abgeordnete pro Sitzungswoche bis zu zwei Fragen an die Bundesregierung einreichen, die in den Fragestunden jeden Mittwoch an den Sitzungstagen beantwortet werden.
Antwort
In der Fragestunde gibt ein Mitglied der Bundesregierung, meist die Parlamentarischen Staatssekretäre, einen mündlichen Bericht zum Thema der Kabinettssitzung ab und beantwortet die Fragen der Abgeordneten. Diese Tätigkeit ist in den Plenarprotokollen als “Berichterstattung und Beantwortung” und “Antwort” dokumentiert. Im Oktober 2009 kamen noch 28 Antworten von ehemaligen SPD-Staatssekretären und Ministern der großen Koalition.

Mithilfe der Oberkategorien erstellte Infografiker Paul Blickle ein visuelles Konzept zur Aufarbeitung des Datenwusts. Jeder Tätigkeitskategorie wurde eine Farbe zugeordnet und für jeden Abgeordneten eine farbliche Übersicht angefertigt. Sichtbar ist nun ein Kalender mit gefärbten Kästchen für jeden Monat der 17. Legislaturperiode.

So lässt sich auf einen Blick erkennen, in welcher der fünf Kategorien der Abgeordnete seine Arbeitsschwerpunkte setzte. Je intensiver der individuelle Farbwert erscheint, desto aktiver war der Abgeordnete in diesem Monat; Beiträge in verschiedenen Kategorien führen zu Mischfarben. Die fünf Kategorien, die wir für die Einordnung der Arbeit im Bundestag verwenden, finden sich auch als Sortierkriterium wieder. Beispiel: Durch einen Klick auf die Kategorie “Reden” werden die Politiker mit den meisten Reden am Anfang der Liste angezeigt. Durch den Klick auf eine Partei kann der aktivste Redner aus deren Fraktion herausgefiltert werden.

Die zentralen inhaltlichen Ergebnisse unserer Daten-Aufarbeitung hat Lisa Caspari in ihrem Artikel “Die große Abgeordneten-Bilanz” zusammengefasst. Verwiesen sei auch auf den Artikel “Sichtbare und unsichtbare Promis”, der sich mit den Aktivitätsunterschieden zwischen Peer Steinbrück und Angela Merkel befasst. In den kommenden Tagen folgen Interviews mit Spitzenreitern in den verschiedenen Kategorien.

Trotz all der schönen Spitzenwerte und Ranglisten – absolute Aussagen über das politische Engagement der Politiker kann unsere Aktivitätsbilanz nur bedingt treffen. Viele Politiker, die im Parlament im Vergleich zu anderen nicht allzu aktiv waren, hatten dafür gute Gründe: Manche haben ein hohes Parteiamt inne, andere konnten gesundheitsbedingt weniger leisten, als sie wollten. Eine schwächere Farbe oder ein längerer weißer Zeitraum im Kalender eines bestimmten Abgeordneten bedeutet also nicht automatisch, dass er faul war.

Technisch bietet unsere Grafik die Möglichkeit, einzelne Politiker “auszuschneiden”, um sie in andere Websites einzufügen. Den Embed-Code können Sie der Grafik entnehmen. Die Adresszeile im Browser ändert sich, wenn mit der Grafik interagiert wird, wenn also Filter eingestellt werden.  Zum Beispiel gelangen Sie mit diesem Link zur Liste aller Angehörigen der Linkspartei im Bundestag. Die Liste zeigt zudem ein Ranking nach der Anzahl der Fragen an die Bundesregierung – gefiltert lediglich für Linke-Abgeordnete. Wolfgang Nešković — der einzige Politiker im Bundestag, der keiner Fraktion angehört — ist nur über diesen Link zu erreichen. Die Navigation beinhaltet keinen Weg zu ihm.

In der Infografik ist zudem jede der 155.965 Aktivitäten eines Abgeordneten verlinkt – auf die jeweiligen Protokolle in der Bundestagsdokumentation. Schauen Sie sich einmal um!

Bockige Behörden – eine Geschichte auf drei Ebenen

Von 18. April 2013 um 10:10 Uhr

Seit sieben Jahren gilt das Informationsfreiheitsgesetz (IFG), das jedem Bürger das Recht gibt, Akten von Behörden zu sehen und zu erfahren, was die Verwaltung so treibt. Doch noch immer tun sich Ämter schwer damit, Informationen und Daten herauszugeben, sie mauern und tricksen.

ZEIT ONLINE und ZEIT erzählen die Geschichte dieser Blockade auf verschiedenen Wegen. Mit einem Text in der Zeitung und einer längeren Fassung Online und mit einem Interview mit dem Bundesbeauftragten für Informationsfreiheit Peter Schaar. Die Daten, die die Grundlage der Geschichte sind, haben wir außerdem in einer interaktiven Grafik aufbereitet.

Martina Schories hat seitenweise Exceltabellen analysiert und zusammen mit Paul Blickle eine Grafik entworfen, dank der man sich schnell einen Überblick darüber verschaffen kann, welches Ministerium besonders hohe Gebühren verlangt, oder welches viele Anfragen ablehnt. Basis sind Informationen des Bundesinnenministeriums, die auf der dortigen Website jährlich veröffentlicht werden (Hier zum Beispiel aus dem Jahr 2012). Sämtliche von uns verwendeten Daten haben wir hier in einem Google Spreadsheet gesammelt.

Die Programmierung der Grafik übernahmen Stefan Wehrmeyer und Michael Hörz. Beide betreuen die Seite “Frag den Staat”, über die jeder IFG-Anfragen stellen und an Behörden schicken kann. Mit der Materie sind sie also mehr als vertraut.

Neben Text und Grafik gibt es noch eine dritte Ebene. Über unseren anonymen Briefkasten hatte uns ein Leser oder eine Leserin interne Protokolle des Innenministeriums zukommen lassen.

Im BMI trifft sich mindestens zwei Mal im Jahr eine Arbeitsgruppe, um zu beraten, wie mit dem IFG, mit einzelnen Anfragen und mit Gerichtsurteilen zu dem Thema umgegangen werden soll. Die Sitzungen werden stichpunktartig festgehalten. Das PDF-Dokument (das Innenministerium hat uns die Echtheit bestätigt), ist 142 Seiten lang und enthält die Protokolle der Treffen von Januar 2006 bis April 2012. In den Protokollen finden sich viele Andeutungen und Hinweise darauf, wie schwer sich die Ämter mit dem Gesetz und den Informationsforderungen der Bürger tun.

Damit jeder unsere Erkenntnisse nachvollziehen kann, veröffentlichen wir die Protokolle hier im Original. Geschwärzt wurden aufgrund des Persönlichkeitsschutzes lediglich die Namen. Dafür haben wir die Recherche-Plattform DocumentCloud gewählt, auf der Redaktionen namhafter amerikanischer Medien Originaldokumente zur Verfügung stellen. Inzwischen sind dort Millionen Dokumente versammelt. Jedes wird von einer Texterfassungssoftware gescannt. So kann jeder PDFs wie die IFG-Protokolle nach Schlagworten durchsuchen und Kommentare hinzufügen.

ZEIT ONLINE und die Investigativ-Redaktion der ZEIT sind die ersten beiden offiziellen Partner der Plattform in Deutschland. Und die IFG-Protokolle sind das erste Projekt; künftig werden es mehr werden. Schon bald will die Vereinigung Investigative Reporters and Editors (IRE), die DocumentCloud betreibt, eine deutschsprachige Version anbieten. Noch versteht die Texterkennung keine deutschen Umlaute, aber das soll sich ändern.

Fragen und Anregungen gern an einen der drei Autoren: Kai Biermann, Martin Kotynek und Sascha Venohr, der als Head of Data Journalism die drei Ebenen koordiniert hat.

Kategorien: Datenjournalismus

Wo wird in Deutschland rechtsextrem gewählt?

Von 16. November 2012 um 10:17 Uhr

In den ostdeutschen Bundesländern breiten sich rechtsextreme Ansichten laut einer aktuellen Studie der Friedrich Ebert Stiftung massiv aus. Das war die zusammenfassende Lesart in der Berichterstattung über diese Studie. Aber wie schaut es bundesweit mit Wählerstimmen für rechtsextreme Parteien aus? Ist es wirklich in erster Linie ein Phänomen in Ostdeutschland? Eigentlich zunächst nur als Fingerübung in einem internen ZEIT ONLINE Workshop zum Thema Kartenvisualisierungen gedacht, sind wir dieser Frage nachgegangen. Aus Gründen der Vergleichbarkeit boten sich Daten der Bundestagswahl 2009 an. Gregor Aisch steuerte für den Testlauf einen Datensatz bei, der die Ergebnisse auf Wahlkreisebene auch für die kleinen Parteien enthält (im Wahlatlas des Bundeswahlleiters werden diese leider nicht aufgeführt). Im nächsten Schritt wurden daraus die Zweitstimmenanteile der rechtsextremen Parteien NPD, DVU und REP auf einer Karte visualisiert. Je nach Höhe des Stimmenanteils zeigen die Farbintensitäten der Wahlkreise sehr deutlich, wo diese Parteien bereits 2009 die meisten Wählerstimmen sammeln konnten. Die traurigen Höchstwerte erreichen übrigens die ostdeutschen Wahlkreise Sächsische Schweiz – Osterzgebirge und Görlitz mit jeweils 5,9 Prozent.

Realisiert wurde diese Karte mit karthograph.js, eine von Gregor Aisch entwickelte JavaScript Bibliothek. Sie ermöglicht es, interaktive Karten unabhängig von Google-Maps oder anderen – meist mit Details überladenen – Kartenlösungen zu realisieren. Basierend auf den beiden JavaScript-Frameworks jQuery und Raphaël werden SVG-Files (vektorbasierende Grafiken) eingelesen und gerendert. Die Lösung läuft komplett Client-basiert, jedoch werden die Karten initial von einem Python-Script generiert (im vorliegenden Beispiel ist das Shapefile der Wahlkreise des Bundeswahlleiters die Kartengrundlage). Anschließend lassen sich die Karten direkt in die eigene Seite einbauen und mit CSS stylen. Im Workshop mit Gregor Aisch haben wir uns in der ZEIT ONLINE Entwicklungsredaktion vom Potential des noch jungem Tools überzeugt und werden es gerade im Hinblick auf datenjournalistische Projekte einsetzen.

Nate Silver zeigt die Macht der Algorithmen

Von 8. November 2012 um 17:40 Uhr

Der politische Taschenrechner, das Blog von Nate Silver

Wenn Nate Silver fragt “Willst du mit mir wetten?”, sollte man nicht lange überlegen. Die einzig logische Antwort kann nur “Nein! Auf keinen Fall!” lauten. Der Statistik-Guru, dessen Blog FiveThirtyEight die New York Times vor zwei Jahren eingekauft hat, kennt seine Chancen – zumindest, wenn genügend Daten vorliegen.

Wie bei den US-Präsidentschaftswahlen: Silver lag schon 2008 mit seinen Prognosen sehr nah an den Ergebnissen. Diesmal waren sie so genau, dass kein Zweifel mehr an seinen Methoden bleibt. War er in der Woche zuvor noch als Magier belächelt oder sogar verspottet worden, wird er nun als solcher gefeiert. Silver tingelt durch Talkshows, sein im September erschienenes Buch schnellt in den Bestenlisten nach oben. Für jemanden, der so viel Zeit mit Zahlen verbringt, dessen Weg mit der Analyse von Baseball-Statistiken begann, steht er verdammt weit vorn im Rampenlicht.

Kritik hatte er sich vor allem von konservativer Seite eingefangen: Silver sah Obama seit Langem als Favoriten der Wahl, also musste ja irgendetwas nicht stimmen. Provoziert hatte er die Angriffe noch durch eine 1.000-Dollar-Wette mit Fernsehmoderator Joe Scarborough auf eine Wiederwahl des Präsidenten; das Geld des Verlierers sollte Hurrikan-Opfern zugute kommen. Nach einem Rüffel aus der Times-Chefetage spendete er schließlich ohne Wette 2.538 Dollar an das Rote Kreuz. Am Ende aber musste selbst einer seiner größten Kritiker, der Blogger Dean Chambers, zugeben: “Nate Silver hatte recht, und ich lag falsch.”

Dabei ist Silvers Methode alles andere als ein magisches Orakel, sondern mit harter Wissenschaft unterfüttert. Wie genau das Team von FiveThirtyEight mit den Daten umgeht, bleibt zwar selbstverständlich ein Geheimnis. Wäre die Formel hinter den Vorhersagen bekannt, könnte ja jeder zum selben Ergebnis kommen. Doch hinter den Algorithmen steckt eine Reihe von Überlegungen, die völlig nachvollziehbar sind.

Bauchgefühl gegen Statistik

Einen wichtigen Teil der Datenbasis etwa machen die unzähligen Wahlumfragen aus, die regelmäßig zu erstaunlich unterschiedlichen Ergebnissen geführt haben. Man kennt das Spiel: Wer eine bestimmte Botschaft stützen will – etwa “Der Trend spricht für Mitt Romney/Barack Obama” –, der sucht sich aus diesem Angebot eben das Passende aus.

Ein Weg, die Ausschläge nach oben oder unten einzudämmen, ist schlicht, einen Durchschnitt zu bilden. Doch Silver und sein Team gehen noch einige Schritte weiter. Ihr Modell gewichtet zunächst die einzelnen Umfragen unterschiedlich, beziehungsweise versucht, deren ideologisch oder strukturell begründete Abweichungen von einem repräsentativen Ideal herauszurechnen – gemessen vor allem an deren bisheriger Treffsicherheit. Neuere Umfragen erhalten zudem größeres Gewicht. Darüber hinaus zieht Silver noch andere verfügbare Daten für seine Analysen heran, die er zu den Umfragen in Beziehung setzt: etwa das Spendenaufkommen für die einzelnen Kandidaten, demographische Aspekte, Parteistatistiken und langfristige Trends.

Das alles fließt ein in ein komplexes Modell, dessen Ergebnisse ein willkommenes Gegengewicht zu all den politischen Experten bietet, die mit ihren vage fundierten Einschätzungen auf allen Fernsehkanälen so viel Sendezeit füllen, aber offenbar doch nur nach Bauchgefühl argumentieren. Wieder und wieder beteten die Insider das Mantra vom völlig offenen Kopf-an-Kopf-Rennen herunter, in dem der eine oder andere Kandidat aber einen entscheidenden Vorteil haben sollte. Silvers Wahrscheinlichkeiten sprachen hingegen deutlich für Obama. Sein Erfolg zeigt vor allem eines: Wahlen sind weniger überraschend als die meisten glauben – und als Journalisten es sich erhoffen.

Silver ist nur der Anfang

Silver lässt die Zahlen für sich sprechen, zieht seine Schlüsse streng nach analytischen Kriterien. Im Grunde müsste das alles todlangweilig sein. Natürlich steckt hinter dem rasanten Aufstieg des Statistik-Nerds auch das große Talent, sich medial gut zu verkaufen. Er ist lange nicht der einzige in diesem Feld, der das vorhandene Datenmaterial für präzise Vorhersagen nutzbar macht. Aber Drew Linzer, Sam Wang oder Josh Putnam genießen bei Weitem nicht diese Aufmerksamkeit.

In den Tagen vor der Wahl lasen bis zu 20 Prozent der Besucher auf der New York Times-Website auch Silvers Blog, teilweise mehr als 70 Prozent waren es unter denen, die das Politik-Ressort aufsuchten. Den kaum quantifizierbaren Kult um seine Person mal außen vor gelassen, lässt sich erahnen, dass es ein signifikantes Bedürfnis gibt, sich ohne ideologischen Spin mit den nüchternen Fakten auseinanderzusetzen – auch wenn starke Meinungen manchmal unterhaltsamer sein mögen.

Silver ist nur der Anfang. Die Datenmenge wächst, die Algorithmen werden besser und besser werden. Bei der nächsten Wahl in den USA werden die Medien nicht an dieser Entwicklung vorbeikommen: Jeder Sender, jedes Blatt wird einen Statistiker seines Formats haben wollen. Wollen wir wetten?

Fliegende Augen für Journalisten

Von 28. September 2012 um 14:17 Uhr

Nach einem Hurrikan liegt überall Schutt, vieles ist zerstört, es herrscht vor allem Verwirrung. Ein Journalist, der durch eine solche Gegend irrt, hat kaum eine Chance, sich ein Bild von der Lage zu machen und wird sich schwer tun, die Orte und Menschen zu identifizieren, die ihm bei der Recherche helfen. Er muss sich auf sein Glück verlassen.

In einem solchen Szenario könnten Drohnen helfen. Denn der Blick aus fünfzig oder hundert Metern Höhe offenbart das umfassendere Bild, er zeigt Muster und im Zweifel auch den Weg zur nächsten Sammelstelle, an der sich Menschen finden, die etwas über die Katastrophe erzählen können.

Seit Drohnen auf dem Weg sind, eine alltägliche Technik zu werden, denken auch Journalisten darüber nach, wie diese ihnen bei der Arbeit helfen können. Das iPad-Magazin The Daily beispielsweise flog 2011 mit einem Quadrocopter den überfluteten Mississippi ab und stellte die Videos ins Netz.

Auch der amerikanische Sender ABC News testete solche Gefährte. Bislang sind das alles nur Experimente. Unsinnig aber sind sie nicht. Matt Waite baut gerade das Drone Journalism Lab an der Universität Nebraska auf, um genau solche Anwendungen zu erforschen. Er sieht noch viel mehr Szenarien, wie er im Interview mit ZEIT ONLINE erzählt.

Beispiel Fukushima: Drohnen könnten ohne Risiko für einen Piloten nicht nur Fotos und Videos liefern, sondern auch billige Sensoren rund um ein havariertes Atomkraftwerk abwerfen, sagt er, die dann Daten senden. Die mit den ferngesteuerten oder autonomen Fluggeräten gemachten Bilder könnten verwendet werden, um schnell Karten von Zerstörungen zu entwerfen und zu veröffentlichen.

Mit den Spielzeugen, die es derzeit für ein paar hundert Euro gibt und die sich mit einem iPad oder einem iPhone steuern lassen, geht das nicht. Die taugen vor allem, um die Möglichkeiten zu erahnen. The Daily zu Beispiel nutzte ein Gerät namens md4-1000 von Microdrones, das auch bei der Polizei und der Feuerwehr eingesetzt wird. Ein Spielzeug ist das nicht mehr, der Copter kann länger als anderthalb Stunden in der Luft bleiben, vorher programmierte Wegpunkte abfliegen, diverse Sensoren tragen und kostet “ab 40.000 Euro”.

Noch überwiegen beim Thema Drohnen die Befürchtungen. Vor allem die davor, dass es mit ihnen nun noch mehr Möglichkeiten gibt, unbemerkt in die Privatsphäre anderer einzudringen. Die sind sicher nicht unbegründet, allerdings gibt es längst Gesetze, die das verbieten.

Wichtiger scheint, wenn es um Sicherheit geht, ein anderer Aspekt: Die Köpfe von Unbeteiligten. Professionelle Drohnen hätten so kräftige Luftschrauben, das sie fliegenden Rasenmähern ähnelten, sagt Waite. Auch sei die Technik noch nicht ausgereift und Abstürze gar nicht so selten. Über Menschen hinweg zu fliegen, sei daher keine gute Idee.

Unter anderem deswegen beschäftigt sich auch die amerikanische Luftfahrtaufsicht FAA mit den Drohnenflügen des Magazins The Daily.