Data Blog

20. November 2013 um 11:37 Uhr

Eine Karte zeigt, wer gerade mit Bitcoins zockt

Wie reizvoll kann es sein, in etwas zu investieren, dessen Wert an jedem Tag um mindestens 30 Prozent schwankt? Etwas, das eine traumhafte Rendite ebenso wahrscheinlich macht wie einen furchtbaren Verlust? Offenbar extrem reizvoll. Der Handel mit der virtuellen Währung Bitcoin ist rege, allen Unvorhersehbarkeiten zum Trotz. Wie rege, zeigt die Karte auf fiatleak.com von Andrew Hodel.

Auf ihr wird der globale Handel mit Bitcoins in Echtzeit dargestellt, basierend auf den Daten von sieben Handelsbörsen: Wie viele US-Dollar, Euro, Jen oder Renminbi werden gerade in Bitcoin getauscht?

Bitcoins sind zwar anonym, aber jede einzelne von ihnen trägt einen eindeutigen Code, der Handel damit kann so jederzeit nachverfolgt werden. Handelsbörsen wie Mt.Gox und BTC-E bieten eine API an, über die sich das Handelsvolumen auslesen lässt. Darüber holt sich Hodel die Daten für seine Echtzeit-Karte.

Die verdeutlicht, wo am meisten mit Bitcoin spekuliert wird: in China und in den USA. Insbesondere die Chinesen würden mittlerweile wie wild in Bitcoin investieren, hat Hodel beobachtet.

Das Wall Street Journal schreibt, der Grund dafür sei die Möglichkeit, damit die Devisensperre zu umgehen. Über dem Umweg der Bitcoins könnten Chinesen ihre Renminbi in Dollar tauschen. Der Staat dulde das derzeit als eine Art Experiment, zitiert die Zeitung einen Wirtschaftsinformatiker.

Der Code für die Karte ist open source und bei GitHub einsehbar. Sie zeigt übrigens auch den jeweils aktuellen Wert von Bitcoin in den verschiedenen Währungen an. Nicht sichtbar ist das bisherige Allzeithoch von rund 900 US-Dollar pro Bitcoin, das am vergangenen Dienstag erreicht wurde. Der Spuk war allerdings auch schnell wieder vorbei – 30 Minuten später lag der Wert wieder bei unter 650 Dollar. Den Handel hat das offenbar nicht gebremst. Wer heute fiatleaks.com aufruft, kann beobachten, wie weltweit rund 10.000 Bitcoins in weniger als zwei Stunden gekauft werden.

8. November 2013 um 10:22 Uhr

Die Kolonialmächte des Internets

Zahl der Internetnutzer weltweit. Die Ländergrößen werden proportional dazu dargestellt. Die Farben zeigen die "Durchdringung" der Netznutzung pro Land, also wie viel Prozent der Bewohner im Internet sind. — Zahl der Internetnutzer weltweit. Die Ländergrößen werden proportional dazu dargestellt. Die Farben zeigen die „Durchdringung“ der Netznutzung pro Land, also wie viel Prozent der Bewohner im Internet sind.

Die Welt des Internets ist zweigeteilt. Es gibt die Sphäre der Nutzer und die Sphäre der Domaininhaber, also jener, die das Netz mit Inhalten füllen. Das Verhältnis der beiden ist ungleich verteilt, wie Karten zeigen, die das Oxford Internet Institute (OII) veröffentlicht hat.

Die Mehrheit der Domains im Netz ist in Nordamerika und in Europa registriert – fast ein Drittel aller Websites weltweit gehört Menschen und Organisationen in den USA, schreiben Mark Graham und Stefano De Sabbata vom OII.

Die Mehrheit der Internetnutzer hingegen lebt in China, das Land stellt die größte Internetpopulation der Welt. Gleichzeitig sind dort nur wenige Domains zu Hause.

Die Wissenschaftler nutzen als Vergleich den Wert User pro Domain, der sich ergibt, wenn man die Zahl der Nutzer eines Landes mit der Zahl der Domains dort ins Verhältnis setzt.

Weltweite Verteilung der Zahl registrierter Domains pro Land

Weltweit errechneten sie den Durchschnitt von zehn Nutzern pro Domain. In den USA liegt dieser Wert bei drei. In China hingegen sind es pro Domain 40 Nutzer. Dort seien weniger Websites registriert als beispielsweise in Großbritannien.

Dieses Missverhältnis zeigt sich überall: Die Inhalte werden von Amerikanern und Europäern dominiert, der Rest der Welt schaut zu. Italien und Vietnam zum Beispiel haben nahezu die gleiche Zahl an „Netzbewohnern“, aber in Italien sind sieben Mal so viele Websites registriert wie in Vietnam.

Das beobachteten sie sogar in Japan. Dort leben zwei Mal so viele Netznutzer wie in Großbritannien, es sind dort aber nur ein Drittel so viele Websites registriert wie im Königreich.

Insgesamt sind 78 Prozent aller Domainnamen in Nordamerika oder Europa beheimatet. Asien kommt noch auf 13 Prozent der Domains, in Lateinamerika, Ozeanien und Afrika sind es jeweils weniger als fünf Prozent. Und so gibt es in Afrika mehr als 50 Nutzer pro Domain – viele Konsumenten, kaum Produzenten also.

Insgesamt leben inzwischen 42 Prozent aller Netznutzer in Asien. Und dort ist auch noch viel Wachstum möglich, da gleichzeitig die Durchdringung in Ländern wie Indien und China gering ist, also nur vergleichsweise wenige Bewohner des Landes auch im Netz sind.

Es gebe, schreiben Graham und De Sabbata, eine starke Korrelation zwischen dem Pro-Kopf-Bruttoeinkommen eines Landes (Gross National Income per capita) und der Zahl der Domains. Das Netz hat die Möglichkeit, Inhalte zu verbreiten, stark vereinfacht. Geld kostet das aber noch immer. Und so ergibt sich im Verhältnis von Produzenten und Konsumenten eine fast koloniale Struktur.

Zur Berechnung verwendeten die Wissenschaftler Zahlen aus dem Jahr 2013, die von Matthew Zook von der University of Kentucky zur Verfügung gestellt wurden.

Um das Ergebnis nicht zu verfälschen, wurden Domains von Ländern wie Tuvalu, Armenien oder Tokelau nicht berücksichtigt. Sie gehören zu denen, die weltweit gern registriert werden, weil ihre Domainendung so beliebt ist, oder weil die Registrierung nichts kostet. Domains mit .tv, .am oder .fm werden beispielsweise gern von Medienunternehmen aus aller Welt gebucht, .re von Réunion ist beliebt bei Immobilienmaklern, da es die englische Abkürzung für real estate ist.

16. Oktober 2013 um 16:09 Uhr

Freedom of the Press Foundation bietet Code für anonymen Briefkasten

Nicht zuletzt Edward Snowden zeigt, wie wichtig sogenannte Whistleblower für eine aufgeklärte Gesellschaft sind. Manche Rechtsbrüche kommen nur ans Licht, wenn ein Insider sie publik macht. Da das – wie ebenfalls Snowden und vor allem Chelsea Manning belegen – gefährlich ist, braucht es anonyme Wege, um Sauereien öffentlich zu machen.

Die amerikanische Freedom of the Press Foundation hat nun ein Werkzeug veröffentlicht, um anonyme Datenspenden möglichst sicher zu machen. Entwickelt hat es der vor einiger Zeit verstorbene Hacker Aaron Swartz.

Swartz war ein begabter Programmierer und ein Aktivist der amerikanischen Netzszene, er hat unter anderem das Format RSS mitentwickelt und war bei Creative Commons beteiligt.

Eine seiner letzten Arbeiten war eben eine anonyme Postbox. Für das Magazin New Yorker entwickelte er das System namens Strongbox – unter der Bedingung, dass dessen Code open source sein solle, also allen zur Verfügung stehen. (Hier der Briefkasten des New Yorker)

Den Open-Source-Gedanken hat die Freedom of the Press Foundation nun vollständig umgesetzt. Sie hat das System geprüft und weiterentwickelt und bietet es unter dem Namen SecureDrop kostenlos jedem Medium auf der Welt an, zusammen mit Unterstützung beim Installieren und Hilfe beim Betrieb. Den Code getestet haben unter anderem der Sicherheitanalyst Bruce Schneier und der Entwickler von TOR, Jacob Applebaum.

New Yorker und Freedom of the Press Foundation sind nicht die Ersten, die erkannt haben, wie wichtig anonyme Kommunikationswege zu Lesern und Informanten sind. In Deutschland haben verschiedene Medien solche Briefkästen zum Teil bereits seit Jahren.

ZEIT ONLINE bietet einen an, der ebenfalls open source ist. Der Code kann von jedem kostenlos heruntergeladen und auf seiner Website installiert werden. Genau wie das System von Swartz steht auch der Code des ZEIT-ONLINE-Briefkastens beim Portal Github.

19. September 2013 um 15:49 Uhr

Wie unsere Leser-Karte zu den Kitagebühren entstand

Jedes Kind unter drei Jahren hat in Deutschland einen Rechtsanspruch auf einen Kitaplatz. So schreibt es das Kinderförderungsgesetz seit August dieses Jahres vor. So einfach es klingt, ist es jedoch nicht. Denn das Gesetz regelt nicht, wie die Kommunen diesen Anspruch umsetzen. Es gibt beispielsweise keine bundesweit einheitliche Gebührenordnung, auch die Betreuungszeiten können die Kommunen eigenständig festlegen.

Wir wollten deshalb wissen, was Eltern in Deutschland für die Kinderbetreuung ausgeben. Wo sind die Gebühren besonders hoch, wo sind sie besonders niedrig? Wie stark wird das Einkommen der Eltern berücksichtigt? Aber kein Experte, kein Institut wagt sich an diese Frage. Wir haben uns deshalb entschieden, Eltern selbst zu befragen.

Wir haben in der ZEIT und bei ZEIT ONLINE dazu aufgerufen, ein entsprechendes Formular auszufüllen. Wir wollten Folgendes wissen: die Postleitzahl der Gemeinde, die Anzahl der Kinder in der Familie, für welches Kind welche Kitagebühr gezahlt wird, das Alter des betroffenen Kindes und wie hoch die Kitagebühren in der Gemeinde maximal sind.

Die Daten liefen in ein Spreadsheet bei Google, welches hier eingesehen werden kann. Das Ergebnis ist beeindruckend: Trotz der komplexen Abfrage meldeten sich mehr als 2.400 Eltern bei uns. Sie haben uns über das Onlineformular nicht nur mitgeteilt, was sie für die Kinderbetreuung ausgeben, sondern auch wichtige Hinweise für unsere Recherche gegeben. Sie erzählten uns von drastischen Gebührenerhöhungen, frechen Stadträten und zu wenigen Betreuern.

Wir sind den Hinweisen der Leser nachgegangen und haben Gebühren in armen und reichen Kommunen verglichen, mit Jugendämtern telefoniert und mit Bildungsexperten diskutiert. Viele Angaben aus dem Datensatz haben wir nachrecherchiert. Durch die Analyse der Daten ist aufgefallen, dass die Eltern im Osten weniger zahlen müssen als im Westen. Wir wollten von den Kommunen wissen: Wie setzen sich die Gebühren zusammen? Was ist der Grund für den Unterschied? Es zeigte sich, dass die Kitagruppen im Osten sehr viel größer sind. Damit spart man Personal.

Auch ist klar geworden: Es scheint eine Rolle zu spielen, wie stark eine Kommune verschuldet ist. Ein Vergleich zwischen den Leserdaten und einer Liste der besonders stark verschuldeten und der schuldenfreien Städte zeigte das deutlich.

Am Ende entstand eine Deutschlandkarte, die zeigt, was die Leser von ZEIT und ZEIT ONLINE für die Betreuung ihrer Kinder unter drei Jahren pro Monat zahlen müssen. Je nach Bundesland unterscheiden sich die Gebühren um mehrere Hundert Euro.

Die Karte erhebt keinen Anspruch auf Vollständigkeit, sie ist weder repräsentativ, noch genügt sie wissenschaftlichen Standards. Aber sie spiegelt die Lebenswirklichkeit unserer Leser wider. Zusätzlich zur Deutschlandkarte gibt es eine ausführliche Analyse und weitere Grafiken, die zeigen, wie stark sich die Gebühren von reichen und armen Kommunen unterscheiden.

Wir wollen weitere solcher Datenprojekte starten. Welche Recherche könnten wir mithilfe unserer Leser als Nächstes angehen? Bei welchem Thema würden Sie uns wieder so engagiert unterstützen? Ihre Vorschläge können Sie gerne in den Kommentaren hinterlassen. Oder sie schreiben uns eine E-Mail an online-wirtschaft@zeit.de.

13. September 2013 um 14:35 Uhr

Ein bunter Punkt für jeden Amerikaner

Verteilung ethnischer Gruppen in den USA: blau - Weiße, grün - Schwarze, rot - Asiaten, orange - Hispanics. Quelle: Dustin A. Cable http://demographics.coopercenter.org/DotMap/index.html — Verteilung ethnischer Gruppen in den USA: blau – Weiße, grün – Schwarze, rot – Asiaten, orange – Hispanics. Quelle: Dustin A. Cable http://demographics.coopercenter.org/DotMap/index.html

Die Frage der segregation, der Trennung der ethnischen Gruppen, treibt die USA noch immer um: Bleiben die mehr als 300 Millionen Menschen verschiedener Herkunft unter sich oder leben sie das amerikanische Ideal der bunt gemischten salad bowl?

Dustin Cable von der University of Virginia hat sich dieser Frage mit Daten genähert und die Racial Dot Map erstellt: Für jeden Bürger gibt es einen Punkt, oft kleiner als ein Pixel. Dieser Punkt wurde dann je nach ethnischer Herkunft entsprechend eingefärbt.

Auf den ersten Blick ist Cables Karte vor allem bunt. Wer hineinzoomt, kann jedoch bis auf den Straßenblock genau sehen, wo Weiße, Afro-Amerikaner, Asiaten oder Hispanics leben.

So ergibt sich ein selten anschauliches Bild: Während zum Beispiel in San Francisco vor allem Mischtöne zu sehen sind, besteht Chicago vielerorts aus verschiedenen, jedoch nahezu einfarbigen Kacheln.

In den großen, dünn besiedelten Gebieten außerhalb der Städte sieht man vornehmlich blauen Dunst – blau steht für Weiße. Mittendrin gibt es dann Städte wir Portland, die zwar vornehmlich blau sind, aber vergleichsweise gut integriert erscheinen.

Als Inspiration diente Cable ein Projekt von Brandon Martin-Anderson vom MIT Media Lab, der eine Karte mit einem schwarzen Punkt für jeden Bürger der USA, Kanadas und Mexikos erstellt hatte. Cable ergänzte dann die Farben für die ethnische Herkunft mit Daten aus dem amerikanischen Zensus 2010. Hier gibt es mehr zur Methodik.

Karte der Einwohner von Detroit und ihrer ethnischen Herkunft: blaue - Weiße, grün - Schwarze. Quelle: Dustin A. Cable http://www.wired.com/design/2013/08/how-segregated-is-your-city-this-eye-opening-map-shows-you/#slideid-210361 — Karte der Einwohner von Detroit und ihrer ethnischen Herkunft: blau – Weiße, grün – Schwarze. Quelle: Dustin A. Cable http://www.wired.com/design/2013/08/how-segregated-is-your-city-this-eye-opening-map-shows-you/#slideid-210361

Außerdem korrigierte er das Kartenmaterial in manchen Städten, sodass keine Menschen mehr in Straßen oder Parks angezeigt werden. Erst dadurch werden Phänomene wie das in Detroit sichtbar: Dort trennt die 8 Mile Road exakt die Teile der Stadt, in denen Afro-Amerikaner und Weiße leben.

9. September 2013 um 12:17 Uhr

Twitter-Monitor

Bei Twitter und anderen sozialen Plattformen machen zwar sehr viele Nutzer mit, aber keiner hat den Überblick darüber, was sie in ihrer Gesamtheit sagen. Wir haben für den Zeitraum vor der Wahl ein Tool entwickelt, das die Twitter-Aktivität zu politischen Themen darstellt. In einer Kooperation mit dem Forschungsprojekt tab4 am Zentrum für digitale Kulturen der Universität Lüneburg und dem Berliner Unternehmen tame wollen wir mit dem TwitterMonitor der Öffentlichkeit den Blick auf sich selbst zurückgeben.

Von der knappen Million deutscher Nutzer äußern sich ungefähr ein Zehntel regelmäßig zu Politik. Der TwitterMonitor beobachtet davon die wichtigsten. Die Rangliste der top Zehntausend berücksichtigt neben der Anzahl der Follower wie oft ein Nutzer erwähnt wird und wie viel sie oder er tweetet. Welche Themen als politisch relevant gelten, ergibt sich aufgrund der Themen-Nachbarschaft zu vorgegebenen Stichworten. Das dynamische Berechnungsverfahren sorgt dafür, dass Hashtags wie #NSA oder #veggieday automatisch aufgegriffen werden. In zwei Ansichten zeigt der Monitor eine kurz- und eine langfristige Auswahl von Themen, die wichtigsten die letzten 48 Stunden und die wichtigsten seit Anfang August. Zu jedem Thema werden die Tweets dargestellt, die am häufigsten weitergeleitet wurden. Im Detail schlüsseln die Ansichten auf, welche Nutzergruppen sich an der Diskussion am aktivsten beteiligt haben – Journalisten, Interessenverbände, Nutzer oder Politiker, letztere auch nach Parteizugehörigkeit geordnet. So lässt sich rekonstruieren, wo Debatten ihren Ursprung nehmen, wen welche Themen am meisten beschäftigen und wie sie von einer Nutzergruppe eingebracht und von anderen aufgenommen werden.

An der Entwicklung des twitterMonitor sind Leonard Novy (Institut für Medien- und Kommunikationspolitik / CDC Universität Lüneburg), Stefan Heidenreich (CDC Universität Lüneburg) sowie Arno Dirlam und Frederik Fischer (beide tame) und der Designer Mark Wirblich beteiligt.
twit_mon_logos

21. August 2013 um 12:25 Uhr

Die Drohnen-Dokumente

Wenn es um die Analyse von Informationen geht, sind PDFs nicht unbedingt das zugänglichste Format. Leider bestehen die Drohnen-Dokumente ausschließlich aus PDF-Dateien. Es sind insgesamt 372 Aktenordner mit teilweise mehr als 400 Seiten, von der ersten bis zur letzten Seite eingescannt und als PDF in einem Dateiordner gespeichert. Zusammen ist das Konvolut mehr als 80 Gigabyte groß. Es sind die gleichen Akten, die dem Untersuchungsausschuss des Bundestages zur Verfügung gestellt wurden, um den Fall Euro Hawk zu untersuchen.

Wegen der zum Teil schlechten Scans konnten wir die Akten nicht mit einer Texterkennungssoftware bearbeiten. Eine Datenanalyse ist daher kaum möglich, obwohl sie spannend wäre: Welche Behördenebenen wurden wann informiert, welche Mitarbeiter tauchten wo auf, zu welchen Zeitpunkten gab es die meisten Akten und warum? All diese Fragen hätten mit statistischen Mitteln untersucht werden können, wenn die Daten besser wären.

So aber blieb nur die Handarbeit. Zu sechst haben wir – Philip Faigle, Carsten Luther, Yassin Musharbash, Karsten Polke-Majewski, Thomas Wiegold und Kai Biermann – mehr als zwei Wochen lang gelesen. Allein einen Tag brauchten wir, um die Struktur der Ordner zu verstehen. Denn sie sind nicht chronologisch oder nach Abteilungen sortiert. Sondern nach den Beweisbeschlüssen, die der Untersuchungsausschuss des Bundestages formuliert hat. Die aber sind oft sehr allgemein gefasst, um möglichst viele Akten vom Verteidigungsministerium und seinen nachgeordneten Behörden zu bekommen. Beispielsweise lauten sie: „Es wird Beweis erhoben zum gesamten Untersuchungsauftrag durch Beiziehung sämtlicher Dokumente, Ausarbeitungen, Einschätzungen, Berichte o.ä. (…) zur Problematik SLWÜA zwischen dem 01.01.1999 und dem 18.08.2002“.

Die Ministerialbeamten wiederum haben offensichtlich alles zusammengesucht, was sie unter dem Stichwort Global Hawk / Euro Hawk in ihren Schränken finden konnten und das meistens unsortiert abgeliefert. Entsprechend durcheinander ist der Inhalt der Ordner.

Daher war eine gezielte Recherche nach einzelnen Ereignissen, Daten und Dokumenten unmöglich. Es blieb nur, Ordner für Ordner zu überfliegen und Seite um Seite zu lesen. Dabei stößt man auf so viele Details, dass man sich leicht für Tage darin verliert. Es braucht also Zeit.

Wir haben mit unseren Texten, die wir von heute an veröffentlichen, versucht, eine Balance zu finden. Sie sollen einen Eindruck vom Denken und Handeln der beteiligten Beamten geben und erklären, warum das Projekt Euro Hawk scheiterte, ja von Anfang an scheitern musste. Unsere Beobachtungen stützen wir mit vielen Zitaten aus den Akten.

Sämtliche Dokumente, aus denen wir zitieren, haben wir bei DocumentCloud hochgeladen, um sie allen Lesern zugänglich zu machen. Der Dienst erlaubt es, Anmerkungen und direkte Links zu einzelnen Sätzen zu hinterlegen. Auch enthält er eine Texterkennung, die aber aus den oben genannten Gründen nur schlecht funktioniert. Zusätzlich zu den zitierten haben wir Dokumente online gestellt, von denen wir glauben, dass sie für das Verständnis des ganzen Vorgangs wichtig sind. In DocumentCloud können sie nach Jahren sortiert werden. Das ermöglicht einen besseren Überblick.

Das Bild, das so entsteht, ist umfassend – vollständig ist es nicht. Von den Tausenden Akten haben wir nur einen kleinen Teil hochgeladen. Geschwärzt sind darin lediglich die Namen der Personen, um ihre Persönlichkeitsrechte zu schützen. Informationen haben wir nicht entfernt.

Noch eine Anmerkung: Die Mehrzahl der Dokumente trägt den Stempel “VS – Nur für den Dienstgebrauch”. Das ist die niedrigste Geheimhaltungsstufe, die deutsche Ämter vergeben. Die wirklich geheimen Informationen hingegen sind höher eingestuft und als “Geheim” gestempelt. Solche Akten waren in den Dateien nicht enthalten.

8. August 2013 um 10:45 Uhr

Tokio in 150 Gigapixeln

Ausschnitt aus einem zoombaren Panoramabild von Tokio, das der Fotograf Jeffrey Martin aus 8.000 Einzelfotos zusammengebaut hat. — Ausschnitt aus einem zoombaren Panoramabild von Tokio, das der Fotograf Jeffrey Martin aus 8.000 Einzelfotos zusammengebaut hat

8.000 Fotos in zwei Tagen und vier Monate Arbeit am Computer hat der Fotograf Jeffrey Martin in ein einziges Bild gesteckt. Das Ergebnis ist ein wunderschönes und atemberaubendes Panorama von Tokio. Es bietet einen Rundumblick vom Tokio-Tower auf die Stadt, vor allem aber ist es zoombar. Wer will, kann mit einer Drehung des Mausrades an jeden Punkt des Bildes fliegen und Details in erstaunlicher Auflösung darin entdecken.

Das Bild zeigt mehr, als der menschliche Betrachter tatsächlich sehen könnte, stünde er auf dem Tokio-Tower. So zahlreich sind die Eindrücke und Blickwinkel, dass man sich problemlos in dem Bild verlieren kann.

Hier ist der Link zum Panorama.

Ausschnitt aus dem Tokio-Panorama von Jeffrey Martin

Martin hat die 8.000 Einzelfotos im September 2012 mit einer Canon 7D, einer digitalen Spiegelreflexkamera, aufgenommen. Die stand auf einem speziellen, programmierbaren Stativ namens Clauss Rodeon (hier in Arbeit zu sehen). Das drehte die Kamera und machte dabei mehr als ein Bild pro Sekunde. Als Linse verwendete Martin ein Teleobjektiv mit einer Brennweite von 400 Millimetern.

Anschließend wurden die Bilder am Computer montiert. Martin schreibt in seinem Blog dazu, dass Photoshop maximal Bilder mit einer Breite von 300.000 Pixeln bearbeiten könne. Das Tokiobild aber sei 600.000 Pixel breit. Weswegen es auch gar nicht als eine Datei existiere. Er habe es in zwei Einzeldateien bearbeitet, jede davon 100 Gigabyte groß. Der Computer, den er dazu verwendete, hatte 192 Gigabyte RAM, trotzdem sei die Bearbeitung nicht wirklich reibungslos gelaufen.

Orchidee in einem der Fenster des weißen Hochhauses

Das Panorama, das im Netz zu sehen ist, besteht aus mehr als einer Million Bildkacheln, die nachgeladen werden, wenn der Nutzer darauf zoomt. Würde man das Bild in normaler Fotoqualität drucken, wäre es 50 Meter hoch und 100 Meter breit.

Martin hat verschiedene solcher Panoramen gemacht, unter anderem von London. Er nennt sein Projekt 360Cities, jeder kann dort seine Panoramabilder hochladen.

(via Gedankenstiele)

25. Juli 2013 um 11:15 Uhr

155.965 Datensätze für eine Abgeordnetenbilanz

Im Deutschen Bundestag ist es ruhig geworden: Die Sitzungstage sind vorbei, nur noch ein paar Ausschüsse werkeln vor sich hin. Die meisten Abgeordneten sind in der Sommerpause oder bereits im Wahlkampf. In gut sechs Wochen, am 22. September, wird der nächste Bundestag gewählt.

Was bleibt von dieser 17. Legislaturperiode? Wie hart haben die Fraktionen gearbeitet? Wie aktiv oder untätig waren die einzelnen Abgeordneten? Hat sich das Engagement der Oppositionspolitiker von denen der Spitzenpolitiker unterschieden, was machen die unterschiedlichen Spitzenpolitiker, und was eigentlich die Hinterbänkler?

Diese Fragen haben uns – Sascha Venohr als Head of Data Journalism, die Entwicklungsredakteure Martina Schories und Paul Blickle und die Politikredakteurin Lisa Caspari – beschäftigt. Auf der Grundlage Zehntausender Daten wollen wir eine Art finden, mit der sich die komplizierte und komplexe parlamentarische Arbeit von Parlamentariern verständlich und anschaulich darstellen lässt.

Die Aktivitäten der Abgeordneten sind öffentlich: Sie werden auf der Website des Deutschen Bundestags bis ins Detail protokolliert. Die Datenquelle heißt Dokumentations- und Informationssystem – kurz DIP. Jeder, der will, kann hier jede Information zu den 620 Abgeordneten erhalten. Theoretisch jedenfalls. In der Praxis ist es nicht nur schwierig, sich auf der Seite zurechtzufinden, sondern auch einen Überblick oder gar Vergleichsmöglichkeiten zu bekommen.

Um die Daten grafisch aufzuarbeiten, haben Martina Schories und Sascha Venohr die Dokumentation des DIP gescrapt. Scrapen bedeutet, dass ein kleines Programm so tut, als wäre es ein Benutzer, der verschiedene Suchanfragen an eine Website stellt und dabei die gewünschten Ergebnisse gesammelt abspeichert. Es wurden alle im DIP dokumentierten Aktivitäten von Abgeordneten zwischen dem 27. September 2009 und dem 28. Juni 2013 abgefragt, von der ersten bis zur letzten offiziellen Sitzungswoche. Wertvolle Ratschläge, das DIP zu verstehen, bekamen wir dabei vom Team von OffenesParlament, das schon länger Daten aus dem Dokumentationssystem des Bundestages auswertet und veröffentlicht.

Die Datenmasse, die ZEIT ONLINE durch die zahlreichen Anfragen an das DIP heruntergeladen hat, war riesig; das Laden der Daten dauerte manchmal mehr als eine Nacht. Insgesamt wurden 155.965 Aktivitäten ausgelesen, jede ist einem Parlamentarier zuweisbar. Zunächst arbeiteten wir mit CSV-Dateien, die zum Schluss für jede Aktivität eine Zeile enthielten. Danach wurden die Daten bereinigt, was an einigen Stellen anspruchsvoll war: Einige Abgeordnete hatten in dieser Legislaturperiode geheiratet und waren deswegen unter zwei verschiedenen Namen zu finden; herausgefiltert werden mussten außerdem Bundesratsmitglieder, die im Plenum tätig geworden waren.

Auch nach dem letzten Sitzungstag trug die Bundesverwaltung noch Daten zur Legislaturperiode nach. Erst am 19. Juli 2013 war die Dokumentation vollständig. Die Größe des Datensatzes sprengt jedes Google-Doc, daher können wir nur eine abgespeckte Version veröffentlichen. Sie ist hier einzusehen. Generell gilt: Die Daten spiegeln ausschließlich die Arbeit der Abgeordneten im Plenum des Bundestages wider. Die Arbeit in den Ausschüssen verzeichnet das DIP hingegen leider nicht.

Politikredakteurin Lisa Caspari hat schließlich die Daten aufgearbeitet und inhaltlich gewichtet. Zum besseren Verständnis bildete sie fünf Oberkategorien für die insgesamt 24 vom DIP erfassten Sorten von Aktivitäten. Die Kategorien heißen Rede, Wortbeitrag, Gruppeninitiative, Frage an die Bundesregierung und Antwort der Bundesregierung.

Rede

Eine im Plenum vorgetragene oder aus Zeitgründen zu Protokoll gegebene Rede eines Abgeordneten wurde als Rede kategorisiert.

Wortbeiträge

Ein Beitrag eines Abgeordneten im Plenum, der keine ausformulierte Rede ist, wird als Wortbeitrag definiert. Dazu gehört ein Antrag zur Geschäftsordnung, eine Zwischenfrage bei einer Rede, eine Zusatzfrage in einer Fragestunde an die Bundesregierung, eine Kurzintervention im Parlament, eine Erwiderung auf die Antwort eines Abgeordneten sowie die Persönliche Erklärung gemäß §32GOBT, die Mündliche Erklärung zur Abstimmung (§31GOBT) und die Schriftliche Erklärung zur Abstimmung (§31 GOBT), in denen Abgeordnete ihre abweichende Meinung zum Thema kundtun. Sowie die mündliche Erklärung gemäß §91 GOBT, die (Mündliche) Erklärung zur Aussprache gemäß §30 GOBT und die Erklärung zum Plenarprotokoll.

Gruppeninitiativen

Ein Gesetzentwurf mehrerer Abgeordneter oder einer Fraktion sowie ein Antrag, Entschließungs- oder Änderungsantrag werden als Gruppeninitiative definiert. Damit eine dieser Vorlagen angenommen wird, muss sie mindestens von fünf Prozent aller Abgeordneten unterschrieben sein. Für seine Fraktion berichtet zumeist ein Abgeordneter im Bundestag aus dem Ausschuss. Auch das wurde als Gruppeninitiative kategorisiert, weil der Abgeordnete stellvertretend für seine Fraktionskollegen spricht.

Frage

Die Opposition kann schriftliche Fragen an die Bundesregierung stellen, die diese zu beantworten hat. Es wird unterschieden zwischen kleinen Anfragen zu Sachthemen und großen Anfragen zu zentralen politischen Debatten. Zudem kann jeder Abgeordnete pro Sitzungswoche bis zu zwei Fragen an die Bundesregierung einreichen, die in den Fragestunden jeden Mittwoch an den Sitzungstagen beantwortet werden.

Antwort

In der Fragestunde gibt ein Mitglied der Bundesregierung, meist die Parlamentarischen Staatssekretäre, einen mündlichen Bericht zum Thema der Kabinettssitzung ab und beantwortet die Fragen der Abgeordneten. Diese Tätigkeit ist in den Plenarprotokollen als „Berichterstattung und Beantwortung“ und “Antwort” dokumentiert. Im Oktober 2009 kamen noch 28 Antworten von ehemaligen SPD-Staatssekretären und Ministern der großen Koalition.

Mithilfe der Oberkategorien erstellte Infografiker Paul Blickle ein visuelles Konzept zur Aufarbeitung des Datenwusts. Jeder Tätigkeitskategorie wurde eine Farbe zugeordnet und für jeden Abgeordneten eine farbliche Übersicht angefertigt. Sichtbar ist nun ein Kalender mit gefärbten Kästchen für jeden Monat der 17. Legislaturperiode.

So lässt sich auf einen Blick erkennen, in welcher der fünf Kategorien der Abgeordnete seine Arbeitsschwerpunkte setzte. Je intensiver der individuelle Farbwert erscheint, desto aktiver war der Abgeordnete in diesem Monat; Beiträge in verschiedenen Kategorien führen zu Mischfarben. Die fünf Kategorien, die wir für die Einordnung der Arbeit im Bundestag verwenden, finden sich auch als Sortierkriterium wieder. Beispiel: Durch einen Klick auf die Kategorie “Reden” werden die Politiker mit den meisten Reden am Anfang der Liste angezeigt. Durch den Klick auf eine Partei kann der aktivste Redner aus deren Fraktion herausgefiltert werden.

Die zentralen inhaltlichen Ergebnisse unserer Daten-Aufarbeitung hat Lisa Caspari in ihrem Artikel “Die große Abgeordneten-Bilanz” zusammengefasst. Verwiesen sei auch auf den Artikel “Sichtbare und unsichtbare Promis”, der sich mit den Aktivitätsunterschieden zwischen Peer Steinbrück und Angela Merkel befasst. In den kommenden Tagen folgen Interviews mit Spitzenreitern in den verschiedenen Kategorien.

Trotz all der schönen Spitzenwerte und Ranglisten – absolute Aussagen über das politische Engagement der Politiker kann unsere Aktivitätsbilanz nur bedingt treffen. Viele Politiker, die im Parlament im Vergleich zu anderen nicht allzu aktiv waren, hatten dafür gute Gründe: Manche haben ein hohes Parteiamt inne, andere konnten gesundheitsbedingt weniger leisten, als sie wollten. Eine schwächere Farbe oder ein längerer weißer Zeitraum im Kalender eines bestimmten Abgeordneten bedeutet also nicht automatisch, dass er faul war.

Technisch bietet unsere Grafik die Möglichkeit, einzelne Politiker “auszuschneiden”, um sie in andere Websites einzufügen. Den Embed-Code können Sie der Grafik entnehmen. Die Adresszeile im Browser ändert sich, wenn mit der Grafik interagiert wird, wenn also Filter eingestellt werden. Zum Beispiel gelangen Sie mit diesem Link zur Liste aller Angehörigen der Linkspartei im Bundestag. Die Liste zeigt zudem ein Ranking nach der Anzahl der Fragen an die Bundesregierung – gefiltert lediglich für Linke-Abgeordnete. Wolfgang Nešković — der einzige Politiker im Bundestag, der keiner Fraktion angehört — ist nur über diesen Link zu erreichen. Die Navigation beinhaltet keinen Weg zu ihm.

In der Infografik ist zudem jede der 155.965 Aktivitäten eines Abgeordneten verlinkt – auf die jeweiligen Protokolle in der Bundestagsdokumentation. Schauen Sie sich einmal um!

11. Juli 2013 um 9:12 Uhr

Wie unsere Karte zu den Dispo-Zinsen entstand

Am Anfang stand ein Thema und eine Frage: Deutsche Banken verstecken oft, wie hoch ihre Überziehungszinsen sind, selbst Verbraucherschützer wissen nicht genau, wie stark die Zinsen variieren. Warum bitten wir nicht unsere Leser, Licht in den Dispo-Dschungel zu bringen?

Die Autorinnen Marlies Uken und Nadine Oberhuber recherchierten, wie das intransparente Geschäft mit den Überziehungszinsen abläuft und stellten Anfang Juni gemeinsam mit unseren Datenjournalisten den Lesern drei Fragen: Wie hoch ist ihr persönlicher Überziehungszins? Wie lautet Ihre Bankleitzahl? Wie Ihre Postleitzahl? Die Leser konnten diese Informationen in einem Formular auf der Website hinterlassen.

Die Resonanz hat uns überrascht. Mehr als 8.000 Leser sind seither dem Aufruf gefolgt und haben ihren Dispo-Zins der Redaktion gemeldet. Das ist eine der höchsten Beteiligungen bei einem sogenannten Crowdsourcing-Projekt in Deutschland. Auf ZEIT ONLINE diskutierten Hunderte Leser über das intransparente Geschäftsgebaren der Banken. Sie erzählten von ihren persönlichen Erfahrungen, ärgerten sich über Bankberater und die Politik. Andere verteidigten hingegen die Banken und sahen die Kunden in der Verantwortung.

Anschließend begann eine wochenlange Arbeit: Die Redaktion hat die höchst und niedrigst genannten Werte nachrecherchiert – und die Institute mit den Ergebnissen konfrontiert. In vielen Fällen wurden die Daten der Leser bestätigt, in anderen Fällen mussten wir die Daten korrigieren, in vier Fällen bekamen wir keine Antwort. Offensichtliche Fehleinträge filterten wir heraus. Insgesamt überprüfte das Rechercheteam die Konditionen von rund 300 Banken. Am Ende entstand eine regionale Übersicht der höchsten Dispo-Zinsen in Deutschland – alles auf Basis der Daten unserer Leser.

abzockerbanken_580

Die Karte erhebt keinen Anspruch auf Vollständigkeit. Aber sie gibt erstmals einen guten Überblick darüber, wie die Bankkonditionen in Deutschland variieren. Ein Ergebnis: Einige Institute verlangen drei Mal so viel Dispo-Zinsen wie faire Banken. Ein anderes Ergebnis: Die ganz großen Abkassierer sind ausgerechnet die Kleinsten. Regionale Volksbanken und Sparkassen, die ihre Vormachtaufstellung auf dem Land ausnutzen.

Wollen Sie unsere Datenbank weiter befüllen? Das Formular finden Sie hier. Unsere Redakteure werden in den nächsten Tagen berichten, wie die Banken auf die Ergebnisse unseres Datenprojekts reagieren.

Bleibt die Frage: Welche Datenrecherche können wir mit unseren Lesern als nächstes angehen? Bei welchem Thema würden Sie uns wieder so engagiert unterstützen? Ihre Vorschläge können Sie gerne in den Kommentaren hinterlassen. Oder sie schreiben uns eine Mail: faigle@zeit.de.