Data Blog

Offene Daten – offene Gesellschaft

Die Drohnen-Dokumente

Von 21. August 2013 um 12:25 Uhr

Wenn es um die Analyse von Informationen geht, sind PDFs nicht unbedingt das zugänglichste Format. Leider bestehen die Drohnen-Dokumente ausschließlich aus PDF-Dateien. Es sind insgesamt 372 Aktenordner mit teilweise mehr als 400 Seiten, von der ersten bis zur letzten Seite eingescannt und als PDF in einem Dateiordner gespeichert. Zusammen ist das Konvolut mehr als 80 Gigabyte groß. Es sind die gleichen Akten, die dem Untersuchungsausschuss des Bundestages zur Verfügung gestellt wurden, um den Fall Euro Hawk zu untersuchen.

Wegen der zum Teil schlechten Scans konnten wir die Akten nicht mit einer Texterkennungssoftware bearbeiten. Eine Datenanalyse ist daher kaum möglich, obwohl sie spannend wäre: Welche Behördenebenen wurden wann informiert, welche Mitarbeiter tauchten wo auf, zu welchen Zeitpunkten gab es die meisten Akten und warum? All diese Fragen hätten mit statistischen Mitteln untersucht werden können, wenn die Daten besser wären.

So aber blieb nur die Handarbeit. Zu sechst haben wir – Philip Faigle, Carsten Luther, Yassin Musharbash, Karsten Polke-Majewski, Thomas Wiegold und Kai Biermann – mehr als zwei Wochen lang gelesen. Allein einen Tag brauchten wir, um die Struktur der Ordner zu verstehen. Denn sie sind nicht chronologisch oder nach Abteilungen sortiert. Sondern nach den Beweisbeschlüssen, die der Untersuchungsausschuss des Bundestages formuliert hat. Die aber sind oft sehr allgemein gefasst, um möglichst viele Akten vom Verteidigungsministerium und seinen nachgeordneten Behörden zu bekommen. Beispielsweise lauten sie: “Es wird Beweis erhoben zum gesamten Untersuchungsauftrag durch Beiziehung sämtlicher Dokumente, Ausarbeitungen, Einschätzungen, Berichte o.ä. (…) zur Problematik SLWÜA zwischen dem 01.01.1999 und dem 18.08.2002″.

Die Ministerialbeamten wiederum haben offensichtlich alles zusammengesucht, was sie unter dem Stichwort Global Hawk / Euro Hawk in ihren Schränken finden konnten und das meistens unsortiert abgeliefert. Entsprechend durcheinander ist der Inhalt der Ordner.

Daher war eine gezielte Recherche nach einzelnen Ereignissen, Daten und Dokumenten unmöglich. Es blieb nur, Ordner für Ordner zu überfliegen und Seite um Seite zu lesen. Dabei stößt man auf so viele Details, dass man sich leicht für Tage darin verliert. Es braucht also Zeit.

Wir haben mit unseren Texten, die wir von heute an veröffentlichen, versucht, eine Balance zu finden. Sie sollen einen Eindruck vom Denken und Handeln der beteiligten Beamten geben und erklären, warum das Projekt Euro Hawk scheiterte, ja von Anfang an scheitern musste. Unsere Beobachtungen stützen wir mit vielen Zitaten aus den Akten.

Sämtliche Dokumente, aus denen wir zitieren, haben wir bei DocumentCloud hochgeladen, um sie allen Lesern zugänglich zu machen. Der Dienst erlaubt es, Anmerkungen und direkte Links zu einzelnen Sätzen zu hinterlegen. Auch enthält er eine Texterkennung, die aber aus den oben genannten Gründen nur schlecht funktioniert. Zusätzlich zu den zitierten haben wir Dokumente online gestellt, von denen wir glauben, dass sie für das Verständnis des ganzen Vorgangs wichtig sind. In DocumentCloud können sie nach Jahren sortiert werden. Das ermöglicht einen besseren Überblick.

Das Bild, das so entsteht, ist umfassend – vollständig ist es nicht. Von den Tausenden Akten haben wir nur einen kleinen Teil hochgeladen. Geschwärzt sind darin lediglich die Namen der Personen, um ihre Persönlichkeitsrechte zu schützen. Informationen haben wir nicht entfernt.

Noch eine Anmerkung: Die Mehrzahl der Dokumente trägt den Stempel “VS – Nur für den Dienstgebrauch”. Das ist die niedrigste Geheimhaltungsstufe, die deutsche Ämter vergeben. Die wirklich geheimen Informationen hingegen sind höher eingestuft und als “Geheim” gestempelt. Solche Akten waren in den Dateien nicht enthalten.

Kategorien: Datensatz

Tokio in 150 Gigapixeln

Von 8. August 2013 um 10:45 Uhr
Ausschnitt aus einem zoombaren Panoramabild von Tokio, das der Fotograf Jeffrey Martin aus 8.000 Einzelfotos zusammengebaut hat.

Ausschnitt aus einem zoombaren Panoramabild von Tokio, das der Fotograf Jeffrey Martin aus 8.000 Einzelfotos zusammengebaut hat

8.000 Fotos in zwei Tagen und vier Monate Arbeit am Computer hat der Fotograf Jeffrey Martin in ein einziges Bild gesteckt. Das Ergebnis ist ein wunderschönes und atemberaubendes Panorama von Tokio. Es bietet einen Rundumblick vom Tokio-Tower auf die Stadt, vor allem aber ist es zoombar. Wer will, kann mit einer Drehung des Mausrades an jeden Punkt des Bildes fliegen und Details in erstaunlicher Auflösung darin entdecken.

Das Bild zeigt mehr, als der menschliche Betrachter tatsächlich sehen könnte, stünde er auf dem Tokio-Tower. So zahlreich sind die Eindrücke und Blickwinkel, dass man sich problemlos in dem Bild verlieren kann.

Hier ist der Link zum Panorama.

Ausschnitt aus dem Tokio-Panorama von Jeffrey Martin

Ausschnitt aus dem Tokio-Panorama von Jeffrey Martin

Martin hat die 8.000 Einzelfotos im September 2012 mit einer Canon 7D, einer digitalen Spiegelreflexkamera, aufgenommen. Die stand auf einem speziellen, programmierbaren Stativ namens Clauss Rodeon (hier in Arbeit zu sehen). Das drehte die Kamera und machte dabei mehr als ein Bild pro Sekunde. Als Linse verwendete Martin ein Teleobjektiv mit einer Brennweite von 400 Millimetern.

Anschließend wurden die Bilder am Computer montiert. Martin schreibt in seinem Blog dazu, dass Photoshop maximal Bilder mit einer Breite von 300.000 Pixeln bearbeiten könne. Das Tokiobild aber sei 600.000 Pixel breit. Weswegen es auch gar nicht als eine Datei existiere. Er habe es in zwei Einzeldateien bearbeitet, jede davon 100 Gigabyte groß. Der Computer, den er dazu verwendete, hatte 192 Gigabyte RAM, trotzdem sei die Bearbeitung nicht wirklich reibungslos gelaufen.

Orchidee in einem der Fenster des weißen Hochhauses

Orchidee in einem der Fenster des weißen Hochhauses

Das Panorama, das im Netz zu sehen ist, besteht aus mehr als einer Million Bildkacheln, die nachgeladen werden, wenn der Nutzer darauf zoomt. Würde man das Bild in normaler Fotoqualität drucken, wäre es 50 Meter hoch und 100 Meter breit.

Martin hat verschiedene solcher Panoramen gemacht, unter anderem von London. Er nennt sein Projekt 360Cities, jeder kann dort seine Panoramabilder hochladen.

(via Gedankenstiele)

Kategorien: Datenprojekt

155.965 Datensätze für eine Abgeordnetenbilanz

Von 25. Juli 2013 um 11:15 Uhr

bundestag-4-540x304Im Deutschen Bundestag ist es ruhig geworden: Die Sitzungstage sind vorbei, nur noch ein paar Ausschüsse werkeln vor sich hin. Die meisten Abgeordneten sind in der Sommerpause oder bereits im Wahlkampf. In gut sechs Wochen, am 22. September, wird der nächste Bundestag gewählt.

Was bleibt von dieser 17. Legislaturperiode? Wie hart haben die Fraktionen gearbeitet? Wie aktiv oder untätig waren die einzelnen Abgeordneten? Hat sich das Engagement der Oppositionspolitiker von denen der Spitzenpolitiker unterschieden, was machen die unterschiedlichen Spitzenpolitiker, und was eigentlich die Hinterbänkler?

Diese Fragen haben uns – Sascha Venohr als Head of Data Journalism, die Entwicklungsredakteure Martina Schories und Paul Blickle und die Politikredakteurin Lisa Caspari – beschäftigt. Auf der Grundlage Zehntausender Daten wollen wir eine Art finden, mit der sich die komplizierte und komplexe parlamentarische Arbeit von Parlamentariern verständlich und anschaulich darstellen lässt.

Die Aktivitäten der Abgeordneten sind öffentlich: Sie werden auf der Website des Deutschen Bundestags bis ins Detail protokolliert. Die Datenquelle heißt Dokumentations- und Informationssystem – kurz DIP. Jeder, der will, kann hier jede Information zu den 620 Abgeordneten erhalten. Theoretisch jedenfalls. In der Praxis ist es nicht nur schwierig, sich auf der Seite zurechtzufinden, sondern auch einen Überblick oder gar Vergleichsmöglichkeiten zu bekommen.

Um die Daten grafisch aufzuarbeiten, haben Martina Schories und Sascha Venohr die Dokumentation des DIP gescrapt. Scrapen bedeutet, dass ein kleines Programm so tut, als wäre es ein Benutzer, der verschiedene Suchanfragen an eine Website stellt und dabei die gewünschten Ergebnisse gesammelt abspeichert. Es wurden alle im DIP dokumentierten Aktivitäten von Abgeordneten zwischen dem 27. September 2009 und dem 28. Juni 2013 abgefragt, von der ersten bis zur letzten offiziellen Sitzungswoche. Wertvolle Ratschläge, das DIP zu verstehen, bekamen wir dabei vom Team von OffenesParlament, das schon länger Daten aus dem Dokumentationssystem des Bundestages auswertet und veröffentlicht.

Die Datenmasse, die ZEIT ONLINE durch die zahlreichen Anfragen an das DIP heruntergeladen hat, war riesig; das Laden der Daten dauerte manchmal mehr als eine Nacht. Insgesamt wurden 155.965 Aktivitäten ausgelesen, jede ist einem Parlamentarier zuweisbar. Zunächst arbeiteten wir mit CSV-Dateien, die zum Schluss für jede Aktivität eine Zeile enthielten. Danach wurden die Daten bereinigt, was an einigen Stellen anspruchsvoll war: Einige Abgeordnete hatten in dieser Legislaturperiode geheiratet und waren deswegen unter zwei verschiedenen Namen zu finden; herausgefiltert werden mussten außerdem Bundesratsmitglieder, die im Plenum tätig geworden waren.

Auch nach dem letzten Sitzungstag trug die Bundesverwaltung noch Daten zur Legislaturperiode nach. Erst am 19. Juli 2013 war die Dokumentation vollständig. Die Größe des Datensatzes sprengt jedes Google-Doc, daher können wir nur eine abgespeckte Version veröffentlichen. Sie ist hier einzusehen. Generell gilt: Die Daten spiegeln ausschließlich die Arbeit der Abgeordneten im Plenum des Bundestages wider. Die Arbeit in den Ausschüssen verzeichnet das DIP hingegen leider nicht.

Politikredakteurin Lisa Caspari hat schließlich die Daten aufgearbeitet und inhaltlich gewichtet. Zum besseren Verständnis bildete sie fünf Oberkategorien für die insgesamt 24 vom DIP erfassten Sorten von Aktivitäten. Die Kategorien heißen Rede, Wortbeitrag, Gruppeninitiative, Frage an die Bundesregierung und Antwort der Bundesregierung.

Rede
Eine im Plenum vorgetragene oder aus Zeitgründen zu Protokoll gegebene Rede eines Abgeordneten wurde als Rede kategorisiert.
Wortbeiträge

Ein Beitrag eines Abgeordneten im Plenum, der keine ausformulierte Rede ist, wird als Wortbeitrag definiert. Dazu gehört ein Antrag zur Geschäftsordnung, eine Zwischenfrage bei einer Rede, eine Zusatzfrage in einer Fragestunde an die Bundesregierung, eine Kurzintervention im Parlament, eine Erwiderung auf die Antwort eines Abgeordneten sowie die Persönliche Erklärung gemäß §32GOBT, die Mündliche Erklärung zur Abstimmung (§31GOBT) und die Schriftliche Erklärung zur Abstimmung (§31 GOBT), in denen Abgeordnete ihre abweichende Meinung zum Thema kundtun. Sowie die mündliche Erklärung gemäß §91 GOBT, die (Mündliche) Erklärung zur Aussprache gemäß §30 GOBT und die Erklärung zum Plenarprotokoll.

Gruppeninitiativen
Ein Gesetzentwurf mehrerer Abgeordneter oder einer Fraktion sowie ein Antrag, Entschließungs- oder Änderungsantrag werden als Gruppeninitiative definiert. Damit eine dieser Vorlagen angenommen wird, muss sie mindestens von fünf Prozent aller Abgeordneten unterschrieben sein. Für seine Fraktion berichtet zumeist ein Abgeordneter im Bundestag aus dem Ausschuss. Auch das wurde als Gruppeninitiative kategorisiert, weil der Abgeordnete stellvertretend für seine Fraktionskollegen spricht.

Frage
Die Opposition kann schriftliche Fragen an die Bundesregierung stellen, die diese zu beantworten hat. Es wird unterschieden zwischen kleinen Anfragen zu Sachthemen und großen Anfragen zu zentralen politischen Debatten. Zudem kann jeder Abgeordnete pro Sitzungswoche bis zu zwei Fragen an die Bundesregierung einreichen, die in den Fragestunden jeden Mittwoch an den Sitzungstagen beantwortet werden.
Antwort
In der Fragestunde gibt ein Mitglied der Bundesregierung, meist die Parlamentarischen Staatssekretäre, einen mündlichen Bericht zum Thema der Kabinettssitzung ab und beantwortet die Fragen der Abgeordneten. Diese Tätigkeit ist in den Plenarprotokollen als “Berichterstattung und Beantwortung” und “Antwort” dokumentiert. Im Oktober 2009 kamen noch 28 Antworten von ehemaligen SPD-Staatssekretären und Ministern der großen Koalition.

Mithilfe der Oberkategorien erstellte Infografiker Paul Blickle ein visuelles Konzept zur Aufarbeitung des Datenwusts. Jeder Tätigkeitskategorie wurde eine Farbe zugeordnet und für jeden Abgeordneten eine farbliche Übersicht angefertigt. Sichtbar ist nun ein Kalender mit gefärbten Kästchen für jeden Monat der 17. Legislaturperiode.

So lässt sich auf einen Blick erkennen, in welcher der fünf Kategorien der Abgeordnete seine Arbeitsschwerpunkte setzte. Je intensiver der individuelle Farbwert erscheint, desto aktiver war der Abgeordnete in diesem Monat; Beiträge in verschiedenen Kategorien führen zu Mischfarben. Die fünf Kategorien, die wir für die Einordnung der Arbeit im Bundestag verwenden, finden sich auch als Sortierkriterium wieder. Beispiel: Durch einen Klick auf die Kategorie “Reden” werden die Politiker mit den meisten Reden am Anfang der Liste angezeigt. Durch den Klick auf eine Partei kann der aktivste Redner aus deren Fraktion herausgefiltert werden.

Die zentralen inhaltlichen Ergebnisse unserer Daten-Aufarbeitung hat Lisa Caspari in ihrem Artikel “Die große Abgeordneten-Bilanz” zusammengefasst. Verwiesen sei auch auf den Artikel “Sichtbare und unsichtbare Promis”, der sich mit den Aktivitätsunterschieden zwischen Peer Steinbrück und Angela Merkel befasst. In den kommenden Tagen folgen Interviews mit Spitzenreitern in den verschiedenen Kategorien.

Trotz all der schönen Spitzenwerte und Ranglisten – absolute Aussagen über das politische Engagement der Politiker kann unsere Aktivitätsbilanz nur bedingt treffen. Viele Politiker, die im Parlament im Vergleich zu anderen nicht allzu aktiv waren, hatten dafür gute Gründe: Manche haben ein hohes Parteiamt inne, andere konnten gesundheitsbedingt weniger leisten, als sie wollten. Eine schwächere Farbe oder ein längerer weißer Zeitraum im Kalender eines bestimmten Abgeordneten bedeutet also nicht automatisch, dass er faul war.

Technisch bietet unsere Grafik die Möglichkeit, einzelne Politiker “auszuschneiden”, um sie in andere Websites einzufügen. Den Embed-Code können Sie der Grafik entnehmen. Die Adresszeile im Browser ändert sich, wenn mit der Grafik interagiert wird, wenn also Filter eingestellt werden.  Zum Beispiel gelangen Sie mit diesem Link zur Liste aller Angehörigen der Linkspartei im Bundestag. Die Liste zeigt zudem ein Ranking nach der Anzahl der Fragen an die Bundesregierung – gefiltert lediglich für Linke-Abgeordnete. Wolfgang Nešković — der einzige Politiker im Bundestag, der keiner Fraktion angehört — ist nur über diesen Link zu erreichen. Die Navigation beinhaltet keinen Weg zu ihm.

In der Infografik ist zudem jede der 155.965 Aktivitäten eines Abgeordneten verlinkt – auf die jeweiligen Protokolle in der Bundestagsdokumentation. Schauen Sie sich einmal um!

Wie unsere Karte zu den Dispo-Zinsen entstand

Von 11. Juli 2013 um 09:12 Uhr

Am Anfang stand ein Thema und eine Frage: Deutsche Banken verstecken oft, wie hoch ihre Überziehungszinsen sind, selbst Verbraucherschützer wissen nicht genau, wie stark die Zinsen variieren. Warum bitten wir nicht unsere Leser, Licht in den Dispo-Dschungel zu bringen?

Die Autorinnen Marlies Uken und Nadine Oberhuber recherchierten, wie das intransparente Geschäft mit den Überziehungszinsen abläuft und stellten Anfang Juni gemeinsam mit unseren Datenjournalisten den Lesern drei Fragen: Wie hoch ist ihr persönlicher Überziehungszins? Wie lautet Ihre Bankleitzahl? Wie Ihre Postleitzahl? Die Leser konnten diese Informationen in einem Formular auf der Website hinterlassen.

Die Resonanz hat uns überrascht. Mehr als 8.000 Leser sind seither dem Aufruf gefolgt und haben ihren Dispo-Zins der Redaktion gemeldet. Das ist eine der höchsten Beteiligungen bei einem sogenannten Crowdsourcing-Projekt in Deutschland. Auf ZEIT ONLINE diskutierten Hunderte Leser über das intransparente Geschäftsgebaren der Banken. Sie erzählten von ihren persönlichen Erfahrungen, ärgerten sich über Bankberater und die Politik. Andere verteidigten hingegen die Banken und sahen die Kunden in der Verantwortung.

Anschließend begann eine wochenlange Arbeit: Die Redaktion hat die höchst und niedrigst genannten Werte nachrecherchiert – und die Institute mit den Ergebnissen konfrontiert. In vielen Fällen wurden die Daten der Leser bestätigt, in anderen Fällen mussten wir die Daten korrigieren, in vier Fällen bekamen wir keine Antwort. Offensichtliche Fehleinträge filterten wir heraus. Insgesamt überprüfte das Rechercheteam die Konditionen von rund 300 Banken. Am Ende entstand eine regionale Übersicht der höchsten Dispo-Zinsen in Deutschland – alles auf Basis der Daten unserer Leser.

abzockerbanken_580

Die Karte erhebt keinen Anspruch auf Vollständigkeit. Aber sie gibt erstmals einen guten Überblick darüber, wie die Bankkonditionen in Deutschland variieren. Ein Ergebnis: Einige Institute verlangen drei Mal so viel Dispo-Zinsen wie faire Banken. Ein anderes Ergebnis: Die ganz großen Abkassierer sind ausgerechnet die Kleinsten. Regionale Volksbanken und Sparkassen, die ihre Vormachtaufstellung auf dem Land ausnutzen.

Wollen Sie unsere Datenbank weiter befüllen? Das Formular finden Sie hier. Unsere Redakteure werden in den nächsten Tagen berichten, wie die Banken auf die Ergebnisse unseres Datenprojekts reagieren.

Bleibt die Frage: Welche Datenrecherche können wir mit unseren Lesern als nächstes angehen? Bei welchem Thema würden Sie uns wieder so engagiert unterstützen? Ihre Vorschläge können Sie gerne in den Kommentaren hinterlassen. Oder sie schreiben uns eine Mail: faigle@zeit.de.

Kategorien: Allgemein, Datenprojekt

Eric Fischers Geodatenwelten

Von 20. Juni 2013 um 12:00 Uhr
Visualisierte Geodaten von Flickr-Fotos in Berlin: blau sind Bilder von Einheimischen, rot zeigt Bilder von Touristen, gelbe Punkte können nicht zugeordnet werden. CC-BY-SA 2.0 Eric Fischer

Visualisierte Geodaten von Flickr-Fotos in Berlin: blau sind Bilder von Einheimischen, rot zeigt Bilder von Touristen, gelbe Punkte können nicht zugeordnet werden. CC-BY-SA 2.0 Eric Fischer

Handys sind Ortungswanzen. Sie zeigen dank GPS-Satelliten und Sendemast-Triangulation, wo wir uns aufhalten. Dienste wie Twitter oder Flickr speichern diese Daten. Und Menschen wie Eric Fischer machen diese Daten sichtbar und damit auch die menschlichen Wege und Vorlieben. Fischer ist Fotograf, Kartenliebhaber und seit einiger Zeit Datenvisualisierer. Und was er aus Flickr und nun auch Twitter herausholt, sieht nicht nur schön aus, es verdeutlicht auch auf einen Blick komplexes Verhalten.

“Locals and Tourists” heißt sein Projekt. Fischer analysiert, wo in Städten der Welt vor allem Einheimische und wo vor allem Touristen twittern und fotografieren.

Zur Analyse von Twitter nutzte er drei Milliarden Tweets aus der Zeit seit September 2011 und sammelte alle heraus, die einen Geo-Tag enthalten, also die Ortskoordinate, an der die Botschaft abgeschickt wurde. Anschließend filterte der diese Botschaften danach, ob sich der Absender schon länger in der Stadt aufhielt oder erst vor Kurzem dorthin gekommen war. Auch das verraten die Geodaten. So konnte er die Stadtpläne in zwei Farben darstellen: blau für Tweets von Einheimischen, rot für die von Touristen.

Das gleiche hatte Fischer zuvor bereits mit Flickr-Daten gemacht, siehe das Bild am Anfang des Textes. Beide Kartensammlungen zeigen, welche Orte einer Stadt bei welcher Gruppe beliebt sind. Hier beispielsweise in New York:

Visualisierung von Twitter-Geodaten. Wo in New York twitterten Einheimische (blau) und wo twitterten Touristen (rot). Eric Fischer/MapBox

Visualisierung von Twitter-Geodaten. Wo in New York twitterten Einheimische (blau) und wo twitterten Touristen (rot). Eric Fischer/MapBox

Noch spannender sind Fischers Projekte, die bei Twitter genutzte Sprachen und die verwendeten Smartphonetypen visualisieren.

Die Karten zu Betriebssystemen zeigen beispielsweise, dass die USA ein iPhone-Land sind, dass Spanien klar von Android dominiert wird und Indonesien von Blackberry. Solche Informationen hatten bis vor kurzer Zeit nur große Konzerne. Fischer nutzt öffentlich verfügbare Daten, um sie allen zugänglich zu machen. Die Daten sind so detailliert, dass sich in ihnen sogar die ringförmige Bauweise des Flughafenterminals von Berlin-Tegel erkennen lässt.

Flughafen Berlin-Tegel, zu sehen sind Geodaten von Tweets, geschrieben mit einem iPhone (rot) und einem Android-Gerät (grün). Eric Fischer/MapBox

Flughafen Berlin-Tegel, zu sehen sind Geodaten von Tweets, geschrieben mit einem iPhone (rot) und einem Android-Gerät (grün). Eric Fischer/MapBox

Und nicht nur das. Sie zeigen beispielsweise auch, dass iPhones vor allem in reichen Gegenden benutzt werden, Androidgeräte eher in ärmeren, wie der Atlantic in den Daten gesehen hat.

Via @msgbi

Wikipedia: Über Israel und Hitler streitet man überall

Von 28. Mai 2013 um 15:21 Uhr
Konfliktthemen in der deutschsprachigen Wikipedia, Quelle: Mark Graham, Oxford Internet Institute

Konfliktthemen in der deutschsprachigen Wikipedia, Quelle: Mark Graham, Oxford Internet Institute

Die Wikipedia ist nicht nur eine Enzyklopädie. Sie ist auch ein soziales Experiment. Da sie dank der Zusammenarbeit vieler Menschen entsteht, bietet sie tiefe Einblicke, wer sich wo und wie stark für ein Thema interessiert. Sie ist ein riesiges Testfeld dafür, wie und worüber Menschen miteinander streiten, wie sie sich einigen und wie sie sich organisieren, um zusammenarbeiten zu können.

Mehrere Wissenschaftler haben genau das untersucht. Taha Yasseri, Anselm Spoerri, Mark Graham und János Kertész beobachteten für ihre Studie sogenannte Edit-Wars, Bearbeitungskriege, bei denen streitende Nutzer die Änderungen der Gegenseite immer wieder umschreiben oder gleich komplett rückgängig machen. Sie wollten wissen, ob es regionale Besonderheiten dabei gibt und was diese Debatten über die Menschen aussagen.

Sie taten das nicht nur, um etwas über Streits bei der Wikipedia zu erfahren, sondern auch um die Streitkultur an sich zu erforschen. Dass Religion und Philosophie die am stärksten debattierten Themen sind, wird niemanden verwundern, aber die Analyse lässt sich noch viel weiter treiben. Schon vorangegangene Untersuchungen haben einen Zusammenhang zwischen der Härte von Wikipedia-Debatten und der politischen und wirtschaftlichen Stabilität eines Landes gezeigt.

Was führt zur Eskalation, welche Verfahren fördern einen Konsens, wie organisieren sich die Gegner? All das könne man anhand von Wikipedia-Daten erforschen, schreiben Yasseri, Spoerri, Graham und Kertész in ihrer Studie, die 2014 in einem Buch erscheinen soll.

Weiter…

Kategorien: Datenforschung

Wo Amerikaner hassen

Von 13. Mai 2013 um 12:23 Uhr
Hate Map - Verteilung von homophoben Tweets zwischen Juni 2012 und April 2013 in den USA

Hate Map – Verteilung von homophoben Tweets zwischen Juni 2012 und April 2013 in den USA

Islamistischer Terrorismus ist nicht der einzige, den die USA fürchten. Mindestens ebenso bedrohlich sind sogenannte Hate Groups, religiöse und rechte Gruppierungen, die sich als Patrioten betrachten und deren Ziel es ist, den amerikanischen Staat und alles, was ihnen fremd erscheint, zu bekämpfen. Ihre Zahl ist in den vergangenen zehn Jahren stark gestiegen, als Barack Obama 2009 Präsident wurde, stieg die Zahl noch einmal stärker.

Eine auf Twitter basierende Studie zeigt nun, wie sich homophobe, rassistische und beleidigende Äußerungen gegenüber Menschen mit Behinderungen in den USA verteilen. Die Daten können zumindest ein Indiz dafür sein, wo solche Organisationen aktiv sind.

Die Forschergruppe, die die Karte erstellt hat, nennt sich Floating Sheep. Es sind fünf Geographen, die an verschiedenen Universitäten in den USA und in Großbritannien arbeiten und die sich immer wieder die Verteilung diverser Phänomenen anschauen und visualisieren.

Weiter…

Die Künstlersozialkasse in Zahlen

Von 7. Mai 2013 um 08:55 Uhr

Die Künstlersozialkasse (KSK) kümmert sich in Deutschland um die Sozialversicherung von freiberuflichen Künstlern und Publizisten. Wegen ihres oft nur schwer zu durchschauenden Verwaltungsapparats ist sie nicht unumstritten. Grund genug für zwei Anfragen über Frag den Staat zur Verwaltung der KSK, insbesondere zur Mitarbeiterzahl.

Bei der in Wilhelmshaven ansässigen Behörde sind für die Verwaltung der Versicherten 45 Sachbearbeiter und 10 Bereichsleiter angestellt, wie aus der IFG-Anfrage hervorgeht. Die kümmerten sich im vergangenen Jahr um rund 177.000 Versicherte und 16.000 Neuanträge. Die Verwaltung der ganzen Künstlersozialkasse kostete 2012 9,5 Millionen Euro. Die Grafik zeigt die Mitgliederzahlen seit 2005:

Interessant ist dabei auch die Zahl der Anträge und der Anteil der “positiv beschiedenen”, also derjenigen, die in die KSK aufgenommen und somit unterstützt werden. Über die vergangenen acht Jahre stiegen und sanken beide Werte immer relativ parallel. Hatten weniger Künstler und Publizisten einen Antrag gestellt, sank auch die Zahl der Bewilligungen. Allein die letzten drei Jahre fallen etwas aus der Reihe, denn die die absolute Zahl der Bewilligungen sank langsamer als die der Anträge. Das Ergebnis ist eine höhere Aufnahmequote. Im Jahr 2012 lag sie bei 75 Prozent, 2011 und 2010 bei 70 Prozent, in allen Jahren davor dagegen bei unter 70 Prozent.

Die KSK übernimmt für Künstler und Publizisten den Arbeitgeberanteil der Beiträge zur Sozialversicherung. Dafür kommen die Auftraggeber von Künstlern (“Verwerter”) und der Bund auf. Die Auftraggeber zahlen 30 Prozent der Gesamtbeiträge, der Bund 20 Prozent. Der gesamte Bundeszuschuss betrug 2012 knapp 164 Millionen Euro, allein der der Zuschuss für die Rentenversicherung umfasste fast 91 Millionen Euro.

Die Künstlersozialkasse listet auf ihrer Website auch Zahlen auf. Deren Aufbereitung ist aber möglicherweise nicht die Kernkompetenz der Behörde. Denn es fehlen dort Verwaltungskosten von rund 9 Millionen Euro, die sich woanders aber finden: Im interaktiven Bundeshaushalt für 2012, für die Jahre bis 2006 auf offenerhaushalt.de. Diese Werte sind jedoch Planzahlen und unterscheiden sich damit von den Angaben der KSK. Aus diesem Grund stellen wir in der obigen Grafik nur die Zahlen der letzten drei Jahre dar.

Die folgende Übersicht zeigt die Zahl der Mitarbeiter, aufgeteilt in den Bereich “Versicherte” und “Verwerter”. Dabei zeigt sich, dass besonders im Bereich “Verwerter” die Zahl der Mitarbeiter in den letzten acht Jahren deutlich gewachsen ist. Die KSK kümmert sich also stärker um die Einnahmenseite. (Dropdown 2 der Grafik).

Schließlich setzen wir die Beschäftigtenzahl ins Verhältnis zur Versichertenzahl. Dabei wird klar: Weniger zu tun haben die Sachbearbeiter der KSK nicht. Denn wenn man die reine Zahl der Versicherungssachbearbeiter zugrunde legt, bewegt sich die Zahl immer zwischen 3.800 und 4.100 Versicherten pro Mitarbeiter (orange). Wenn man noch die Gruppenleiter dazu nimmt, schwankt der Wert zwischen 3.000 und 3.300 (grau). Wenn man schließlich die Gesamtzahl der Beschäftigten einrechnet, also auch derer, die sich um die Verwerter kümmern, liegt das Verhältnis recht konstant bei 2.000. Dazu ein Vergleich: Bei der Allianz, dem größten Versicherungskonzern der Welt, arbeiteten 2012 laut Geschäftsbericht 144.094 Mitarbeiter und verwalteten 78 Millionen Kunden. Das sind 541 Versicherte pro Mitarbeiter.

Fazit: Die Künstlersozialkasse gibt sich zwar Mühe, die Versichertenzahlen genau aufzuschlüsseln, doch bei Angaben zur eigenen Verwaltung hapert es noch. Eine weitere Anfrage wert wäre die Höhe der Einnahmen aus der Service-Rufnummer für die Versicherten, denn ein Anruf dort kostet 9 Cent pro Minute.

Hinweis: Dieser Beitrag erscheint auch auf dem Blog des Informationsfreiheitsportals Frag den Staat.

Wenn das billige Geld nicht wirkt

Von 2. Mai 2013 um 13:51 Uhr
© ZEIT ONLINE

© ZEIT ONLINE

Die Europäische Zentralbank hat am Donnerstag den Leitzins um ein Drittel von 0,75 auf 0,5 Prozent gesenkt, um die Länder im Süden mit günstigem Geld zu versorgen. Ihr Präsident, Mario Draghi, setzt dabei auf den sogenannten Transmissionsmechanismus: Die EZB senkt den Zins, die Geschäftsbanken können sich also günstiger refinanzieren – und reichen die besseren Konditionen in Form von niedrigeren Zinsen an ihre Bankkunden weiter.

Wie stark dieser Mechanismus jedoch zurzeit gestört ist, ist auf dem Chart zu erkennen. Er zeigt, zu welchen Zinssätzen sich kleine und mittelständische Unternehmen in Deutschland, Frankreich, Italien und Spanien bei Privatbanken Geld leihen können. Anfangs verlaufen die Kurven noch recht parallel, die Kredite sind sogar ähnlich teuer in den verschiedenen Ländern.

Doch seit Mitte 2011 driften die Südländer Italien und Spanien ab. Die Geschäftsbanken verteuern die Kredite, die Eurokrise spitzt sich zu. Und das, obwohl die EZB den Leitzins seit Mitte 2011 kontinuierlich weitersenkt. In den zentralen Euro-Ländern Frankreich und Deutschland passiert wiederum das Gegenteil: Hier sinken die Kreditkosten für Firmen.

Ob die Zinssenkung diesmal wirkt, ist schwer abzuschätzen, auch, weil es Monate dauert, bis sie am Markt ankommt. In Deutschland fürchten Ökonomen, dass die Leitzinssenkung mehr schadet als hilft: Schon jetzt gelten etwa die Immobilienmärkte in einigen Großstädten als überhitzt, weil Anleger sich so günstig wie selten zuvor Geld leihen konnten und die Sparbuch-Zinsen unattraktiv geworden sind. Zudem könnten die Banken das Geld lieber selbst nutzen, um ihre Eigenkapitaldecke zu stärken – übrigens ein von der Politik durchaus gewünschter Effekt. Auch die Geldwertstabilität, der eigentliche Auftrag der EZB, scheint zurzeit nicht in Gefahr.

Ob das günstige Geld tatsächlich bei den Verbrauchern und Unternehmen in den Südländern ankommt, ist völlig unklar. Die EZB selbst hat in der Vergangenheit immer wieder klar gemacht, dass der Übertragungseffekt gestört sei. Ihre Politik stößt also an ihre Grenzen. Den Geschäftsbanken kann sie kaum vorschreiben, gegen deren Willen und Risikoeinschätzung Kredite zu vergeben.

Kategorien: Allgemein

Bockige Behörden – eine Geschichte auf drei Ebenen

Von 18. April 2013 um 10:10 Uhr

Seit sieben Jahren gilt das Informationsfreiheitsgesetz (IFG), das jedem Bürger das Recht gibt, Akten von Behörden zu sehen und zu erfahren, was die Verwaltung so treibt. Doch noch immer tun sich Ämter schwer damit, Informationen und Daten herauszugeben, sie mauern und tricksen.

ZEIT ONLINE und ZEIT erzählen die Geschichte dieser Blockade auf verschiedenen Wegen. Mit einem Text in der Zeitung und einer längeren Fassung Online und mit einem Interview mit dem Bundesbeauftragten für Informationsfreiheit Peter Schaar. Die Daten, die die Grundlage der Geschichte sind, haben wir außerdem in einer interaktiven Grafik aufbereitet.

Martina Schories hat seitenweise Exceltabellen analysiert und zusammen mit Paul Blickle eine Grafik entworfen, dank der man sich schnell einen Überblick darüber verschaffen kann, welches Ministerium besonders hohe Gebühren verlangt, oder welches viele Anfragen ablehnt. Basis sind Informationen des Bundesinnenministeriums, die auf der dortigen Website jährlich veröffentlicht werden (Hier zum Beispiel aus dem Jahr 2012). Sämtliche von uns verwendeten Daten haben wir hier in einem Google Spreadsheet gesammelt.

Die Programmierung der Grafik übernahmen Stefan Wehrmeyer und Michael Hörz. Beide betreuen die Seite “Frag den Staat”, über die jeder IFG-Anfragen stellen und an Behörden schicken kann. Mit der Materie sind sie also mehr als vertraut.

Neben Text und Grafik gibt es noch eine dritte Ebene. Über unseren anonymen Briefkasten hatte uns ein Leser oder eine Leserin interne Protokolle des Innenministeriums zukommen lassen.

Im BMI trifft sich mindestens zwei Mal im Jahr eine Arbeitsgruppe, um zu beraten, wie mit dem IFG, mit einzelnen Anfragen und mit Gerichtsurteilen zu dem Thema umgegangen werden soll. Die Sitzungen werden stichpunktartig festgehalten. Das PDF-Dokument (das Innenministerium hat uns die Echtheit bestätigt), ist 142 Seiten lang und enthält die Protokolle der Treffen von Januar 2006 bis April 2012. In den Protokollen finden sich viele Andeutungen und Hinweise darauf, wie schwer sich die Ämter mit dem Gesetz und den Informationsforderungen der Bürger tun.

Damit jeder unsere Erkenntnisse nachvollziehen kann, veröffentlichen wir die Protokolle hier im Original. Geschwärzt wurden aufgrund des Persönlichkeitsschutzes lediglich die Namen. Dafür haben wir die Recherche-Plattform DocumentCloud gewählt, auf der Redaktionen namhafter amerikanischer Medien Originaldokumente zur Verfügung stellen. Inzwischen sind dort Millionen Dokumente versammelt. Jedes wird von einer Texterfassungssoftware gescannt. So kann jeder PDFs wie die IFG-Protokolle nach Schlagworten durchsuchen und Kommentare hinzufügen.

ZEIT ONLINE und die Investigativ-Redaktion der ZEIT sind die ersten beiden offiziellen Partner der Plattform in Deutschland. Und die IFG-Protokolle sind das erste Projekt; künftig werden es mehr werden. Schon bald will die Vereinigung Investigative Reporters and Editors (IRE), die DocumentCloud betreibt, eine deutschsprachige Version anbieten. Noch versteht die Texterkennung keine deutschen Umlaute, aber das soll sich ändern.

Fragen und Anregungen gern an einen der drei Autoren: Kai Biermann, Martin Kotynek und Sascha Venohr, der als Head of Data Journalism die drei Ebenen koordiniert hat.

Kategorien: Datenjournalismus