Offene Daten – offene Gesellschaft

Autoren Archiv von Kai Biermann

Was Sie beim Datenspenden beachten sollten

Von 30. Juli 2012 um 16:10 Uhr

Auf unserer Briefkasten-Seite können Sie uns anonym Informationen, Daten oder Nachrichten zukommen lassen. Interne Dokumente, geheime Verträge, vertrauliche Datenbankauszüge – wenn Sie finden, dass die Öffentlichkeit davon erfahren sollte, können Sie sie hier spenden.
 
Wir haben unser Bestes getan, um technisch sicherzustellen, dass Sie dabei nicht beobachtet werden, und dass niemand die übertragenen Daten mitlesen kann. Mehr zur Technik finden Sie hier
 
Wenn Sie sich außerdem an ein paar Regeln halten, die wir Ihnen hier erklären, ist die Chance hoch, dass Sie unerkannt bleiben. 
 
Uns gegenüber bleiben Sie dabei immer anonym, wenn Sie das wünschen. Sie müssen uns keinen Namen und keine Kontaktmöglichkeit nennen und können, wenn Sie es wollen, anonym mit uns Kontakt aufnehmen. Dazu erzeugt der Datenbriefkasten nach dem Absenden einen Quittungscode mit einem Link. Dieser führt zu einer Nachrichtenbox, die nur derjenige sehen kann, der den Link kennt. Halten Sie den Link daher geheim und speichern Sie ihn auch nicht auf Ihrem Rechner oder in Ihrem Browser.
 
In dieser Nachrichtenbox können wir Nachrichten für Sie hinterlegen. Das können Mitteilungen über Fortschritte bei der Recherche Ihrer Geschichte sein, oder auch Nachfragen zu einzelnen Punkten. Ob und wie Sie anschließend auf diese Botschaften reagieren, bleibt Ihnen überlassen.
 
Was diese Seite nicht ist:
 
Wir sind nicht WikiLeaks oder eine andere Leaks-Plattform. Das bedeutet, es gibt keine Garantie dafür, dass Informationen, die Sie uns hier spenden, auch veröffentlicht werden. 
 
Wir publizieren im Zweifel auch nicht alle Informationen oder Dokumente, die uns erreichen; entweder, um den oder die Spender zu schützen, oder weil wir finden, dass nicht alle Einzelheiten an die Öffentlichkeit gehören.
 
Wir bearbeiten die Inhalte journalistisch. Es ist also durchaus möglich, dass Ihre Datenspende der Beginn einer längeren Recherche ist und letztlich nur ein Puzzleteil in dem dann veröffentlichten Mosaik darstellt.

Zu Ihrer eigenen Sicherheit sollten Sie einige Punkte beachten: 
 
- Senden Sie keine Informationen direkt von Ihrem Firmenrechner und nehmen Sie auch von diesem aus keinen Kontakt zu uns auf. Auch Ihren privaten Rechner zu Hause sollten Sie nicht verwenden, denn anhand seiner IP-Adresse können Sie im Zweifel identifiziert werden. Auch wenn wir beim Briefkasten keine Server-Logs speichern, können Sie so das Risiko weiter verringern, dass die Datenspende auf Sie zurückgeführt werden kann. Nutzen Sie lieber Geräte, die mit Ihnen nicht in Beziehung stehen, also beispielsweise in einem Internetcafé oder einer Bibliothek.  

- Ziehen Sie Daten aus einem internen Netzwerk nicht auf Ihren eigenen Rechner. Nutzen Sie externe Speicher wie DVDs oder USB-Sticks. Wenn diese zu auffällig sind, verwenden Sie beispielsweise einen MP3-Player. Diese Geräte können jedes Dateiformat speichern, sehen aber harmloser aus als eine blanke DVD. In manchen Systemen wird das Speichern bestimmter Informationen protokolliert. Daher kann es sinnvoller sein, Daten auf Papier weiterzugeben oder nur den Bildschirm abzufotografieren.

- Viele Dateiformate enthalten sogenannte Metadaten, also Zusatzinformationen, die im Zweifel auf Sie weisen können. Unser Briefkasten löscht solche Metadaten. Doch können auch Sie solche Informationen einschränken. Beispielsweise, in dem Sie den oberen Rand eines Faxes – auf dem die Nummer des Faxgerätes steht – abschneiden oder beim Kopieren abdecken. Ähnlich funktioniert das auch mit digitalen Formaten. So gibt es Programme, die aus JPG-Dateien alle sogenannten EXIF-Daten löschen.
 
- Der Kreis derjenigen, die Zugang zu einer internen Information haben, sollte nicht zu klein sein, um einen eventuellen Verdacht nicht auf Sie zu lenken. Beschränkt er sich auf wenige Personen, nehmen Sie lieber Abstand von einer Datenspende oder sorgen Sie zuvor dafür, dass der Kreis größer ist.
 
- Wenn Sie mit uns telefonieren wollen, kaufen Sie sich eine anonyme Prepaid-Karte und ein gebrauchtes Handy. Nutzen Sie nicht Ihr eigenes Gerät.

- Wenn Sie uns mailen wollen, nutzen Sie niemals eine auf Sie registrierte Mailadresse oder eine Adresse, mit der Sie auch sonst kommunizieren. Verwenden Sie anonyme Einmal-Adressen oder besorgen Sie sich einen Account unter falschem Namen bei einem Freemail-Anbieter. Benutzen Sie diese Mailadressen nicht von Firmenrechnern oder Ihrem Rechner zu Hause und verwenden Sie sie auch nicht für andere Zwecke als den gedachten. Verwenden Sie Verschlüsselungstechniken wie PGP. Die entsprechenden Programme sind kostenlos im Internet verfügbar.

- Sie können versuchen, Ihre heimische IP-Adresse und damit ihre Identität im Netz mit Diensten wie TOR zu verschleiern. Aber anonyme Mailadressen und Internetcafés bieten Ihnen im Zweifel mehr Sicherheit.

- Haben Sie Geduld und planen Sie Ihre Datenspende. Übereiltes oder unüberlegtes Handeln könnte Sie gefährden.

Kategorien: Allgemein

Drohnen an der Heimatfront

Von 14. Juni 2012 um 15:34 Uhr

Karte mit militärischen Drohnenstützpunkten in den USA / Quelle: Public Intelligence / Link: http://publicintelligence.net/dod-us-drone-activities-map/

Vor 15 Jahren, im Bosnienkrieg, hat die amerikanische Armee zum ersten Mal Drohnen eingesetzt. Inzwischen sind die unbemannten Fluggeräte alltäglich, nicht nur in Kriegen. Auf zwei Karten ist zu sehen, an wie vielen Orten in den USA inzwischen Drohnen stationiert sind oder geflogen werden. Es sind viele.

Drohnen können mit Raketen bestückt werden. Vor allem aber können Drohnen je nach Bauart unbeobachtet beobachten. Die vergleichsweise kleinen Geräte können aus großer Höhe Städte und Straßen überwachen, ohne gesehen oder gehört zu werden. In Texas wurden sie daher schon eingesetzt, um verdächtige Häuser zu überfliegen.

Armee, Luftwaffe, Grenzpolizei – alle sind an der Technik interessiert, da sie Soldaten und Polizisten schnell einen Überblick über ein Areal verschaffen kann. Wie groß das Interesse ist, zeigt die obere Karte. Die blauen Punkte zeigen die Stützpunkte, die in den kommenden Jahren geplant sind.

Bürgerrechtler besorgt diese Entwicklung. Vor allem, da bereits jetzt sehr viele Organisationen und Polizeibehörden von der Flugaufsicht FAA eine Genehmigung haben, Drohnen zu nutzen, wie die zweite Karte belegt. “Are Drones Watching You?”, fragt die Electronic Frontier Foundation. Sie schreibt: “Mit Drohnen ist eine sehr fortgeschrittene und dauerhafte Überwachung möglich und sie können Unmengen Daten sammeln. Mit verschiedenen Geräten können sie Livevideos übertragen, Infrarotbilder senden, Hitzesensoren und Radar benutzen. Neuere Modelle haben hochauflösende Gigapixel-Kameras, die Menschen und Fahrzeuge aus einer Höhe von 20.000 Fuß (6.000 Meter) beobachten können.”

Karte mit zivilen und Polizei-Organisationen, die eine Zulassung haben, Drohnen innerhalb der USA zu fliegen / Quelle: EFF / Link: https://www.eff.org/deeplinks/2012/04/faa-releases-its-list-drone-certificates-leaves-many-questions-unanswered

Die Daten von der Flugaufsichtsbehörde mussten von der EFF mit Hilfe des Freedom of Information Act eingeklagt werden. Die Daten über die militärischen Stützpunkte stammen aus Veröffentlichungen des Verteidigungsministeriums, aus denen sie zusammengesucht wurden.

Auch in Deutschland gibt es im Übrigen Pläne, den Einsatz von Drohnen im Inland zu regeln und damit zu ermöglichen.

Kategorien: Datenvisualisierung

Tornado-Spuren

Von 12. Juni 2012 um 09:57 Uhr

Tornados in den USA zwischen 1950 und 2006, Vislualisierung: John Nelson, Link: http://uxblog.idvsolutions.com/2012/05/tornado-tracks.html, Quelle: NOAA

Wie man aus offenen Daten schnell praktischen Nutzen zieht, macht ein amerikanischer Blogger vor. John Nelson fand bei data.gov, dem Open-Data-Portal der US-Regierung einen Datensatz vom Sturmvorhersage-Zentrum des Landeswetterdienstes über Tornados.

In dem sind die Routen aller bekannt gewordenen Tornados von 1950 bis 2006 verzeichnet – beziehungsweise jeweils der Anfangs- und der Endpunkt der Stürme. Auch die Stärke auf der sogenannten Fujita- oder F-Skala ist vermerkt.

Nelson baute aus den 50 Megabyte an Daten eine Grafik, die sofort sichtbar macht, in welchen Regionen der USA besonders viele Tornados beobachtet werden. Nachdem er dafür viel Aufmerksamkeit bekam, erweiterte er das um eine Aufschlüsselung nach der Stärke der Tornados.

Das ergab einerseits eine interessante – wenn auch leider statische – Visualisierung. Andererseits sieht die Grafik auch einfach gut aus, weswegen Nelson sie nun über einen entsprechenden Anbieter als Poster verkauft, je nach Größe für 9,40 Dollar bis 94,80 Dollar.

Verlauf und Stärke von Hurrikans in Nordamerika, Quelle: NOAA, Link: http://www.csc.noaa.gov/hurricanes/#

Das ist schick, wenn auch nicht unbedingt wissenschaftlich. Wer den Verlauf solcher Stürme genauer verfolgen will, sollte zur National Oceanic and Atmospheric Administration (NOAA) gehen, die die Daten veröffentlicht hat. Dort gibt es viele zusätzliche Informationen zu den historischen Sturmdaten.

Und bei ihr gibt es auch eine Karte mit Sturmdaten. Die hat den Vorteil, dass sie den tatsächlichen Verlauf der Stürme darstellt und nicht nur den Anfangs- und Endpunkt. Dort ist dann auch zu erkennen, in welchen Regionen sie entstehen und bis wohin sie ziehen.

Die historischen Kartendaten im Übrigen sind wie viele Daten des amerikanischen Wetterdienstes im Shapefile-Format gespeichert. Das kann mit quelloffenen Programmen bearbeitet werden.

SNCF stellt offene Daten zur Verfügung

Von 6. Juni 2012 um 15:22 Uhr

Informationstafel am Pariser Bahnhof Gare de l'Est © THOMAS SAMSON/AFP/Getty Images

Der deutschen Bahn müssen Informationen über ihre Züge und deren Pünktlichkeit geradezu abgerungen werden. Die französische SNCF stellt ihre Daten hingegen frei zur Verfügung.

Zwar veröffentlicht die Bahn hierzulande, welcher Zug wie viel Verspätung hat. Doch gibt es keine Datenbank, in der all diese Daten abgelegt werden – und die damit als Quelle neuer Anwendungen dienen könnte. Daher muss zum Beispiel der “Zugmonitor” der Süddeutschen Zeitung sich die Informationen mühsam zusammensuchen, um sie dann in einer übersichtlichen Grafik darstellen zu können.

Eine solche Grafik hat die französische Staatsbahn SNCF nicht. Aber sie hat nun ein Open-Data-Portal. Dort können die Informationen zur Pünktlichkeit des TGV dann als .csv-Datei heruntergeladen und damit problemlos weiterverarbeitet werden.

In dem Portal will die SNCF schrittweise all ihre Daten anbieten, seien es Zugverbindungsdaten, Bahnhöfe oder Fahrpläne. Außerdem wird um Rückmeldung und Kritik gebeten, um das Ganze gemeinsam weiterentwickeln zu können. Als Lizenz nutzt die SNCF die Open Database License ODbL, die es erlaubt, damit auch kommerzielle Anwendungen zu bauen.

Ein Lob dafür. Soweit sind die Verkehrsanbieter in Deutschland noch nicht. Zwar haben viele inzwischen Schnittstellen eingerichtet, um ihre Daten nutzen zu können, beispielsweise hier der Verkehrsverbund Berlin-Brandenburg. Doch wollen sie alle nicht, dass andere mit ihren Informationen Geld verdienen. Was kurzsichtig ist, würde doch jedes erfolgreiche Unternehmen Steuern zahlen. Was alle zugute kommt, auch den vom Staat bezuschussten Verkehrsanbietern.

Kategorien: Datenquelle

Wie Inhaftierung aus der Luft aussieht

Von 4. Juni 2012 um 17:18 Uhr

Luftbilder von Gefängnissen in den USA Quelle: http://www.prisonmap.com / Screenshot ZEIT ONLINE

Auch das sind Daten. Und was für welche.

Auf der Seite Prisonmap werden Luftbilder von amerikanischen Gefängnissen gesammelt. Zwei Dinge fallen dabei sofort auf: Es sind viele. Und es gibt offensichtlich Bundesstaaten und/oder Konzerne, die immer denselben Typ Gefängnis bauen.

Erfinder Josh Begley will damit visualisieren, dass die USA das Land auf der Welt mit den meisten Gefängnissen sind.

Aufgrund der enormen Menge an Gefängnissen sind auf der Seite nur die 700 besten Fotos zu sehen. Die komplette Datenbank mit fast 5.000 “correctional facilities”, ein Euphemismus für Haftanstalt, findet sich hier.

Als Basis für seine Bildersuche diente Begley eine Datenbank mit den Geokoordinaten amerikanischer Gefängnisse. Die hat die Prison Policy Initiative zusammengestellt, die versucht, die Wirkung massenhafter Gefängnisstrafen auf die Gesellschaft zu thematisieren.

Via @venohr

Kategorien: Datenquelle

Wo das deutsche Internet wohnt

Von 30. Mai 2012 um 17:35 Uhr

Gesamtzahl der Domainanmeldungen in Deutschland 2011 Quelle: denic

Die Zahl der .de-Domains, die jedes Jahr registriert werden, sinkt. Seit mehreren Jahren schon veröffentlicht die zentrale Registrierungsstelle Denic, wo in Deutschland wie viele Domains angemeldet sind. Die Zahlen für 2011 sind nun verfügbar.

Hier ein paar davon: Am 31. Dezember 2011 gab es demnach in Deutschland 13,8 Millionen Domains. Inzwischen sind es allerdings bereits mehr als 15 Millionen. Damit ist die Adresse .de die am häufigsten vergebene Länderadresse der Welt und die zweithäufigste überhaupt. Übertroffen wird sie nur von .com-Domains. Allerdings holt die Endung .net auf und liegt kurz hinter .de auf Platz drei.

Konkurrenz social media

Das klingt alles nach viel, jedoch wird die Zahl der Neuanmeldungen kleiner. Zu Zeiten der dotcom-Blase waren es mehr als zwei Millionen im Jahr. Derzeit sind es noch um die 700.000. Das hat zwei Gründe. Zum einen wird der Namensraum knapper. Angesichts der vielen Domains fällt es schwer, sich noch aussagekräftige neue einfallen zu lassen. Zum anderen konkurriert die Denic inzwischen mit sozialen Netzwerken. Noch vor ein paar Jahren habe jeder Privatmann eine eigene Website haben wollen, sagt Sprecherin Stefanie Welters. Inzwischen genüge vielen ein Account, beispielsweise bei Facebook.

Noch ein paar Zahlen: Wie jedes Jahr seit 1998 (bis dahin war es München) führt Berlin die Liste der Orte an, in denen absolut die meisten Domains registriert sind: 840.324. Angesichts der hohen Einwohnerzahl kein Wunder. Danach folgen München (609.152) und Hamburg (556.460).

Wird die Einwohnerzahl berücksichtigt, sieht das Bild etwas anders aus. Dann führt bei den kreisfreien Städten Osnabrück mit 749 .de-Domains pro 1.000 Einwohner. Platz zwei ist dann wieder München, Platz drei allerdings Bonn. Bei den Landkreisen fällt Amberg-Sulzbach in Bayern auf. Schon im vergangenen Jahr waren dort die meisten Domains pro Einwohner registriert, damals 715 pro 1.000 Einwohner. In diesem Jahr sind es nun gar 882 pro 1.000 Menschen und damit wieder Platz eins.

Domainhändler

Was aber nicht bedeutet, dass dort besonders viele Menschen ins Netz wollen. Es spricht eher dafür, dass irgendwo in dem Landkreis ein Domainhändler seinen Sitz hat. Das kann die Denic-Sprecherin zwar nicht bestätigen, hält es aber für wahrscheinlich. Sicher ist sie sich dagegen, dass in Osnabrück ein großer Händler sitzt. Trotz solcher Ausreißer hat Deutschland einen “hohen Anteil von Privatnutzern im Vergleich zu anderen Ländern”, wie Welters sagt.

Erkennen lässt sich in den Daten auch, welche Regionen “aufwachen” und nun verstärkt ins Netz gehen. Coburg beispielsweise. Die Stadt liegt bei Neuanmeldungen weit über dem Bundesdurchschnitt, scheint also im Aufschwung begriffen. Genau wie Ansbach und Memmingen. Vielleicht ist aber auch nur ein Domainhändler dorthin umgezogen. Sachsen-Anhalt hingegen schläft noch immer zuverlässig und belegt bei den Bundesländern wieder den letzten Platz.

Wer mit den Daten von 2011 herumspielen will, hier sind sie als Excel-Tabelle.

ProPublica recherchiert via Crowdsourcing

Von um 16:00 Uhr

Viele Studenten in den USA beginnen nach dem Uniabschluss ihr Berufsleben mit Schulden, weil sie die Unigebühren über Kredite finanziert haben. Dramatisch daran: Viele wissen nicht einmal, wie hoch ihre Schulden genau sind, da das System so komplex und jeder Kreditvertrag anders ist.

ProPublica, das durch eine Stiftung finanzierte Medienprojekt, will nun Daten über Unikredite sammeln, um besser über die Lage der Studenten berichten zu können. Dazu bittet ProPublica alle Studenten um Hilfe.

“Share your documents with us”, lautet der Aufruf, schick uns deinen Kreditvertrag. Im Zweifel genüge auch ein Foto, heißt es auf der Website. Alle Informationen würden anonym verarbeitet. Die Daten könnten dazu dienen, die Berichte von ProPublica viel besser machen, schreiben die Macher und verlinken auf einen Text, der nach einem ähnlichen Aufruf entstand.

Hintergrund ist eine Änderung in der Finanzierung von Studiengebühren. Bislang vergab das Bildungsministerium selbst solche Studienkredite. Vor einiger Zeit aber wurden diese aufgrund einer Gesetzesänderung an nichtkommerzielle aber private Kreditfirmen übergeben. Dabei scheint es Unregelmäßigkeiten zu geben. Um mehr darüber zu erfahren, versucht es ProPublica nun mit Crowdsourcing.

Gleichzeitig wurde eine Facebook-Gruppe gegründet, in der Erfahrungen ausgetauscht werden können und diskutiert werden kann. Auch dort dürften sich bald viele Ansätze für Recherchen finden.

Goldgrube Pharma-Daten

Von 23. Mai 2012 um 15:40 Uhr

Visualisierung von Medikamenten-Verkaufsdaten der US-Pharmafirma Help /Quelle: http://helpineedhelp.com/whatswrongus/

Google, Facebook und Twitter sind so groß und wissen so viel, dass sie auch etwas über den Gesundheitszustand der Welt sagen können. Das zeigt: Daten können völlig neue Aussagen enthalten, wenn sie in einem neuen Zusammenhang betrachtet werden. Die Erfinder von Help Remedies zeigen das sehr anschaulich.

Help vertreibt in den USA Medikamente. Das Start-up versucht, mit Konzepten wie Transparenz, Design und gutem Gewissen Tabletten zu verkaufen. Auf ihrer Website wirbt die Firma mit Schlagworten wie “less greed”, “less dyes” oder “less confusion”. Die Macher wollen also nicht so gierig sein wie andere und spenden fünf Prozent der Einnahmen, sie wollen keine bunten aber nutzlosen Farbstoffe in ihren Pillen einsetzen und sie wollen klarer sagen, was ein Medikament tut. Daher haben Schlaftabletten auch nicht irgendeinen ausgedachten Namen, sondern werden als “Help – I can’t sleep” vermarktet, Hilfe, ich kann nicht schlafen.

Und sie hatten noch eine Idee: Die Informationen darüber, wo welche dieser Medikamente am häufigsten gekauft werden, hat Help nun anonymisiert und in einer Grafik aggregiert.

Was hast Du, USA?, fragt die Seite und will die kleinen Wehwehchen und Probleme sichtbar machen, mit denen sich die Menschen so plagen. Demnach werden die Texaner vor allem von ihren Bronchien geplagt, die Bürger in Kalifornien und Arizona von verstopften Nasen und die in Montana und Wyoming von Schlaflosigkeit. In Colorado und West-Virginia sind hingegen Blasen an den Füßen das größere Problem.

Das Ganze kommt witzig und bunt daher und ist eine geschickte Werbekampagne. Einerseits.

Andererseits stecken darin gleich zwei größere Themen. Das erste ist, wie oben bereits angerissen das Phänomen Big Data. Große Datenmengen können überraschende Aussagen enthalten, an die ursprünglich niemand dachte. Als die Google-Suche erfunden wurde, war sicher niemandem klar, dass die Daten einst taugen würden, den Gesundheitszustand der Welt zu beschreiben. Den Kunden von Help war wohl kaum klar, dass sie helfen würden, einen Krankheitsatlas der USA zu erstellen.

Und das ist das zweite große Thema: Immer mehr Unternehmen entdecken gerade den Datenschatz, auf dem sie sitzen und versuchen, ihn auszubeuten. Help ist da eher ein positives Beispiel. Schließlich sind die Daten anonymisiert, und Angaben zu Geschlechtskrankheiten oder psychischen Erkrankungen gibt es nicht.

Es gibt aber auch negative Beispiele für den Umgang mit so sensiblen Daten. Die amerikanische Apothekenkette Walgreen weiß ebenfalls sehr genau, was Kunden für Medikamente kaufen. Und verkauft diese Daten an sogenannte Data-Miner – an Firmen also, die sie auswerten und aufbereiten. Anschließend stehen die Daten gegen eine Gebühr Pharmafirmen zur Verfügung. Die können damit beispielsweise erfahren, welche Ärzte besonders viele Medikamente verschreiben und welche das sind. Was, neutral gesagt, völlig neue Möglichkeiten der Werbung eröffnet.

Das Programm nennt sich “Operational Data Share” und bietet laut Eigenwerbung nahezu Echtzeitinformationen über verkaufte Medikamente in den Walgreens-Filialen in den USA.

Walgreen-Kunden fanden es nicht so lustig, zum Produkt gemacht zu werden. Sie haben die Firma deswegen gerade verklagt.

Facebooks Zahlen in Bildern

Von 16. Mai 2012 um 14:26 Uhr

Der britische Guardian hat eine Animation gebaut, die versucht, Facebooks Größe und Wachstum darzustellen:

Handbuch des Datenjournalismus

Von 7. Mai 2012 um 13:55 Uhr

Ein Tricorder, in der Science-Fiction-Serie "Star Trek" ein Gerät, um Daten zu sammeln, Quelle: JD Hancock, CC BY 2.0 http://www.flickr.com/photos/jdhancock/3386035827/

Was ist Datenjournalismus, warum sollten Journalisten Daten nutzen und wenn sie es denn wollen, wie geht das überhaupt? Diese und viele weitere Fragen will das erste Datenjournalismus-Handbuch beantworten. Das gibt es natürlich im Netz und demnächst auch als gedruckte Version.

Das Buch soll einen Überblick über das Thema geben, nicht eine dezidierte Anleitung sein, wie man Datenjournalist wird. Zu Letzterem, heißt es im Vorwort, bräuchte es sehr viel mehr Wissen und Instrumente. Glücklicherweise existiere aber eine ganze Bibliothek mit den Dingen, die ein Datenjournalist brauche: “Luckily this library exists and it is called the internet.”

Ein Überblick also. Der erste Teil beschäftigt sich ganz allgemein mit dem Thema und stellt mehrere erfolgreiche Projekte vor. In kurzen Texten beschreiben Datenjournalisten von der BBC, der Chicago Tribune, vom Guardian und von anderen Medien, warum sie mit Daten arbeiten und was sie davon haben. Anschließend werden einzelne Projekte genauer beleuchtet.

Interessanter wird es im nächsten Teil. Dort geht es darum, wie man überhaupt an Daten gelangt. Beispielsweise durch “wobbing”, also durch Anfragen nach dem Informationsfreiheitsgesetz. Die sind mühsam, aber lohnend. Genauso wie jene Daten, die längst zugänglich sind und nur noch über entsprechende Schnittstellen (API) ausgelesen werden müssen.

Ich hatte hier vor einiger Zeit die These vertreten, dass APIs für Journalisten bald einer der wichtigsten Wege sein werden, um an spannende Geschichten zu kommen. Der Abschnitt des Buches bestätigt mich in dem Glauben.

Tipps aus der Praxis

Beschrieben wird aber auch das “scraping”, also das “Herunterkratzen” von Daten von einer Website mithilfe spezieller Software. Das folgt der Idee, dass man ja nichts per Hand abschreiben muss, was schon digital vorliegt. Ganz so trivial ist es aber nicht. Scraping braucht ein paar Kenntnisse über die Struktur von Websites. Friedrich Lindenberg von der Open Knowledge Foundation gibt hilfreiche Beispiele und Links. Allerdings ist scraping nicht immer legal, worauf in dem Kapitel leider nur kurz eingegangen wird.

“Crowdsourcing” wird selbstverständlich ebenfalls behandelt – also die Bitte an Leser und Nutzer, Daten zu sammeln. Dazu gibt es Tipps, wie solche Vorhaben gelingen. Ein Zitat dazu vom Guardian: “If I were to give advice to aspiring data journalists who want to use crowdsourcing to collecting data, I would encourage them do this on something that people really care about, and will continue to care about when it stops making front page headlines.”

Die letzten beiden Kapitel beschäftigen sich schließlich damit, die gefundenen Daten zu verstehen und sie dann so aufzubereiten, dass auch andere sie verstehen.

Grundsätzlich gibt es viele praktische Hinweise von denen, die es bereits ausprobiert haben. Insofern ist das Handbuch auch eine Art Zwischenbericht zum Zustand des Datenjournalismus in Europa und Nordamerika. Und das Beste daran: Es kostet nichts.

Entstanden ist das Buch bei einem Workshop im November 2011 beim Mozilla Festival in London. Die Idee dazu hatten das European Journalism Centre und die Open Knowledge Foundation.

Disclaimer: ZEIT ONLINE hat an dem Handbuch mitgearbeitet und stellt darin einige eigene Projekte vor. Und da wir gerade bei der Eigenwerbung sind: Alle datenjournalistischen Projekte von ZEIT ONLINE finden sich hier gesammelt.

Kategorien: Datenjournalismus