Offene Daten – offene Gesellschaft

Daten sind der Treibstoff des Journalismus

Von 4. Mai 2011 um 16:18 Uhr
screenshot texas tribunde

Online-Zeitung Texas Tribune: Viele Besucher kommen wegen der Datenanwendungen

Daten sind ein Rohstoff. Diese Einsicht ist ein geflügeltes Wort, spätestens seit der Werbefachmann Michael Palmer 2006 schrieb: “Daten sind das neue Öl.” Palmer postulierte im Bild dieser Metapher, dass unbearbeitete Daten wertlos seien. Erst wenn sie bearbeitet würden, entstünden aus ihnen nützliche Produkte, so wie aus Öl Plastik, Dünger oder Benzin gemacht wird.

Im gleichen Jahr schrieb der amerikanische Journalist und Programmierer Adrian Holovaty einen wegweisenden Text mit dem Titel “A fundamental way newspaper sites need to change“.  Seiner Meinung nach sollten sich Zeitungen und andere Medien nicht nur auf Geschichten konzentrieren. Sie sollten viel mehr Informationen unter dem Aspekt betrachten, wie ihr Inhalt sich in strukturierter Form, also in Datenbanken, ablegen lässt. Dann, so Holovaty, könnte aus Geschichten auf Dauer ein Mehrwert abgeschöpft werden. Denn solche strukturierten Informationen können mit anderen Datenbanken verknüpft und automatisiert abgerufen werden. Und mit ihnen können wiederum publizistische Angebote angereichert werden – aufbereitete Daten als Dünger des medialen Feldes.

Holovatys Vorschläge sind aus dreierlei Gründen wichtig: Erstens weiß er über die technologischen Aspekte Bescheid. Der heute 30-Jährige ist einer der Programmierer der Django-Plattform – einer Entwicklungsumgebung für die populäre Programmiersprache Python, die erlaubt, flexible Datenanwendungen schnell bereit zu stellen. Django übrigens wurde in der IT-Abteilung einer Zeitung entwickelt.

Zweitens hat Holovaty die Theorie selbst umgesetzt und maßgeblich den Dienst Everyblock aufgebaut. Es ist das Vorzeigeprojekt sogenannter hyperlokaler Dienste, die Stadtinformationen auf Häuserblöcke und einzelne Straßen herunterbrechen. Viele der Informationen stammen aus Open-Data-Angeboten.

Drittens zeigte die Praxis, wie Recht Holovaty hatte: data-driven-journalism oder Datenjournalismus hat seit 2009 eine steile Karriere hingelegt. Die britische Tageszeitung Guardian startete damals ein Datablog. Und war selbst überrascht, auf welches Interesse die Bereitstellung von Datensätzen rund um tagesaktuelle Geschehnisse stieß. Mittlerweile wurde ein eigenes Ressort “Data” eingerichtet. 2009 war auch das Jahr, in dem in den USA der frisch vereidigte Präsident Barack Obama seine Open-Government-Direktive erklärte. Und damit der Open-Data-Bewegung enormen Schwung gab, der sie weiterhin um die ganze Welt trägt.

Mit den Warlogs aus Afghanistan, die Wikileaks zusammen mit einigen Medienpartnern im Sommer vergangenen Jahres veröffentlichte, kam dann der Durchbruch für Datenjournalismus. Wie nie zuvor stand ein Datensatz im Mittelpunkt des medialen Interesses. Und er wurde den Lesern in den Onlinemedien in mannigfaltiger Form zugänglich gemacht. Jenseits von Text, Ton und Bild erwuchs so mit dem Datenjournalismus ein neues interaktives Erzählformat.

Dass sich dieses interaktive Format zum Alleinstellungsmerkmal für Onlinejournalismus mausern könnte, zeigt das Beispiel Texas Tribune. Das zwei Jahre junge stiftungsfinanzierte Journalismusprojekt verzeichnet die meisten Besucher, immerhin insgesamt mehr als 250.000 im Monat, in seinem Datenressort. Dort finden sich mehr als 50 interaktive Anwendungen, die Zugriff auf Bildungsinformationen erlauben oder Auskunft über die Arbeit von Politikern geben. Gespeist werden die Angebote ebenfalls vor allem aus offenen Daten.

Und nicht nur Alleinstellungsmerkmal, Daten könnten auch zu einem Geschäftsmodell für Onlinejournalismus werden. Die Datenjournalisten Nicolas Kayser-Bril, Mirko Lorenz und Georg McGhee zumindest sind davon überzeugt. Sie entwickeln in ihrem Text “Media companies must become thrusted data hubs“ das Paradigma der Datenknotenpunkte, zu denen Onlinemedien werden können. Mit ihrer Reputation als unabhängige Berichterstatter könnten Zeitungen und Nachrichtenportale zu Dienstleistern werden, die Nutzern Informationen passgenau liefern, je nach Interesse und Fragestellung.

Wohin die Entwicklung tatsächlich geht, ist noch ungewiss. Dass die voranschreitende Digitalisierung und Automatisierung jedoch den Journalismus verändern, zeigen erste Versuche mit dem “Roboterjournalismus”. Genauso ist klar, dass die Datenbasis immer größer wird, da immer mehr Regierungen und Verwaltungen sich anschicken, ihr Wissen preiszugeben. Und aufgrund seines Selbstverständnisses darf Journalismus die Auseinandersetzung mit diesen Informationen nicht scheuen.

Damit könnte er auch eine Idee voranbringen, von der Tim Berners-Lee schon lange träumt. Der Begründer des World Wide Web formuliert seit Jahren schon seine Vision von Datensätzen, die sich aufeinander beziehen können – ein semantisches Netz. Denn dieses formt sich aus “linked data”, verknüpften Informationen und werde einen Qualitätssprung für die Informationsinfrastruktur des Netzes bringen, hofft Berners-Lee. Für ihn ist klar, dass Datensätze der Treibstoff für Journalismus sein werden,  und empfiehlt: “Journalisten sollten datenaffin sein.”

Kategorien: Datenjournalismus
Leser-Kommentare
  1. 1.

    Kann es sein, dass sich hinter dem ganzen aufgeregten Namedropping Selbstverständlichkeiten verbergen, von denen der Laie eigentlich denken will, dass sie schon seit langem State of the Art sein müssten?

    Apropos Art: Mark Lombardi (http://de.wikipedia.org/wiki/Mark_Lombardi)

  2. 2.

    @Rumbsbuns: Danke für den Kommentar. Trommeln gehört zum Handwerk und damit gehen Buzzwords einher. Tatsächlich sind manche Sachen recht banal. Aber die Erkenntnis, dass mit Daten (halb-)automatisiert Geschichten erzählt werden können, mag der Laie für selbstverständlich halten, ist aber in der Umsetzung alles andere als trivial. Was Lombardi machte ist beeindruckend, aber recht starr, weil gedruckt/gezeichnet. Datenjournalismus könnte solch Organigramme dynamisch erzeugen und auffächern, siehe etwa der Versuch von http://influencenetworks.org/

    • 5. Mai 2011 um 09:22 Uhr
    • Lorenz Matzat
  3. 3.

    Hallo Herr Matzat,

    natürlich waren die Arbeiten von Mr. Lombardi starr. Sie entstanden ja auch schon vor Jahrzehnten. Aber sein (“händisches”) Vorgehen war doch genau das, worauf Sie digital hinaus wollen – ergänzt um kontinuierliche, strukturierte, etc. Datenströme und entsprechender Interaktion.

    Mich hat einfach nur verwundert, dass plötzlich alles wieder so neu sein soll, obwohls das ja schon so lange gibt.

    Wäre Mr. Lombardi ins digitale Zeitalter hineingeboren worden, hätte Mr. Assange in Australien wahrscheinlich nie vom Känguru steigen müssen: Für große Aufregung kann man nämlich auch mit legal erworbenen Daten in Verbindung mit entsprechender Eigenleistung sorgen.

    Nicht, dass ein falscher Eindruck entsteht: Ich finde Ihr Thema sehr spannend und werde es auch weiterhin verfolgen!

  4. 4.

    Das Thema (fast schon im Wortlaut: “Daten sind (…) der Treibstoff der Wirtschaft: http://nextconf.eu/next11/about/summary/) steht im mittelpunkt der NEXT Conference – unter dem Leitmotiv Data Love. Die pessimistische Perspektive auf das Thema blendet aus, was mit der Verwendung von Daten gerade durch eine entsprechende Visualisierung in redaktionellen Kontexten möglich ist. Der Guardian unternimmt dank der Steilvorlage der britischen Regierung (http://data.gov.uk) erste Gehversuche zum Thema Open Data. Zielführend. Richtungsweisend. Beispielgebend für unser Land.

    • 5. Mai 2011 um 22:05 Uhr
    • Christoph Salzig
  5. 5.

    [...] natürlich dadurch Information für die Leser so beschreibt es ein sehr interessanter Artikel in der Zeit: “Daten sind der Treibstoff des Journalismus”. Seit kurzer Zeit werden von Qualitätsmedien immer mehr Datenbanken angelegt, die zu aktuellen [...]

  6. 6.

    Um noch ein Buzz-Wort zu bemühen: Datamining wird seit Anfang der 90er Jahre in der Praxis angewendet, zunächst um Modetrends zu entdecken (in welchen Regionen verändert sich die Beliebtheit verschiedener Farben?) und nicht zuletzt “ungewöhnliches Reiseverhalten” zu detektieren. Die Auswertung aller europäischen Reise- Telefon- und Bankdaten, die von der EU so vertrauensvoll in die Hände der USA vergeben wurde ermöglicht noch viel mehr, als Hinweishäppchen auf mögliche Terrorverdächtige. Reise- Telefon- und Bankdaten aller Manager europäischer Unternehemen gewährleisten beispielsweise ein hervoragendes Profil für die Vorhersage jeglicher Angebote, die Unternehmen für Ausschreibungen abgeben.

    Der kürzlich ungewöhnlich geräuschlos, zugunsten von Boing verlorene EADS- Militärauftrag ist meiner Meinung nach nur eine erste öffentlich wahrnbehmbar gewordene Konsequenz dieser einseitigen Daten-Offenbarung. Weitere Niederlagen für Unternehmen werden folgen, zumal unter dem Deckmantel der Terrorfahndung auch private Daten von Managern und Politikern gesammelt, analysiert und interessant sein dürften, um die Damen und Herren gegebenenfalls an gewisse Leichen im Keller zu erinnern, falls es zu Schwure kommt…
    Gelegentlich wirft man Häppchen neuer Terrorerkenntnisse nach Europa, um den Politikern eine Argumentationshilfe zu geben, warum beispielsweise Antiterrorgesetze verlängert, Bürgerrechte beschnitten oder Websperren eingerichtet werden sollen.

    Somit entwickelt sich das ‘neue Öl’ zunehmend zum Damoklesschwert für Diejenigen, die es verschenken und man braucht kein Verschwörungstheoretiker zu sein um sich vorstellen zu können, dass eine wirtschaftlich angeschlagene Nation von den vielfältigen Möglichkeiten es Datamining keinen Gebrauch machen sollte.

    • 7. Mai 2011 um 06:29 Uhr
    • Wolf
  7. 7.

    @Wolf: Danke für den Kommentar. Das ist tatsächlich ein interessanter Aspekt; er offenbart auch, welche schwerwiegenden Konsequenzen es – nicht nur im Wirtschaftsbereich – hat, dass beim politische Personal in der Regel technologisch Ahnungslosigkeit herrscht. Oder besser, es herrscht eine Überforderung, digitale Dynamiken und Möglichkeiten angemessen bewerten zu können und dann angebrachte Schlüsse für die Gesellschaft daraus zu schließen.

    • 7. Mai 2011 um 09:21 Uhr
    • Lorenz Matzat
  8. 8.

    [...] DATEN-JOURNALISMUSDaten sind der Treibstoff des Journalismus « Datenjournalismus « Open Data Blog: Solange das Darstellen von Daten Teil einer Transparenz-Initiative ist, warum nicht. Mehr Daten sind gut. Mehr Einsicht besser: Daten sind ein Rohstoff. Diese Einsicht ist ein geflügeltes Wort, spätestens seit der Werbefachmann Michael Palmer 2006 schrieb: “Daten sind das neue Öl.” [...]

  9. Kommentar zum Thema

    (erforderlich)

    (wird nicht veröffentlicht) (erforderlich)

    (erforderlich)