Lesezeichen
‹ Alle Einträge

Daten sind der Treibstoff des Journalismus

 

screenshot texas tribunde
Online-Zeitung Texas Tribune: Viele Besucher kommen wegen der Datenanwendungen

Daten sind ein Rohstoff. Diese Einsicht ist ein geflügeltes Wort, spätestens seit der Werbefachmann Michael Palmer 2006 schrieb: „Daten sind das neue Öl.“ Palmer postulierte im Bild dieser Metapher, dass unbearbeitete Daten wertlos seien. Erst wenn sie bearbeitet würden, entstünden aus ihnen nützliche Produkte, so wie aus Öl Plastik, Dünger oder Benzin gemacht wird.

Im gleichen Jahr schrieb der amerikanische Journalist und Programmierer Adrian Holovaty einen wegweisenden Text mit dem Titel „A fundamental way newspaper sites need to change„.  Seiner Meinung nach sollten sich Zeitungen und andere Medien nicht nur auf Geschichten konzentrieren. Sie sollten viel mehr Informationen unter dem Aspekt betrachten, wie ihr Inhalt sich in strukturierter Form, also in Datenbanken, ablegen lässt. Dann, so Holovaty, könnte aus Geschichten auf Dauer ein Mehrwert abgeschöpft werden. Denn solche strukturierten Informationen können mit anderen Datenbanken verknüpft und automatisiert abgerufen werden. Und mit ihnen können wiederum publizistische Angebote angereichert werden – aufbereitete Daten als Dünger des medialen Feldes.

Holovatys Vorschläge sind aus dreierlei Gründen wichtig: Erstens weiß er über die technologischen Aspekte Bescheid. Der heute 30-Jährige ist einer der Programmierer der Django-Plattform – einer Entwicklungsumgebung für die populäre Programmiersprache Python, die erlaubt, flexible Datenanwendungen schnell bereit zu stellen. Django übrigens wurde in der IT-Abteilung einer Zeitung entwickelt.

Zweitens hat Holovaty die Theorie selbst umgesetzt und maßgeblich den Dienst Everyblock aufgebaut. Es ist das Vorzeigeprojekt sogenannter hyperlokaler Dienste, die Stadtinformationen auf Häuserblöcke und einzelne Straßen herunterbrechen. Viele der Informationen stammen aus Open-Data-Angeboten.

Drittens zeigte die Praxis, wie Recht Holovaty hatte: data-driven-journalism oder Datenjournalismus hat seit 2009 eine steile Karriere hingelegt. Die britische Tageszeitung Guardian startete damals ein Datablog. Und war selbst überrascht, auf welches Interesse die Bereitstellung von Datensätzen rund um tagesaktuelle Geschehnisse stieß. Mittlerweile wurde ein eigenes Ressort „Data“ eingerichtet. 2009 war auch das Jahr, in dem in den USA der frisch vereidigte Präsident Barack Obama seine Open-Government-Direktive erklärte. Und damit der Open-Data-Bewegung enormen Schwung gab, der sie weiterhin um die ganze Welt trägt.

Mit den Warlogs aus Afghanistan, die Wikileaks zusammen mit einigen Medienpartnern im Sommer vergangenen Jahres veröffentlichte, kam dann der Durchbruch für Datenjournalismus. Wie nie zuvor stand ein Datensatz im Mittelpunkt des medialen Interesses. Und er wurde den Lesern in den Onlinemedien in mannigfaltiger Form zugänglich gemacht. Jenseits von Text, Ton und Bild erwuchs so mit dem Datenjournalismus ein neues interaktives Erzählformat.

Dass sich dieses interaktive Format zum Alleinstellungsmerkmal für Onlinejournalismus mausern könnte, zeigt das Beispiel Texas Tribune. Das zwei Jahre junge stiftungsfinanzierte Journalismusprojekt verzeichnet die meisten Besucher, immerhin insgesamt mehr als 250.000 im Monat, in seinem Datenressort. Dort finden sich mehr als 50 interaktive Anwendungen, die Zugriff auf Bildungsinformationen erlauben oder Auskunft über die Arbeit von Politikern geben. Gespeist werden die Angebote ebenfalls vor allem aus offenen Daten.

Und nicht nur Alleinstellungsmerkmal, Daten könnten auch zu einem Geschäftsmodell für Onlinejournalismus werden. Die Datenjournalisten Nicolas Kayser-Bril, Mirko Lorenz und Georg McGhee zumindest sind davon überzeugt. Sie entwickeln in ihrem Text „Media companies must become thrusted data hubs“ das Paradigma der Datenknotenpunkte, zu denen Onlinemedien werden können. Mit ihrer Reputation als unabhängige Berichterstatter könnten Zeitungen und Nachrichtenportale zu Dienstleistern werden, die Nutzern Informationen passgenau liefern, je nach Interesse und Fragestellung.

Wohin die Entwicklung tatsächlich geht, ist noch ungewiss. Dass die voranschreitende Digitalisierung und Automatisierung jedoch den Journalismus verändern, zeigen erste Versuche mit dem „Roboterjournalismus“. Genauso ist klar, dass die Datenbasis immer größer wird, da immer mehr Regierungen und Verwaltungen sich anschicken, ihr Wissen preiszugeben. Und aufgrund seines Selbstverständnisses darf Journalismus die Auseinandersetzung mit diesen Informationen nicht scheuen.

Damit könnte er auch eine Idee voranbringen, von der Tim Berners-Lee schon lange träumt. Der Begründer des World Wide Web formuliert seit Jahren schon seine Vision von Datensätzen, die sich aufeinander beziehen können – ein semantisches Netz. Denn dieses formt sich aus „linked data“, verknüpften Informationen und werde einen Qualitätssprung für die Informationsinfrastruktur des Netzes bringen, hofft Berners-Lee. Für ihn ist klar, dass Datensätze der Treibstoff für Journalismus sein werden,  und empfiehlt: „Journalisten sollten datenaffin sein.“