Offene Daten – offene Gesellschaft

API – das bald wichtigste Werkzeug des Journalisten

Von 13. März 2012 um 09:22 Uhr

Die API von Twitter bietet Zugang zu den Daten des Dienstes - Screenshot ZEIT ONLINE

Sharing is caring“, lautet einer der Kernsätze des freien Internets. Wer Informationen und Inhalte teilt, heißt das, der vermehrt das Wissen aller. Lange waren Links das einzige Instrument, um an den Inhalt einer Website zu gelangen. Inzwischen gibt es jedoch eines, das viel mächtiger ist, die API.

Die drei Buchstaben sind ein Akronym für Application Programming Interface, also eine Schnittstelle, damit Computer miteinander reden und automatisiert Daten tauschen können. Viele Dienste wie beispielsweise Twitter bieten solche Schnittstellen. Über sie können die in den Diensten enthaltenen Informationen – beispielsweise die Tweets – ausgelesen und weiterverarbeitet werden.

Warum das alles hier erwähnt wird? Weil APIs die Voraussetzung für das Konzept offener Daten sind. Denn niemand wird sich hinsetzen und die europäischen Bevölkerungsstatistiken von Hand in Tabellen eintragen wollen, damit er irgendwann daraus eine Karte bauen kann. Damit Daten überhaupt weiterverarbeitet werden können, müssen sie automatisiert zugänglich sein. Dieser Zugang, eben die API, ist also eine der Bedingungen, damit Daten den Stempel “offen” verdienen.

Seit einiger Zeit entwickelt sich auch in Deutschland eine neue Arbeitsweise, Daten-Journalismus genannt. Noch beschränkt sich der auf kleine Teams, die frei oder für ein paar große Verlage arbeiten. Das aber wird sich ändern, und APIs werden schon bald eines der wichtigsten Instrumente von Journalisten sein. Sie werden die Bedeutung haben, die früher das Telefon für die Arbeit von Medien hatte und die derzeit Google hat. Denn sie sind ein machtvolles Werkzeug, um an Informationen zu gelangen.

Wer ein wenig mehr zur Arbeitsweise von Schnittstellen wissen will und wie Journalisten sie nutzen können, hier entlang.

Das Poynter-Institut, eine renommierte Journalistenschule in Florida, hat gerade einen interessanten Text dazu veröffentlicht. “Acht APIs, die Ihre Nachrichtenredaktion ab sofort nutzen sollte”, lautet die Überschrift.

Aufgeführt ist dort beispielsweise der Datenzugang der Weltbank. Dort gibt es Finanzdaten aus mehr als 50 Jahren.

Oder der zur Open Library. Die will Informationen über “jedes jemals erschienene Buch” sammeln. Ein Katalog der Welt-Bibliothek, in dem bereits 20 Millionen Bücher erfasst sind. In vielen Fällen beschränkt sich das auf die bibliografischen Angaben zu den Büchern, also beispielsweise Autor, Verlag, Erscheinungsjahr und Ort. Wenn das Urheberrecht es zulässt, wird aber auch der komplette Inhalt aufgenommen. Bereits eine Million Bücher wurden vollständig eingescannt, sodass sie gelesen und durchsucht werden können.

Aufgeführt sind aber auch zwei Medien, die selbst APIs bereitstellen, um ihren Inhalt weiterzugeben, USA Today und der Guardian. Bei der amerikanischen Zeitung können damit Überschriften und Metadaten durchsucht und sortiert werden. Die britische Tageszeitung stellt sogar den kompletten Inhalt der Texte ab 1999 zur Verfügung und bietet verschiedene Lizenzmodelle an, um diese Inhalte zu nutzen.

Noch sind viele Verlage leider sehr mit der Idee beschäftigt, ihre Inhalte so gut wie möglich gegen eine Nutzung durch andere abzuschotten. Es wäre nicht schlecht, wenn sich das bald änderte. Immerhin sind auch Zeitungsarchive riesige Datenschätze, aus denen sich neue Erkenntnisse gewinnen lassen.

Kategorien: Datenjournalismus
Leser-Kommentare
  1. 1.

    Wunderbarer Anlass zum Thema APIs ist der schwache Spamschutz von Zeit Online:
    Meine Spamschutz-Frage lautete: Was ergibt 5 × 7 ?
    Die API von Google Translate spuckt mir dabei aus: What is 5 x 7?
    Die API von Wolfram Alpha spuckt mir dabei aus: http://www.wolframalpha.com/input/?i=What+is+5+x+7%3F

    Spamschutz umgangen. Bitte nachbessern!

    • 13. März 2012 um 10:33 Uhr
    • anon
  2. 2.

    “Denn niemand wird sich hinsetzen und die europäischen Bevölkerungsstatistiken von Hand in Tabellen eintragen wollen, damit er irgendwann daraus eine Karte bauen kann.”

    Wieso nicht? Das manuelle Übernehmen von Daten ist auf absehbare Zeit für die meisten Aufgaben wesentlich schneller und effizienter, als sich in eine komplizierte technische Materie wie API einzuarbeiten.

    • 13. März 2012 um 12:19 Uhr
    • Markus
  3. 3.

    [...] the original post: Data Blog: Die API wird das wichtigste Werkzeug des Journalisten Dieser Eintrag wurde veröffentlicht in Digital und verschlagwortet mit arbeit, bedeutung, [...]

  4. 4.

    Interessanter Artikel, aber möglicherweise deutlich an der Realität vorbei gedacht.

    Ich bezweifle die These, dass Journalisten bald Zeit mit der Schnittstellen-Implementierung für proprietären Datenquellen verbringen werden. Abgesehen von einem neuen Lernfeld, welches wenig mit der Freude am Sprechen und Schreiben zu tun hat, steht der Aufwand in keinem Verhältnis zum Ergebnis. Schauen wir auf die Prämissen für die Umsetzung wird schnell klar, warum dies keinen Sinn macht.

    1. APIs sind auf die Lieferung von Echtzeit-Daten ausgerichtet, was hier nicht notwendig ist. Schlimmer noch: Sind die Daten per API direkt an den Artikel angebunden, und haben sich die Daten beim späteren Lesen des Artikels zwischenzeitlich verändert, so kann es sein, dass sie gar nicht mehr mit dem Text korrelieren. (Problem: Konsistenz/Aussage!)

    2. Die API-Syntax richtig sich an Programmierer, nicht an Laien. (Hoher Lern-Aufwand!)

    3. Die verschiedene APIs der unterschiedlichen Datenanbieter sind proprietär, d.h. jeder “kocht sein eigenes Süppchen”, es gibt keinen Standard. (Aufwand/Pflege!)

    4. Die per API erhaltenen Daten müssen erst in eine koheränte Form gebracht werden und sind ohne diese Form nicht verwertbar (Aufwand!)

    5. Eine API liefert immer nicht “alle Daten en gros”, sondern muss für JEDEN EINZELNEN BEREICH unterschiedliche Aufrufe ausführen, die separat programmiert werden müssen. (Aufwand!)

    6. Bei einer Echtzeit-Anbindung an die API sind Szenarien denkbar bei denen der Artikel gar nicht oder unvollständig erscheint, weil die API-Quelle z.B. technische Probleme hat. Desweiteren wird der Artikel selbst langsamer dargestellt, da die Daten erst per API geholt und verarbeitet werden müssen. (Verfügbarkeit/Qualität/Leser-Akzeptanz)

    7. Es entsteht eine organisatorisch/technisch/finanzielle Abhängigkeit vom Datenlieferanten. (Kosten!)

    8. Ändert die Quelle ihre API-Parameter, dann muss die Verwertungskette ebenso angepasst werden. (Folgekosten!)

    Bei längerem Nachdenken über das Thema fallen mir bestimmt noch ein paar Argumente mehr ein, die es unwahrscheinlich machen, dass APIs direkt vom Journalisten verwendet werden. :-)

    APIs sind übrigens nicht die Voraussetzung für offene Daten. “OpenData” ist die Voraussetzung für offene Daten und APIs sind nur eine Methode auf diese zuzugreifen. Simple Exporte oder Data-Miner sind vermutlich eine bessere Methode für die Schreibende Zunft an verwertbares Datenmaterial zu gelangen.

    Unter der Prämisse, dass ein Journalist die drei- bis zehnfache Zeit, welche das Schreiben des Artikels selbst benötigt, in die API-Programmierung für diesen einzelnen Artikel steckt und die Verlage das auch noch bezahlen wollen (weil die Branche gerade boomt :), sollte man das vielleicht mal ernsthaft ausprobieren. :-)

    Dipl. Inform. Ronald D. Vogel – Portraits

  5. 5.

    BTW: Die automatische Konvertierung der Smilies ist “unsittlicher Käse” und sollte dringend abgestellt werden!

  6. 6.

    Sehr geehrter Ronald Dae,

    alles, was Sie anführen, ist richtig. Allerdings meinte ich einen etwas anderen Punkt. Dazu ein Gleichnis: Seit vielen Jahren suchen Journalisten in Archiven nach Geschichten. Die Archivanfrage und das Archivergebnis sehen sie in den Texten nicht, sondern nur die Schlussfolgerungen, die der Autor zog. Das gleiche geschieht derzeit mit Suchmaschinen. Auch die liefern letztlich kryptische Echtzeitdaten und sind doch die wichtigste Basis journalistischer Arbeit.

    Die Vorstellung, aus einer API gewonnene Daten würden direkt in einen Text eingebunden ist zwar reizvoll. Aber ich glaube nicht, dass das der Weg ist. APIs sind Recherchewerkzeuge. Die Erkenntnisse, die ich daraus gewinne, kann ich zu Geschichten destillieren.

    Die API bietet mir genau wie eine Suchanfrage bei Google die Möglichkeit, “Fragen” zu stellen und eine “Daten-Antwort” zu bekommen. Die ich als Journalist dann weiter verarbeite.

    Dass die Dinger kompliziert sind, ist richtig. Meine Vorhersage: das wird nicht so bleiben.

    Beste Grüße
    Kai Biermann

    • 13. März 2012 um 13:21 Uhr
    • Kai Biermann
  7. 7.

    Noch ein kurzer Nachtrag zu ihrem Punkt “7. Es entsteht eine organisatorisch/technisch/finanzielle Abhängigkeit vom Datenlieferanten. (Kosten!)”

    Streng genommen bin ich als Journalist organisatorisch, technisch und finanziell abhängig von einem Telefonanbieter. Das hindert mich aber nicht, dieses nützliche Werkzeug Telefon einzusetzen. :)

    Beste Grüße

    • 13. März 2012 um 13:25 Uhr
    • Kai Biermann
  8. 8.

    Es ist doch wie immer. Früher wollte kein Journalist Pressemitteilungen per E-Mail haben. “Ist doch viel zu umständlich. Da muss ich mich immer extra einwählen. Das Fax spuckt alles einfach aus … .”

    In ein paar Jahren wird wahrscheinlich kein Informationsanbieter ohne API auskommen. Macht ja auch Sinn.Und natürlich werden APIs ja auch immer besser und immer nutzerfreundlicher.

    Vielleicht stellt man in absehbarer Zeit einfach eine Frage und bekommt von der API die entsprechende Grafik hübsch aufbereitet zugeschickt. Handys haben ja auch schon Sprachsteuerung.

    • 13. März 2012 um 13:35 Uhr
    • Jens Petersen
  9. Kommentar zum Thema

    (erforderlich)

    (wird nicht veröffentlicht) (erforderlich)

    (erforderlich)