Offene Daten – offene Gesellschaft

ZEIT ONLINE startet eine Text-API

Von 23. November 2012 um 14:03 Uhr

Namen, die in Texten von Zeit und Zeit Online vorkommen, sortiert nach ihrer Häufigkeit

ZEIT ONLINE hat ab sofort eine Content-API. Klingt langweilig? Nun, es kommt sehr darauf an, was andere daraus machen. Eine API ist ein Zugang, eine Möglichkeit, bestimmte Informationen automatisiert abzufragen. Auf der Seite http://developer.zeit.de/ findet sich nun eine solche API und sie ist der Zugang zu allen Texten, die in der ZEIT (seit 1946) und bei ZEIT ONLINE (seit 1996) erschienen sind.

Dank dieser Schnittstelle kann nun jeder alle Texte mit Hilfe von Programmen durchsuchen und analysieren. Eine REST-API gibt Metadaten wie Autor, Kategorien oder Schlagworte aus. In der Beta-Version der API ist es aus rechtlichen Gründen leider nicht möglich, auch den Volltext auszugeben und zu speichern. Aber wer ein Projekt plant, für das die Übernahme des Volltextes von Artikeln nötig ist, kann unter api@zeit.de jederzeit Kontakt aufnehmen.

Warum tun wir das? Wir glauben, dass in den hunderttausenden Artikeln noch viele spannende Informationen verborgen sind. Örtliche oder inhaltliche Zusammenhänge, Zeitbezüge – durch eine Verknüpfung können Dinge sichtbar werden, die beim einfachen Lesen nicht unbedingt zutage treten.

Beispielsweise durch Visualisierungen. Oder durch Langzeitbeobachtungen. Wie oft tauchte der Begriff “China” in den vergangenen 66 Jahren in unseren Texten auf? Und in welchen Zusammenhängen? Wie hat sich also das China-Bild der Redaktion und vielleicht also auch das deutsche China-Bild in dieser Zeit gewandelt?

Die automatisierte Abfrage stellt die Technik bereit, um solche Informationen finden zu können. Nun braucht es nur noch Fragen.

Anwendungen und Visualisierungen, die aus der Arbeit mit der API entstehen, sammeln wir auf dieser Seite. (Nachtrag: Was natürlich bedeutet, dass wir uns über jeden freuen, der uns das Ergebnis seiner Arbeit zeigt.)

Die Bedingungen, unter denen die Nutzung der Schnittstelle möglich ist, finden Sie hier.

Informationen über die weitere Arbeit an der API finden sich nebenan, im Entwicklerblog von ZEIT ONLINE.

Kategorien: Datenquelle
Leser-Kommentare
  1. 17.

    [...] zu allen Texten, die in der ZEIT (seit 1946) und bei ZEIT ONLINE (seit 1996) erschienen sind. ZEIT ONLINE startet eine Text-API, [...]

  2. 18.

    [...] Mit einer Text-API (“application programming interface”), also einer Schnittstelle für Drittprogramme, möchte die “ZEIT” sein Archiv der Allgemeinheit zur Verfügung stellen. So ist es nun möglich, die Texte der Printausgabe seit 1946 und die von “ZEIT ONLINE” seit 1996 zu durchsuchen und mit den Metadaten Autor, Kategorie und Schlagwörter ausgeben zu lassen. Kai Biermann, seit 2007 bei “ZEIT ONLINE”, erklärt die damit verbundene Hoffnung der Redaktion: "Wir glauben, dass in den hunderttausenden Artikeln noch viele spannende Informationen verborgen sind. Örtliche oder inhaltliche Zusammenhänge, Zeitbezüge – durch eine Verknüpfung können Dinge sichtbar werden, die beim einfachen Lesen nicht unbedingt zutage treten." Kai Biermann, “ZEIT ONLINE“ [...]

  3. 19.

    Finde ich eine tolle Idee. DANKE
    Wir werden das auf jeden Fall nutzen und versuchen unseren Lesern diesen Schatz – Zeit ist ja mit das Beste was wir im deutschen Journalismus haben – zur Verfügung zu stellen.

    Merci

    Maximilian Erlmeier
    Herausgeber euroJournal

    • 27. November 2012 um 15:45 Uhr
    • Maximilian Erlmeier
  4. 20.

    Guter, wichtiger und richtiger Schritt. Nur handelt bitte konsequent und seht ein, dass wenn nicht unbedingt die zwei Begriffe, dann jedoch der dahintersteckende Zeitgeist von
    Open Data und “[Volltext] aus rechtlichen Gründen leider nicht möglich” nicht miteinander vereinbar sind. Ich hoffe, die Restriktion bezieht sich nur auf die Beta..

    • 29. November 2012 um 02:16 Uhr
    • n1cK
  5. 21.

    [...] Hacking ZEIT Online Die freudige Nachricht Launch der ZEIT ONLINE Content-API beim Hackday kam am 23.11. online und seitdem wurden bereits mehrere Tools und Anwendungen auf Basis dieser API erstellt. Open Data [...]

  6. 22.

    [...] I checked out the new ZEIT Online text-API using the query text crowdsourcing and limiting the output to the metadata fields author, title, [...]

  7. 23.

    Hallo…
    hier kommt leider nur ein “not found”, bei mir jedenfalls… :
    http://developer.zeit.de/gallery/
    Danke für die Mühe!

    • 23. September 2014 um 14:07 Uhr
    • Götz
  8. Kommentar zum Thema

    (erforderlich)

    (wird nicht veröffentlicht) (erforderlich)

    (erforderlich)