Offene Daten – offene Gesellschaft

ZEIT ONLINE startet eine Text-API

Von 23. November 2012 um 14:03 Uhr

Namen, die in Texten von Zeit und Zeit Online vorkommen, sortiert nach ihrer Häufigkeit

ZEIT ONLINE hat ab sofort eine Content-API. Klingt langweilig? Nun, es kommt sehr darauf an, was andere daraus machen. Eine API ist ein Zugang, eine Möglichkeit, bestimmte Informationen automatisiert abzufragen. Auf der Seite http://developer.zeit.de/ findet sich nun eine solche API und sie ist der Zugang zu allen Texten, die in der ZEIT (seit 1946) und bei ZEIT ONLINE (seit 1996) erschienen sind.

Dank dieser Schnittstelle kann nun jeder alle Texte mit Hilfe von Programmen durchsuchen und analysieren. Eine REST-API gibt Metadaten wie Autor, Kategorien oder Schlagworte aus. In der Beta-Version der API ist es aus rechtlichen Gründen leider nicht möglich, auch den Volltext auszugeben und zu speichern. Aber wer ein Projekt plant, für das die Übernahme des Volltextes von Artikeln nötig ist, kann unter api@zeit.de jederzeit Kontakt aufnehmen.

Warum tun wir das? Wir glauben, dass in den hunderttausenden Artikeln noch viele spannende Informationen verborgen sind. Örtliche oder inhaltliche Zusammenhänge, Zeitbezüge – durch eine Verknüpfung können Dinge sichtbar werden, die beim einfachen Lesen nicht unbedingt zutage treten.

Beispielsweise durch Visualisierungen. Oder durch Langzeitbeobachtungen. Wie oft tauchte der Begriff “China” in den vergangenen 66 Jahren in unseren Texten auf? Und in welchen Zusammenhängen? Wie hat sich also das China-Bild der Redaktion und vielleicht also auch das deutsche China-Bild in dieser Zeit gewandelt?

Die automatisierte Abfrage stellt die Technik bereit, um solche Informationen finden zu können. Nun braucht es nur noch Fragen.

Anwendungen und Visualisierungen, die aus der Arbeit mit der API entstehen, sammeln wir auf dieser Seite. (Nachtrag: Was natürlich bedeutet, dass wir uns über jeden freuen, der uns das Ergebnis seiner Arbeit zeigt.)

Die Bedingungen, unter denen die Nutzung der Schnittstelle möglich ist, finden Sie hier.

Informationen über die weitere Arbeit an der API finden sich nebenan, im Entwicklerblog von ZEIT ONLINE.

Kategorien: Datenquelle
Leser-Kommentare
  1. 9.

    [...] Graphic or Data Visualization”, tracciando gli spostamenti di un deputato tedesco. Zeit Online è andata anche oltre e ha annunciato proprio ieri che metterà a disposizione le Api di alcuni suoi lavori: [...]

  2. 10.

    [...] Meinungen dreht sichs um Pressethemen, also z.B. um die “Pay Wahl” der taz, die neue API der ZEIT sowie das neue Projekt wefightcensorship.org der Reporter ohne [...]

  3. 11.

    [...] anderen Vorstoß ins digitale Zeitalter unternimmt eine andere deutsche Papierzeitung, die ZEIT. Dort hat man hat gestern eine API freigeschaltet. Eine API ist eine Schnittstelle für Daten. Darüber können Programmierer rohe Daten auslesen und [...]

  4. 12.

    [...] des Webevangelisten Thomas Pfeiffer ist so wie’s aussieht eine der ersten Anwendungen, die die API der ZEIT nutzt – man kann sich damit die Häufigkeit des Vorkommens eines Begriffs in der ZEIT in [...]

  5. 13.

    Es gibt schon eine wissenschaftliche Studie, in der das ZEIT-Archiv datengeleitet ausgewertet wurde. Das Preprint kann hier heruntergeladen werden:

    http://www.security-informatics.de/blog/?p=989

    • 24. November 2012 um 19:40 Uhr
    • Constanze Warnke
  6. 14.

    Bravo! Aber warum nicht gleich ein OAI-PMH Gteway?

    • 24. November 2012 um 22:14 Uhr
    • Nichtsnutz
  7. 15.

    [...] Mit einer Text-API (“application programming interface”), also einer Schnittstelle für Drittprogramme, möchte die “ZEIT” sein Archiv der Allgemeinheit zur Verfügung stellen. So ist es nun möglich, die Texte der Printausgabe seit 1946 und die von “ZEIT ONLINE” seit 1996 zu durchsuchen und mit den Metadaten Autor, Kategorie und Schlagwörter ausgeben zu lassen. Kai Biermann, seit 2007 bei “ZEIT ONLINE”, erklärt die damit verbundene Hoffnung der Redaktion: Wir glauben, dass in den hunderttausenden Artikeln noch viele spannende Informationen verborgen sind. Örtliche oder inhaltliche Zusammenhänge, Zeitbezüge – durch eine Verknüpfung können Dinge sichtbar werden, die beim einfachen Lesen nicht unbedingt zutage treten. Kai Biermann, “ZEIT ONLINE“ [...]

  8. 16.

    [...] ZEIT ONLINE startet eine Text-API [...]

  9. Kommentar zum Thema

    (erforderlich)

    (wird nicht veröffentlicht) (erforderlich)

    (erforderlich)