Offene Daten – offene Gesellschaft

“Bibliotheken sollten ihre Daten öffnen”

Von 8. November 2011 um 16:37 Uhr

Oldschool: Bei der Planung verlässt sich die Open Bibliographic Data-Arbeitsgruppe auf die Kreidetafel

Adrian Pohl arbeitet seit 2008 im Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen (hbz). Seit Juni 2010 ist er Koordinator der Arbeitsgruppe der Open Knowledge Foundation zu Open Bibliographic Data. Im Interview berichtet Pohl über die Zusammenarbeit mit anderen Aktiven aus Wissenschaft und Bibliothekswelt. Ihr Ziel: der Aufbau einer Infrastruktur für offene bibliographische Daten.

Herr Pohl, worum geht es bei Open Bibliographic Data (OBD)?

Adrian Pohl: Wir orientieren uns an der Open-Access-Bewegung. Deren Idee wird bereits weitgehend in der Bibliothekswelt unterstützt: Ergebnisse öffentlich finanzierter Wissenschaft sollen auch jedem öffentlich zugänglich sein. Bibliotheken sind ebenfalls meist aus öffentlichen Geldern finanziert. Deshalb sollten die von ihnen produzierten Daten auch offen zugänglich und wiederverwendbar sein. Mit den “Prinzipen zu offenen bibliographischen Daten” haben wir in der Open Knowledge Foundation klare Anforderungen für die Freigabe solcher Daten formuliert, insbesondere im Hinblick auf die Wahl der Lizenz. Bibliotheksdaten können vielen von Nutzen sein.

Wofür zum Beispiel?

Pohl: Sammlungen bibliographischer Daten können als eine Landkarte verstanden werden, die uns Orientierung gibt in der Landschaft unserer literarischen, wissenschaftlichen oder künstlerischen Erzeugnisse.

So können die Daten etwa in der Forschung genutzt werden. Für Historiker beispielsweise könnte die Frage interessant sein, in welchem Jahrhundert zu bestimmten Zeiten wo wichtige Publikationsorte waren. Mit automatisierten Abfragen offener Daten aus Bibliothekskatalogen ließe sich zügig eine Übersicht über die meistgenutzten Publikationsstandorte erstellen. Das ginge weit über das hinaus, was mit normalen Rechercheoptionen möglich ist.

Ein anderes Beispiel: Bibliotheksdaten werden bereits für Anwendungen genutzt, die den urheberrechtlichen Status eines Werkes berechnen, ob es geschützt oder gemeinfrei ist. Mehr freie Daten könnten diese Dienste enorm verbessern. Es lassen sich unzählige weitere Anwendungen denken.

Wer arbeitet in ihrer Arbeitsgruppe mit?

Pohl: Einerseits Bibliothekare mit ihren Daten, die überwiegend Bücher beschreiben. Andererseits Naturwissenschaftler, die vor allem Zeitschriftenartikel publizieren. Die sind oft in Bibliothekskatalogen gar nicht verzeichnet. In der Arbeitsgruppe kommen Vertreter dieser beiden Gruppen aus verschiedenen Ländern zusammen, um Open Bibliographic Data zu fördern.

Es geht dabei um die Frage, wie die webbasierte wissenschaftliche Publikationsinfrastruktur künftig aussehen wird. Open-Access-Publikationen erscheinen in der Regel im PDF-Format. Das eignet sich gut zum Ausdrucken, aber schlecht für die maschinelle Verarbeitung. Es gibt verschiedene Ansätze, wissenschaftliche Publikationen mit eigenen Identifikatoren (URIs) zu versehen, damit man auf sie verlinken und sie mit semantisch markierten Metadaten verknüpfen kann – sie also um Informationen über den Autor, das Erscheinungsjahr oder den Erscheinungsort zu ergänzen.

Wie würden Sie die OpenBib-Szene in Deutschland beschreiben?

Pohl: Derzeit beschränken sich ihre Aktivitäten in Deutschland auf den Bibliotheksbereich. Mir sind nur wenige Projekte in den Wissenschaften bekannt. Das Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen (hbz) arbeitet seit dem Frühjahr 2010 mit Einrichtungen in Nordrhein-Westfalen und Rheinland-Pfalz daran, Bibliotheksdaten freizugeben. Noch konnten allerdings nicht alle Bibliotheken von einer Freigabe überzeugt werden. Dann gibt es noch Bibliotheken in Baden-Württemberg, die an OBD arbeiten.

Insgesamt ist die Szene noch eher klein, dafür aber stetig wachsend. Das Thema wird von vielen interessiert beobachtet. Vor Kurzem wurden etwa die “Empfehlungen zur Öffnung bibliothekarischer Daten” einer deutschlandweiten Forschungsgruppe veröffentlicht. Auch die Herausgabe eines Leitfadens durch das hbz soll Open Data in der Bibliothekswelt voranbringen. Der Leitfaden wurde von dem Juristen Till Kreutzer verfasst und enthält Informationen zu rechtlichen Hintergründen von Open Data in der Bibliothekswelt.

Welche Vorbehalte haben Bibliotheken, die ihre Daten nicht freigeben?

Pohl: Die Bibliotheken sind der Meinung, dass sie sehr viel in ihre Kataloge investiert haben. Viele Menschen haben daran gearbeitet und einen Wert geschaffen, der nicht leichtfertig verschenkt werden dürfe. Allerdings erweckt der Ausdruck “verschenken” einen falschen Eindruck: Man gibt die Daten ja nicht weg, man hat sie ja weiterhin.

Auch werden mögliche Einnahmequellen, die aus den Daten erschlossen werden könnten, als Argument genannt. Diese sind aber meist theoretischer Natur.

Eine weitere Sorge ist, sich selber überflüssig zu machen. Diese Angst erscheint mir aber unbegründet. Immerhin hat der, der die Daten liefert, die größte Glaubwürdigkeit, geht es um ihre Integrität. Der Lieferant bleibt also immer wichtig. Zudem werden ja auch neue Daten benötigt.

Ein vierter Punkt ist, dass das Potential von OBD meiner Meinung nach nicht erkannt wird.

Welche Chance entgeht diesen Bibliotheken?

Pohl: ODB bietet grundsätzlich die Möglichkeit, Kooperation zu fördern, sich auch international auszutauschen. Und eben mit anderen Akteuren zusammenzuwachsen, etwa mit der wissenschaftlichen Gemeinschaft oder der Wikipedia. Gerade bei dieser ist das Interesse an bibliographischen Daten groß. Es gibt ja in sehr vielen Artikeln bibliographische Verweise. Für die Wikipedia wäre es auch interessant, diese Daten mit Bibliothekaren gemeinsam pflegen zu können. Das Wissen aus der Wikipedia kann wiederum in Bibliothekskataloge zurückfließen. Es gibt ja auch dort Einträge zu Personen und Schlagwörtern.

Es könnte eine gegenseitige Verbesserung der Wissensbestände stattfinden. Solche Chancen verbaut man sich, wenn man seine Daten umarmt und nicht herausgeben will.

Gibt es international Vorreiter in diesem Bereich?

Pohl: In Deutschland passiert schon recht viel auf diesem Gebiet. Doch setzt Großbritannien gerade zum Überholen an. Die haben mit dem JISC, dem Joint Information Systems Committee, eine Einrichtung, die die wissenschaftlich-technische Informationsinfrastruktur im gesamten Vereinigten Königreich fördert. Das JISC unterstützt seit einiger Zeit stark Open Data in Bibliotheken, Archiven und Museen. Davon können wir in Deutschland sicherlich lernen, weil der Prozess dort sehr offen und transparent ist.

Wichtig sind auch die Entwicklungen bei der europäischen digitalen Bibliothek Europeana. Dort wurde im September eine neue Metadatenvereinbarung veröffentlicht. Mit dieser werden alle an die Europana gelieferten Metadaten gemeinfrei. Daraufhin haben sich die europäischen Nationalbibliotheken für die offene Lizenzierung ihrer Daten ausgesprochen.

Welche Wünsche haben Sie hinsichtlich Open Bibliographic Data?

Pohl: Ich würde mir wünschen, dass die deutsche Wissenschaftspolitik Open Data entdeckt und das Thema auf die politische Agenda kommt. Im vergangenen halben Jahr sind diverse Empfehlungen zur wissenschaftlichen Informationsinfrastruktur in Deutschland herausgekommen: Von der Deutschen Forschungsgemeinschaft (DFG), dem Wissenschaftsrat und der Leibnizgesellschaft. In keiner dieser Empfehlungen spielen Open Data eine nennenswerte Rolle. Dabei sollte das Thema bei der Planung einer Informationsinfrastruktur einen wesentlichen Platz einnehmen. Open Data sind eine optimale Basis, um die wissenschaftliche Informationsinfrastruktur weiter zu entwickeln.

Blog von Adrian Pohl

Bildnachweis: OFKN Blog

Kategorien: Dateninterview
Leser-Kommentare
  1. 1.

    Gut, aber nicht genügend. Pohls Vorstellung ist zu wenig radikal. Er geht bspw. immer noch davon aus, dass es wissenschaftliche Zeitschriften braucht. Die meisten Zeitschriften sind jedoch ein Auslaufmodell. Ihre Hauptfunktion, Wissenschaftlichkeit zu garantieren, füllen sie nicht mehr aus. Sie sind nur noch Veranstaltungen nach dem Prinzip von “ich publiziere in deiner Zeitschrift und du in meiner”, damit beide zusammen ihr Rating verbessern kann.
    Ich wünschte mir, dass die Professoren und Forscher ihre Ergebnisse auf ihrer Homepage öffentlich zugänglich machen. Der Wettbewerb wird schon das Schlechte vom Guten trennen. Bei Pohls Modell habe ich die starke Befürchtung, dass nur ein neuer bürokratischer Moloch geboren wird.

  2. 2.

    Zwei Aspekte werden der Idee “Open Data” das Leben schwer machen: 1. der bibliografische Narzissmus der wissenschaftlichen Autoren und Autorinnen (“Mein 23. Aufsatz zum immergleichen Thema erscheint demnächst im XYZ-Verlag!”); und 2. das unternehmerische Kalkül der wissenschaftlichen Verlage, die diesen intellektuellen Ramsch zu Mondpreisen publizieren und verkaufen, obwohl sie die Kernaufgaben guter Verlagsarbeit (Lektorat/Korrektorat, Drucksatz, Einbandgestaltung etc.) längst auf studentische Hilfskräfte oder die AutorInnen selbst abgewälzt haben (“Bitte schicken Sie uns das druckfertige Manuskript zu, wir liefern ihnen das passende Word-Stylesheet. Die viereinhalbtausend Euro überweisen Sie dann an…”) Traurig aber wahr: Wissenschaft ist für die meisten Mitspieler eben zum Großteil Geschäft und alberne Selbstinszenierung.

    • 8. November 2011 um 19:06 Uhr
    • Dudenson
  3. 3.

    [...] Open Data: "Bibliotheken sollten ihre Datenbestände öffnen" Das konnte Sie auch [...]

  4. 4.

    [...] sagt Adrian Pohl von der Open Knowledge Foundation im Data-Blog. Und Bibliotheken gewönnen auch. mehr lesen © zeit.de (RSS)   If you enjoyed this article, please consider sharing [...]

  5. 5.

    [...] "Bibliotheken sollten ihre Daten öffnen" Im Interview berichtet Pohl über die Zusammenarbeit mit anderen Aktiven aus Wissenschaft und Bibliothekswelt. Ihr Ziel: der Aufbau einer Infrastruktur für offene bibliographische Daten. Herr Pohl, worum geht es bei Open Bibliographic Data (OBD)? … Read more on ZEIT ONLINE (Blog) [...]

  6. 6.

    Pohl geht es um bibliothekarische Daten und nicht um die dort verzeichneten Medien. Das ist auch gut so, denn das sind zwei völlig voneinander zu unterscheidende Themengebiete.

    Wer jetzt davon anfängt, dass Verlage überflüssig seien und man ohnehin an jedes geistige Eigentum ran könnte, liegt leider nicht nur rechtlich daneben, er hat Pohls Ideen leider auch nicht im Ansatz verstanden.

    Ich denke, dass es ein interessantes Thema ist und quasi durch die Hintertür über Internationalisierung und damit verbundenen geplanten Regelwerksänderung mittlerweile mehr im Gange ist, als es manchmal aufgrund der Kataloglage den Anschein hat.

    Herr Pohls Initiative ist in jedem Fall zu unterstützen.

  7. 7.

    Full Ack.

    Das Netz hat die Geschaeftsmodelle der Musik- und Filmindustrie Geschichte werden lassen. Selbiges passiert nach und nach mit Teilen der Print-Industrie. Einige wenige werden immer ueberleben, hoffen wir die mit Qualitaet. Leider setzt sich nicht immer Qualitaet am Markt durch.

    Viele wissenschaftl. Verlage haben ihren “must-have” Status in Bibliotheken schamlos ausgenutzt + ueberteuerte Abos vertickt. Bibliotheken koennten ihre Budgets sinnvoller Nutzen. Der Sinn einer wissenschaftl. Publikation liegt darin von moeglichst vielen Interessenten gelesen zu werden. Geld verdient wird an der Uni + in der Wirtschaft.

    Wissen soll fliessen, daher ist das Netz praedestiniert als #1 Plattform zur Veroeffentlichung. PDF-Format. 1-Klick. Download. Fast Null Euro Kosten. Sofort weltweit verfuegbar.

    • 9. November 2011 um 09:53 Uhr
    • LinkMatrix.de
  8. 8.

    Es geht um bibliothekarische Daten – also die Beschreibung der Titel, das, was in den Katalogen steht, Normdaten, deren Verlinkungen und die Weiterarbeit daran durch wie im Artikel genannt z.B. Wikipedia und solche Dinge wie Metadaten.

    Es scheint so, als gäbe es im Kommentarbereich kaum jemanden, der sich mit diesem Bereich und dem Artikel tatsächlich beschäftigt hat.

    Es geht nicht um die Inhalte von Artikeln oder Büchern und auch nicht um die Frage, ob Verlage ihre Zeitschriften vermarkten dürfen oder nicht.

  9. Kommentar zum Thema

    (erforderlich)

    (wird nicht veröffentlicht) (erforderlich)

    (erforderlich)