Lesezeichen
 

Ein Glossar rund um Open Data

Die Idee Open Data ist vergleichsweise jung und werden die Begriffe, die damit verbunden sind, längst nicht von allen gleich interpretiert. Der folgende Artikel ist der Versuch eines Glossars, er will Schlüsselworte rund um Standards, Datenformate und Datenarten auflisten und erläutern.

Überblick der Begriffe des Glossars:

  • Daten
  • Datei
  • Open
  • Open Data
  • Schnittstelle/API
  • Formate
  • Rohdaten
  • Scraper
  • Parser
  • Datensatztypen
  • Open-Data-Güte
  • Open Government
  • Government 2.0
  • ePartizipation

Daten (data – Latein, Plural von Datum) meint gruppierte Informationen; wörtliche Bedeutung: etwas Gegebenes, Gegebenheit.

Datei (im Engl. „file“) ist ein Kunstwort aus Daten und Kartei.

Open – englisch für offen, meint vor allem allgemeine Zugänglichkeit. Mit „Open“ wird signalisiert, dass eine kostenfreie Weiternutzung möglich ist (siehe z.B. Open Office); also kein klassisches Copyright mit der Software oder Information verbunden ist. Die Nutzung erfolgt über ein Lizenzmodell wie Creative Commons, das die Bedigungen der Verwendung regelt. Für Open Data gibt es mittlerweile verschiedene Lizenzmodelle, beispielsweise die Open Database License (ODbL).

„Offen“ muss nicht „frei“ bedeuten, die Nutzung kann eingeschränkt sein und beispielsweise eine kommerzielle Verwendung untersagen. Dagegen sind Werke, die als „Public Domain“ gekennzeichnet sind, ein Gemeingut und frei für jeden Zweck nutzbar. Als Faustformel mag gelten: Ist etwas nicht kostenfrei und/oder nicht weiternutzbar und/oder liegt nicht in einem offenen Format vor – dann ist es nicht „open“.

Open Data bezeichnet ein Prinzip oder eine Kultur. Bezieht es sich auf die Veröffentlichung von Datensätzen, meint es strukturierte, maschinenlesbare und gerne über eine offene API/Schnittstelle abrufbare Informationen. Oft wird der Begriff synonym für „Open Government Data“ benutzt. Letzteres meint Datensätze aus der öffentlichen Hand (Politik, Verwaltung). Open Data kann aber auch von Wissenschaft, Wirtschaft, Nichtregierungsorganisationen (NGO) oder Privatpersonen praktiziert werden.

In der Regel geht es bei Open Data um nicht-personenbezogene Daten oder zumindest anonymisierte Daten. Ein Open-Data-Angebot lässt sich im Netz vor allem daran erkennen, das es erlaubt, die Rohdaten herunterzuladen oder per Schnittstelle abzufragen.

Weiter„Ein Glossar rund um Open Data“

 

„Öffentlich meint heutzutage Open Data“

chris taggart

Chris Taggart begann vor zwei Jahren, das Projekt Openly Local aufzubauen. Es sammelt Gemeinderatsinformationen in Großbritannien. Die Hälfte aller knapp 400 Räte hat das Open-Data-Projekt mittlerweile erfasst. Im Interview erläutert der britische Journalist, wie diese Arbeit dazu führte, ein weiteres Vorhaben anzugehen, eins namens OpenCorporates.

Worum geht es bei Openly Local?

Chris Taggart: Auf vielen britischen Gemeinderats-Websites fällt es schwer, sich zu orientieren. Manche sind komplett unzugänglich. Keine Spur von Barrierefreiheit. Oft werden sie von Suchmaschinen wie Google nicht erfasst, weil sie falsch aufgesetzt sind. Es gibt beispielsweise so gut wie keine Ratswebsite, die eine Liste aller Ratsmitglieder herausgibt oder eine Übersicht über die Ratssitzungen.

OpenlyLocal ist also ein Angebot, die Informationen zugänglich zu machen. Die Datensätze können von anderen Leuten weiterverarbeitet werden. Lokale Blogs, die über eine ganz spezifischen Ort, etwa einen Kiez oder ein Dorf berichten, nutzen Daten von OpenlyLocal.

Welche Informationen erhält man?

Taggart: Bei uns kann man beispielsweise eine Liste der kommenden Sitzungen abonnieren. Wir wissen sogar von Ratsmitgliedern, die unser Angebot nutzen, um die Tagesordnung zu bekommen. Weil die Website ihres eigenen Rats das nicht kann.

Ihnen geht es aber um mehr als eine reine Dienstleistung, oder?

Taggart: Mit OpenLocaly habe ich ein Fundament gelegt. Jetzt werden auch Bevölkerungsstatistiken eingebaut oder Informationen über das örtliche Polizeipersonal. Und was ganz wichtig ist: Es  werden nun auch Finanzinformationen eingelesen. Wir hatten in Großbritannien die umfassendste Veröffentlichung von Finanzdaten weltweit, was den lokalen Bereich angeht. Jeder Gemeinderat muss seit diesem Januar alle Ausgaben über 500 Pfund dokumentieren. Über dreihundert Räte veröffentlichen jetzt jeden Monat was sie ausgeben. OpenlyLocal dokumentiert derzeit Ausgaben in Höhe von insgesamt 40 Milliarden Euro in 1,8 Millionen Transaktionen. Weiter„„Öffentlich meint heutzutage Open Data““

 

Informationsfreiheit ins Grundgesetz

lesesaal deutsche bibliothek leipzig
Um als Open-Data-Infrastruktur zu dienen, braucht diese Bücherei noch ein paar Computer.

Die grüne Bundestagsfraktion hatte am Dienstag zu einem „Fachgespräch“ geladen. Es ging um die Programmatik eines neuen Informationsfreiheitsgesetzes (IFG) und wie sich in diesem die Idee Open Data wiederfinden könnte. Das Papier der Grünen, das kommende Woche unter der Überschrift „Grüne Bürgerbeteiligung“ veröffentlicht werden soll, spielte dabei nur am Rand eine Rolle. Vielmehr wurden diverse Aspekte rund um Open Government und Open Data angesprochen.

Eines wurde deutlich: Was genau „Open“ bedeutet, ist noch längst nicht ausgemacht. Die zentralen Merkmale von Open Data – Maschinenlesbarkeit der Daten und ungehinderter Zugang und Nutzung – sind offensichtlich noch nicht überall verstanden worden.

In dem knapp zweistündigen Austausch wurden viele Themen angesprochen; hier einige Aspekte, die ich bemerkenswert fand:
Weiter„Informationsfreiheit ins Grundgesetz“

 

Open Data kommt nur langsam voran

worldmap open government data
Bislang 81 Datenkataloge weltweit verzeichnet diese Karte.

Rund um den Erdball verbreitet sich die Open-Data-Idee. Mehr als 80 offizielle und von Initiativen betriebene Kataloge mit frei zu nutzenden Datensätzen verzeichnet diese Karte hier. In Deutschland dagegen kommt Open Data nicht richtig voran. „Bisher Fehlanzeige“, schreibt der Wissenschaftler Sönke E. Schulz in dem Blog government2020.de zur Frage, ob der Gesetzgeber hierzulande bereits entsprechend handele.

Zwar gibt es seit dem vergangenen Sommer ein Regierungsprogramm Transparente und vernetzte Verwaltung. Dort heißt es, bis 2013 solle eine Open-Government-Strategie des Bundes fertig sein. Und auch der Start eines Pilotprojekts war angekündigt – für Ende 2010 (S. 70). Bislang scheint es das jedoch nicht zu geben. Aus dem Bundesinnenministerium hieß es auf Nachfrage, die Bundesregierung sei gegenwärtig dabei, einzelne Initiativen zur Umsetzung von Open Government „vorzubereiten und abzustimmen“. Es sei damit begonnen worden, Open-Government -Aspekte beim Aufbau der Geodateninfrastruktur Deutschland (GDI-DE) zu berücksichtigen.

Ob das gute oder schlechte Nachrichten sind, ist schwer zu beurteilen.

Weiter„Open Data kommt nur langsam voran“

 

Deutscher Strahlungsatlas machte Pause

Gamme Strahlung Messung
1800 Stationen messen in Deutschland die Strahlung

Das Bundesamt für Strahlenschutz (BfS) betreibt seit dem Reaktorunglück in Tschernobyl vor fast genau 25 Jahren ein „Integriertes Mess- und Informationssystem für die Überwachung der Radioaktivität in der Umwelt“ (IMIS). Es besteht aus 1800 Messstationen, die über die Republik verteilt sind. Die Daten, die sie liefern, werden eigentlich alle zwölf Stunden veröffentlicht. Eigentlich. Seit Samstagnacht jedoch wurden die Informationen nicht mehr aktualisiert. Erst am Montagmittag kamen die nächsten Messwerte.

Ein schlechter Zeitpunkt für eine Pause angesichts der Ereignisse in Japan und des daraus resultierenden Interesses für Strahlung. Dabei heißt es auf der Homepage der Behörde extra anlässlich Japans: „Die Bürgerinnen und Bürger können online die Messwerte der Messsonden abrufen.“

Warum ausgerechnet am Sonntag keine neuen Daten veröffentlichen wurden, war beim BfS nicht in Erfahrung zu bringen. Auf Nachfrage hieß es, die Daten würden jeden Tag „plausibilisiert“. Also auf eventuelle Messfehler oder Störungen der Sonden hin untersucht. Mehr wisse man über die Verzögerung auch nicht. Mittags waren die Daten dann nachgetragen.

Update: Eine Sprecherin des Bundesamtes erklärte nach Veröffentlichung des Textes, es habe keine Pause gegeben. Alle zwölf Stunden würden die Messdaten gemittelt und am Folgetag automatisch veröffentlicht. Die Beobachtung, dass am Sonntag keine Veröffentlichung erfolgte, konnte sie nicht bestätigen. Zitat: „Es gab keine Verzögerung.“

Weiter„Deutscher Strahlungsatlas machte Pause“

 

Daten von Downunder

datenkatalog australien

Die Riege der Staaten, die ihren Bürgern massenweise Daten der öffentlichen Hand zur Verfügung stellt, hat ein neues Mitglied: Australien. Das riesige Land bietet seinen etwa 22 Millionen Einwohnern seit heute auf data.gov.au einige hundert Datensätze zur freien Verfügung an. Denn, so die Idee dahinter, freie Daten nützten der Gesellschaft.

Es sind Informationen über Finanzen, über das Bildungswesen, die Kultur und das Regierungshandeln, die sich dort finden lassen. Gleichzeitig werden auch Anwendungen, sogenannte Apps, vorgestellt, die Leben in die Datensätze bringen. Etwa Suburbantrends: Das Angebot erlaubt es, sich anhand der Einwohnerzahl oder von Kriminalitätsstatistiken ein Bild zu machen von einem der rund 8000 verschiedenen Stadtteile Australiens.

Weiter„Daten von Downunder“

 

Malte Spitz‘ Vorratsdaten: Der Datensatz unter der Lupe

vorratsdaten bewegungsprofil
Spuren: Deutschlandweites Bewegungsprofil in Reinform

Der Grünenpolitiker Malte Spitz ist viel unterwegs. Er nutzt soziale Netzwerke, um über sich und seine Arbeit beim Bundesvorstand der Partei zu berichten, und er schaltet selten sein Mobiltelefon aus. Die sechs Monate Vorratsdaten, die er ZEIT ONLINE  zur Verfügung gestellt hat, bedeuteten daher 35.830 aufgezeichneten Verbindungen – ein eindeutiges Bewegungsprofil.

Spitz hatte im August 2009 die Herausgabe seiner Daten eingeklagt. Er hatte Erfolg und die Telekom übergab ihm sechs Monate seiner Vorratsdaten von August 2009 bis Februar 2010. Wir veröffentlichen ihn hier als Google Doc (ohne die Telefon-, Geräte- und Kartennummern von Spitz).

Nicht enthalten sind die Telefonnummern der Anrufer und Angerufenen. Der Provider T-Mobile hatte sie vor der Herausgabe entfernt, da inzwischen das Bundesverfassungsgericht die Vorratsdatenspeicherung gestoppt hatte. Damit ist mit diesem Datensatz nicht möglich, was Ermittler vor allem wollen: Das Ausforschen und Beobachten sozialer Beziehungsnetze.

Dennoch sind die Daten spannend. Zusammen mit Michael Kreil, der mit Ideen und Können die Programmierung übernommen hat, habe ich die interaktive Karte zu den Vorratsdaten hier auf ZEIT ONLINE umgesetzt.

Weiter„Malte Spitz‘ Vorratsdaten: Der Datensatz unter der Lupe“

 

Zahlen zu den Wahlen in Hamburg

Am Sonntag ist es soweit: Die erste der sieben anstehenden Landtagswahlen in diesem Jahr beginnt. Im Netz finden sich diverse Angebote, die Zahlenmaterial in unterschiedlicher Form zu dem Thema aufbereiten und abbilden.

Oben können Sie beispielsweise selber eine Wahlprognose erzeugen, indem Sie am Wahltipp von ZEIT ONLINE teilnehmen. Sie können auch den aktuellen Zwischenstand der abgegebenen Stimmen des „Prognosers“ als Tabellendatei (.csv) herunterladen und damit experimentieren.

Falls Sie in Hamburg wählen dürfen und noch unentschieden sind, kann Ihnen vielleicht der Wahl-O-Mat weiterhelfen, den ZEIT ONLINE zusammen mit der Bundeszentrale für politische Bildung anbietet.

Zu den Daten rund um die Wahlen ist Wahlrecht der Klassiker überhaupt: Die schnörkellose Website wahlrecht.de bietet diverse Angebote, darunter die Sonntagsfrage, auch die für Hamburg. Wie der Name schon sagt, finden sich dort alle möglichen Informationen rund um das Recht auf Stimmabgabe, Wahlsysteme und so weiter.

Neben den Ergebnissen der bislang gelaufenen Wahlen ist vor allem die Sammlung der Wahlumfragen ein hilfreicher Service um sich im Vorhinein ein Bild machen zu können.

Weiter„Zahlen zu den Wahlen in Hamburg“

 

Europas Energiepolitik verständlich dargestellt

co2 verbrauch eu
"Spielerische Auseinandersetzung" - Die Daten zur Energiepolitik in Europa

Den Spieltrieb wecken – auch das ist ein Weg, um komplexe Informationen zu vermitteln. Ein Beispiel, dass es ein guter Weg ist, zeigt die NGO Open Knowledge Foundation (OKFN). Sie hatte anlässlich des Treffens des Europäischen Rates die Energiepolitik der EU-Länder aufbereitet. Das Ergebnis ist eine eindrucksvolle interaktive Visualisierung der Energiedaten. Sie erlaubt, Energieerzeugung, -verbrauch, -exporte und -importe der Mitgliedsstaaten zu vergleichen.

Die Grafik wurde auf  der Sitzung des Rates präsentiert, deren Ergebnisse bereits vorliegen (pdf).

Zahlreiche Leute haben bei der Umsetzung der Grafik geholfen. So wurde sie beispielsweise von Helfern in 16 Sprachen übersetzt. Jonathan Gray, Mitarbeiter der OKFN, erklärt die Motiviation: „Es ging uns darum, die Daten in einen Kontext zu setzen und verständlich zu machen.“ Ähnlich wie bei einem anderen Projekt der Stiftung – Where does my money go –  sei es das Ziel gewesen, dass Potential von Datenvisualisierung deutlich zu machen. Und auch darum, zu zeigen, was mit Open Data aus den Datenbeständen von Eurostat, dem statistischen Amt der EU, möglich ist. Die Visualisierung ist Teil des Vorhabens, einen pan-europäischen Datenkatalog aufzubauen: publicdata.eu.

Weiter„Europas Energiepolitik verständlich dargestellt“

 

Britischer Kriminalitätsatlas in der Kritik

Die britische Polizei veröffentlicht seit Dienstag ihre Kriminalitätsstatistiken in Open-Data-Formaten, die auch über eine Schnittstelle abgefragt werden können. Das dazu gehörende Portal www.police.uk brach kurz darauf unter dem Ansturm zusammen. Offenbar wollte jedermann wissen, wie kriminell es in seiner Nachbarschaft zugeht. Bis zu 300.000 Anfragen pro Minute habe es geben, hieß es. Das konnte die Infrastruktur wohl nicht verkraften. Mittlerweile ist die Karte allerdings wieder nutzbar.

Die Darstellung von Kriminalität in dieser Form ist umstritten, da sie nach Meinung von Kritikern zu Panikmache sowie zu Stigmatisierung von Regionen führen könne. Eine Diskussion über interaktive Kriminalitätskarten gibt es seit 2009, als eine Crime Map für Los Angeles veröffentlicht wurde.

Die britische Innenministerin Theresa May ließ gestern verlauten: „Wir wollen, dass die Menschen sehen können, welche Verbrechen in ihrer Straße geschehen. Und dass sie die Möglichkeit haben, ihrer lokalen Polizeidienststelle ihre Bedenken mitzuteilen. Und sie damit zu konfrontieren, wie mit der Problematik umgegangen wird.“

Die 300.000 Pfund teure Website sei erst der Anfang, sagte May. Die Regierung wolle die Arbeit fortsetzen und noch mehr Transparenz in die Bereiche Kriminalität, Polizeiarbeit und Justiz bringen. Die Kriminalitätskarte ist Teil der Open-Government-Initiative der konservativ-liberalen Regierung in Großbritannien.

Weiter„Britischer Kriminalitätsatlas in der Kritik“