Offene Daten – offene Gesellschaft
Kategorie:
Datensatz

Prozentualer Anteil der Bevölkerung, der älter als 65 Jahre ist - Screenshot einer Grafik vom Datenportal Europe eXplorer
Die 2010 gegründete schwedische Firma NComVA ist eine Ausgründung des National Center for Visual Analytics der Universität Linköping. NComVA beschäftigt sich damit, Dinge zu visualisieren, also grafisch darzustellen, seien es städtische Strukturen oder demografische Daten. Man wolle, so steht es in der Selbstbeschreibung, statistische Informationen so gut wie nur möglich zugänglich machen, damit sie verstanden werden können.
Wie so etwas aussehen kann, zeigt das Unternehmen beispielsweise anhand der europäischen Bevölkerungsstatistik. Unter dem Titel “Europa eXplorer” ist die Altersstruktur der EU-Länder auf vielfältige Weise verarbeitet.
Auf Karten, Diagrammen und Punktwolken ist zu beobachten, wie sich Junge und Alte in Europa verteilen: Irland und Polen sind jung, Deutschland, Italien und Griechenland sind alt.
Der Nutzer kann selbst mit den Daten herumfummeln, kann verschiedene Darstellungsformen wählen, Filter darüber legen oder neue Kategorien hinzufügen und anzeigen lassen.
Die verwendeten Rohdaten sind frei und können heruntergeladen werden.
Außerdem kann die Plattform genutzt werden, um eigene Daten darzustellen. Hochgeladen werden können Daten im Excel- und im PC-Axis-Format.
Das Unternehmen bietet viele weitere Grafiken an. Beispielsweise eine, die den globalen Handel der USA mit OECD-Staaten darstellt, oder eine über Geburtenraten.
Das Ganze ist selbstverständlich Werbung für die Produkte der Firma. Aber es ist gute Werbung, lässt sie dem Nutzer doch die Freiheit, herumzuprobieren und Daten zu importieren und zu exportieren.
Die Idee Open Data ist vergleichsweise jung und werden die Begriffe, die damit verbunden sind, längst nicht von allen gleich interpretiert. Der folgende Artikel ist der Versuch eines Glossars, er will Schlüsselworte rund um Standards, Datenformate und Datenarten auflisten und erläutern.
Überblick der Begriffe des Glossars:
- Daten
- Datei
- Open
- Open Data
- Schnittstelle/API
- Formate
- Rohdaten
- Scraper
- Parser
- Datensatztypen
- Open-Data-Güte
- Open Government
- Government 2.0
- ePartizipation
Daten (data – Latein, Plural von Datum) meint gruppierte Informationen; wörtliche Bedeutung: etwas Gegebenes, Gegebenheit.
Datei (im Engl. “file”) ist ein Kunstwort aus Daten und Kartei.
Open - englisch für offen, meint vor allem allgemeine Zugänglichkeit. Mit “Open” wird signalisiert, dass eine kostenfreie Weiternutzung möglich ist (siehe z.B. Open Office); also kein klassisches Copyright mit der Software oder Information verbunden ist. Die Nutzung erfolgt über ein Lizenzmodell wie Creative Commons, das die Bedigungen der Verwendung regelt. Für Open Data gibt es mittlerweile verschiedene Lizenzmodelle, beispielsweise die Open Database License (ODbL).
“Offen” muss nicht “frei” bedeuten, die Nutzung kann eingeschränkt sein und beispielsweise eine kommerzielle Verwendung untersagen. Dagegen sind Werke, die als “Public Domain” gekennzeichnet sind, ein Gemeingut und frei für jeden Zweck nutzbar. Als Faustformel mag gelten: Ist etwas nicht kostenfrei und/oder nicht weiternutzbar und/oder liegt nicht in einem offenen Format vor – dann ist es nicht „open“.
Open Data bezeichnet ein Prinzip oder eine Kultur. Bezieht es sich auf die Veröffentlichung von Datensätzen, meint es strukturierte, maschinenlesbare und gerne über eine offene API/Schnittstelle abrufbare Informationen. Oft wird der Begriff synonym für “Open Government Data” benutzt. Letzteres meint Datensätze aus der öffentlichen Hand (Politik, Verwaltung). Open Data kann aber auch von Wissenschaft, Wirtschaft, Nichtregierungsorganisationen (NGO) oder Privatpersonen praktiziert werden.
In der Regel geht es bei Open Data um nicht-personenbezogene Daten oder zumindest anonymisierte Daten. Ein Open-Data-Angebot lässt sich im Netz vor allem daran erkennen, das es erlaubt, die Rohdaten herunterzuladen oder per Schnittstelle abzufragen.
[weiter...]

Stechuhr im VW-Werk Wolfsburg in den 70er Jahren
Früher war es die Stechuhr. Ein Zeiterfassungssystem, das automatisch Anfang und Ende der Arbeitszeit festhielt. Im digitalen Zeitalter lässt sich nahezu jeder Tastenschlag, jeder Mausklick oder schlicht jede Interaktion mit einem digitalen Gerät aufzeichnen. Frank Rieger vom Chaos Computer Club fasste das vor einiger Zeit in seinem Text “Der Mensch wird zum Datensatz” gut zusammen.
Doch immer mehr Leute messen freiwillig ihr Verhalten. Oder besser: Lassen messen. Zahlreiche Dienste im Internet bieten die Erfassung persönlicher Daten und deren Auswertung an. Seien es Jogger, die ihre Laufstrecken aufnehmen. Andere beobachten ihr Finanzhandeln, halten ihre Reisebewegungen fest oder monitoren ihr Schlafverhalten.
Eine zentrale Rolle kommt dabei den Mobiltelefonen zu. Sie werden in der Regel nur von einer Person genutzt, bleiben nahezu immer in unmittelbarer Umgebung derselben und werden immer seltener ausgeschaltet. Neuere Modelle besitzen Internetanbindung, GPS, einen Kompass und Beschleunigungssensoren.
Aufgeschreckt durch die heimlichen Aufzeichnungen der iPhone Software, die unlängst einer breiten Öffentlichkeit bekannt wurde, haben sich die Nutzer in den letzten Tagen viele Gedanken über persönliche Daten gemacht. Erfreulicherweise wird im Zusammenhang mit dieser Thematik auch immer wieder auf die Berichterstattung von ZEIT ONLINE und die Mobilfunkdaten des Grünen-Politikers Malte Spitz hingewiesen. Um die Visualisierung vieler solcher Mobilfunkdaten umzusetzen, bittet das eben gestartete Projekt Crowdflow um Spenden solcher iPhone-Datensätze, um ein “geo-soziales Netzwerkexperiment” umzusetzen.
Manche sind sich sicher, dass solch persönliche Datensätze Goldminen sind, die nur darauf warten, ausgebeutet zu werden. In dem lesenswerten Beitrag “The Really Smart Phone” im Wall Street Journal gibt Robert Lee Hotz einen Überblick darüber, was Forscher mit solchen Datensätzen anstellen: So wagen sie Voraussagen darüber, ob Personen gerade über Politik am Telefon debattieren, ohne den Inhalt des Gesprächs zu kennen. Oder sie prognostizieren, ob der Telefoninhaber Symptome einer Grippe zeigt.
[weiter...]

In der NYT kann jeder Hand an den Haushalt legen
Kaum ein Datensatz ist prominenter als der Haushalt eines Staates. Hier findet sich in Zahlen gegossen, wie Politik gemacht wird – zumindest quantitativ lassen sich entsprechende Schwerpunkte identifizieren. Und kaum einer ist komplexer. Kein Wunder, dass sich diverse OpenData-Projekte an diese meist riesigen Informationsmengen heranwagen, um sie zu durchdringen, aufzuarbeiten und verständlicher zu machen: In Deutschland gibt es den Offenen Haushalt; in England findet sich Where does my money go? und auch in Österreich wird sich dem Thema gewidmet.
Eine spielerische Annäherung an den Haushalt der USA bietet seit wenigen Tagen die New York Times. Unter dem Slogan “You fix the budget” wird der User aufgefordert, Haushaltsposten zu kürzen, um das Defizit der Vereinigten Staaten in den Griff zu bekommen. Ein jeder darf sich an der Lösung des Problems beteiligen.
[weiter...]
OpenData, schön und gut – aber was lässt sich damit überhaupt anfangen? Mapnificent mag als gutes Beispiel dafür herhalten, welchen informativen Mehrwert miteinander verschränkte Datensätze bieten können.
“Ich hoffe, Leute nutzen es, um die besten Plätze zum Leben, Arbeiten und Treffen zu finden”, schreibt der Macher Stefan Wehrmeyer über sein so eben veröffentlichtes Projekt. In bislang rund 20 Städten – vor allem in den USA – , aber auch in Berlin und London, lässt sich auf einer Karte herausfinden, wie schnell ein oder mehrere Personen von Punkt A nach B mit dem Nahverkehr gelangen können. Zusätzlich lassen sich beispielsweise Kaffees, Kinos, Parks oder Schwimmbäder einblenden und so feststellen, welche Orte in der Schnittmenge der Radien von zwei Personen liegen. [weiter...]
Vor einem Jahr hätte die folgende Karte recht leer ausgesehen: Doch in den vergangenen zwölf Monaten hat sich weltweit in Sachen OpenData einiges getan. Ein österreichisches Projekt hat sich die Mühe gemacht, viele staatliche und private Initiativen für Datenkataloge und Datenwettbewerbe mit “Open Government Data” zu kartieren.
Initiatoren:
ROT lokale/regionale Regierung
GRÜN – lokale/regionale NGO-Initiative
GELB nationale Regierung
TÜRKIS nationale NGO-Initiative
[weiter...]

Karten der Toten in Bagdad pro Jahr - New York Times
Was für eine Herausforderung: Knapp 400.000 Datensätze waren sinnvoll aufzubereiten. Vier bedeutende Medien – Spiegel, Guardian, New York Times und Al Jazeera - haben in der Nacht auf Samstag die Ergebnisse ihrer Heransgehensweise bei der Zähmung der Datenflut präsentiert. Ergänzend dazu bietet Wikileaks selber ein Recherchewerkzeug für die Irak Protokolle an; die Organisation verweist darüberhinaus noch auf eine Plattform für kolleborative Recherche. Im Folgenden eine Übersicht der Umsetzungen.
[weiter...]