Offene Daten – offene Gesellschaft
Kategorie:

Datensatz

Deutschland und das dicke Geschäft mit afrikanischem Land

Von 30. November 2013 um 18:08 Uhr

Deutsche Investoren sind an acht von 356 transnationalen Verträgen beteiligt, die für die Verpachtung von Land in Afrika geschlossen wurden und insgesamt eine Fläche von etwa 171.000 Hektar umfassen. Dies geht aus einer Recherche in der Datenbank Land Matrix hervor. Diese Datenbank erfasst großflächigen Landerwerb und wurde von vier internationalen Forschungsinstituten, unter anderem dem GIGA (German Institute of Global and Area Studies) und der GIZ (Deutsche Gesellschaft für Internationale Zusammenarbeit) entwickelt. Ein eher geringer Anteil, verglichen mit den führenden Investorenländern – allein die USA, die Vereinigten Arabischen Emirate, das Vereinigte Königreich und Saudi-Arabien kontrollieren zusammen 9.6 Millionen Hektar Land auf dem Afrikanischen Kontinent. Trotzdem war Deutschland bereits Gegenstand harscher Kritik bezüglich Kaweri, einer Kaffee Plantage in Uganda, die Teil der Neumann Kaffee Gruppe Hamburg war. Die im speziellen an den Bundesminister für wirtschaftliche Zusammenarbeit und Entwicklung, Dirk Niebel, gerichteten Vorwürfe, ähneln denen, die sich an andere des “Land Grabbing” Verdächtigte richten. Der Begriff “Land Grabbing” bezeichnet die Aneignung riesiger Landflächen in Entwicklungsländern bei gleichzeitiger Verletzung der Menschenrechte lokaler Gemeinschaften.

Deutschlands wichtigste Landgeschäfte in Afrika

Aus den zum jetzigen Zeitpunkt von Land Matrix erfassten Verträgen geht hervor, dass die acht von deutschen Investoren in Afrika abgeschlossenen Verträge sich auf eine Fläche von insgesamt 171.000 Hektar belaufen. Fünf Projekte haben offensichtlich bereits mit der Produktion begonnen, wohingegen drei sich offenbar erst in der Anfangsphase befinden. Die 2500 Hektar, die von Uganda an die Kaffee Gruppe verpachtet wurden -1802 davon werden genutzt- gehören offenbar zu denjenigen Projekten die bereits angelaufen sind. Vier der acht Investitionen dienen offenbar dem Anbau von Jatropha, einer Pflanze aus der Öl für die Produktion von Biodiesel gewonnen wird. An das Biotreibstoffgeschäft gekoppelt ist auch die größte Investition von 120,000 Hektar in Sambia, die sowohl an die Deutsche Firma Mann Ferrostalla als auch an Deulco, eine südafrikanische, auf erneuerbare Energien spezialisierte Firma verpachtet wurden. Letztere ist das einzige Projekt, welches auch als „Industrie“ aufgeführt ist und sich damit höchstwahrscheinlich auf die Jatropha-Öl Umwandlungsanlagen bezieht. Die anderen vier Investitionen setzen sich aus Plantagen zum Zweck der Nahrungsmittelgewinnung zusammen: Reis, Getreide, Erbsen, Korn und Kaffee.

German_land_Acquisitions

Groß angelegter Landerwerb in Afrika

Wie viele Hektar sind seit dem Beginn des “Landrauschs” insgesamt verpachtet worden? Jeder Versuch sich dem Umfang dieses Phänomens zu nähern, sieht sich unweigerlich mit einer Vielzahl widersprüchlicher Zahlenangaben konfrontiert. Die Weltbank führt 56 Millionen verpachtete Hektar allein für die Zeit zwischen 2008 und 2009 infolge der Preisexplosion bei den Nahrungsmitteln an. Das International Food Policy Institute und das Oakland Institute kommen auf 15-20 Millionen Hektar im Zeitraum von 2006 bis 2009. 2011 berechnete die erwähnte „Land Matrix“ die Größe des verpachteten Landes seit dem Jahr 2000 auf die riesige Fläche von 227 Millionen Hektar (Zum Vergleich: Deutschland umfasst 35,7 Millionen Hektar). Errechnet von nicht immer vertrauenswürdigen Quellen, wurde diese Einschätzung, nach einem Relaunch der Datenbank im Juni 2013, auf 33 Millionen Hektar, die durch unterschriebene Verträge nachgewiesen werden konnten, verringert. Dies entspricht einer Fläche etwa acht mal so groß wie die Niederlande.

„Es ist schwer zu sagen, ob diese Zahlen mit hinreichender Wahrscheinlichkeit korrekt sind“, sagt Andrea Fiorenza, Forscher der International Land Coalition und Co-Autor einer Reihe von Studien, genannt Commercial Pressure on Land, denn „manche Projekte fangen an, sehen sich dann diversen Problemen gegenüber und laufen aus und werden abgebrochen, oder ganz im Gegenteil, dehnen sich über die legalen Grenzen hinweg aus.“ Darüber hinaus verhindert mangelnde Transparenz der Regierungen in Entwicklungsländern ein klareres Bild der Situation. Das Ziel der “Land Matrix” Datenbank ist jedoch nicht, die endgütige Datenlage zu präsentieren, sondern “Trends zu erkennen, aus verschiedenen Quellen zu schöpfen und auf dem Laufenden zu bleiben.”

Erkunden sie die globale Debatte über den “Landrausch”

Für detaillierte Informationen über den groß angelegten Landerwerb wurde eine interaktive Karte erstellt, auf der Artikel zur Debatte über den Landrausch in Afrika gesammelt werden. Hier sind Dokumente der akademischen Welt, Berichte der internationalen Zivilgesellschaft, journalistische Recherchen und Stellungnahmen von Unternehmen und Institutionen zum Thema verlinkt. Außerdem ist es möglich, der Karte neue Artikel hinzuzufügen, indem dieses Formular ausgefüllt wird.

Erkunden sie die Karte durch Klicken auf die Markierungen und beteiligen sie sich an der Diskussion, indem sie die Karte, unter Angabe von Link, Ort und Quelle, mit weiteren Dokumenten verlinken, die sie für relevant in der Auseinandersetzung um Landverpachtungen auf dem Afrikanischen Kontinent halten.

Über das Projekt

Jacopo Ottaviani ist Journalist und Entwickler, spezialisiert auf Datenjournalismus. Er arbeitet für italienische und internationale Medien, unter anderem The Guardian und Al Jazeera International.Folgen Sie ihm auf Twitter: @jackottaviani

Dieser Beitrag für ZEIT ONLINE ist Teil des Innovation in Development Reporting Programms des European Journalism Centre (EJC). Zur Projektentwicklung haben außerdem Andrea Fama, Cecilia Anesi und Isacco Chiaf beigetragen. Hier geht es zur englischen Version des Beitrags.

Die Drohnen-Dokumente

Von 21. August 2013 um 12:25 Uhr

Wenn es um die Analyse von Informationen geht, sind PDFs nicht unbedingt das zugänglichste Format. Leider bestehen die Drohnen-Dokumente ausschließlich aus PDF-Dateien. Es sind insgesamt 372 Aktenordner mit teilweise mehr als 400 Seiten, von der ersten bis zur letzten Seite eingescannt und als PDF in einem Dateiordner gespeichert. Zusammen ist das Konvolut mehr als 80 Gigabyte groß. Es sind die gleichen Akten, die dem Untersuchungsausschuss des Bundestages zur Verfügung gestellt wurden, um den Fall Euro Hawk zu untersuchen.

Wegen der zum Teil schlechten Scans konnten wir die Akten nicht mit einer Texterkennungssoftware bearbeiten. Eine Datenanalyse ist daher kaum möglich, obwohl sie spannend wäre: Welche Behördenebenen wurden wann informiert, welche Mitarbeiter tauchten wo auf, zu welchen Zeitpunkten gab es die meisten Akten und warum? All diese Fragen hätten mit statistischen Mitteln untersucht werden können, wenn die Daten besser wären.

So aber blieb nur die Handarbeit. Zu sechst haben wir – Philip Faigle, Carsten Luther, Yassin Musharbash, Karsten Polke-Majewski, Thomas Wiegold und Kai Biermann – mehr als zwei Wochen lang gelesen. Allein einen Tag brauchten wir, um die Struktur der Ordner zu verstehen. Denn sie sind nicht chronologisch oder nach Abteilungen sortiert. Sondern nach den Beweisbeschlüssen, die der Untersuchungsausschuss des Bundestages formuliert hat. Die aber sind oft sehr allgemein gefasst, um möglichst viele Akten vom Verteidigungsministerium und seinen nachgeordneten Behörden zu bekommen. Beispielsweise lauten sie: “Es wird Beweis erhoben zum gesamten Untersuchungsauftrag durch Beiziehung sämtlicher Dokumente, Ausarbeitungen, Einschätzungen, Berichte o.ä. (…) zur Problematik SLWÜA zwischen dem 01.01.1999 und dem 18.08.2002″.

Die Ministerialbeamten wiederum haben offensichtlich alles zusammengesucht, was sie unter dem Stichwort Global Hawk / Euro Hawk in ihren Schränken finden konnten und das meistens unsortiert abgeliefert. Entsprechend durcheinander ist der Inhalt der Ordner.

Daher war eine gezielte Recherche nach einzelnen Ereignissen, Daten und Dokumenten unmöglich. Es blieb nur, Ordner für Ordner zu überfliegen und Seite um Seite zu lesen. Dabei stößt man auf so viele Details, dass man sich leicht für Tage darin verliert. Es braucht also Zeit.

Wir haben mit unseren Texten, die wir von heute an veröffentlichen, versucht, eine Balance zu finden. Sie sollen einen Eindruck vom Denken und Handeln der beteiligten Beamten geben und erklären, warum das Projekt Euro Hawk scheiterte, ja von Anfang an scheitern musste. Unsere Beobachtungen stützen wir mit vielen Zitaten aus den Akten.

Sämtliche Dokumente, aus denen wir zitieren, haben wir bei DocumentCloud hochgeladen, um sie allen Lesern zugänglich zu machen. Der Dienst erlaubt es, Anmerkungen und direkte Links zu einzelnen Sätzen zu hinterlegen. Auch enthält er eine Texterkennung, die aber aus den oben genannten Gründen nur schlecht funktioniert. Zusätzlich zu den zitierten haben wir Dokumente online gestellt, von denen wir glauben, dass sie für das Verständnis des ganzen Vorgangs wichtig sind. In DocumentCloud können sie nach Jahren sortiert werden. Das ermöglicht einen besseren Überblick.

Das Bild, das so entsteht, ist umfassend – vollständig ist es nicht. Von den Tausenden Akten haben wir nur einen kleinen Teil hochgeladen. Geschwärzt sind darin lediglich die Namen der Personen, um ihre Persönlichkeitsrechte zu schützen. Informationen haben wir nicht entfernt.

Noch eine Anmerkung: Die Mehrzahl der Dokumente trägt den Stempel “VS – Nur für den Dienstgebrauch”. Das ist die niedrigste Geheimhaltungsstufe, die deutsche Ämter vergeben. Die wirklich geheimen Informationen hingegen sind höher eingestuft und als “Geheim” gestempelt. Solche Akten waren in den Dateien nicht enthalten.

Kategorien: Datensatz

Deutschlands vorbildlicher Jugendarbeitsmarkt

Von 13. Februar 2013 um 14:16 Uhr

Was läuft bloß falsch in Europas Süden? In Spanien und Griechenland liegt die Jugendarbeitslosigkeit mittlerweile bei mehr als 50 Prozent. Auch in Portugal und Italien sieht es nicht besser aus. Fast jeder dritte junge Mensch zwischen 15 und 24 Jahren ist arbeitslos.

Daten als Google-Spreadsheet

Arbeitsmarktexperten sind sich einig: Die Art der Ausbildung ist das Problem. „Es gibt einen klaren Zusammenhang zwischen dem Ausbildungssystem und der Arbeitslosenquote unter jungen Menschen“, sagt die Arbeitsmarktökonomin Anne Sonnet von der Industrieländerorganisation OECD. Gerade in den Südstaaten sei die Ausbildung viel zu theorielastig und praxisfern.

Sie verweist auf Deutschland und Österreich. Beide Länder setzen auf ein duales Ausbildungssystem und weisen zugleich die niedrigsten Arbeitslosenquoten unter jungen Menschen in der EU vor. Wer hierzulande eine Lehre macht, der besucht in der Regel einige Tage in der Woche die Berufsschule, wo er theoretisches Wissen lernt. Die restlichen Tage verbringt er im Betrieb, um Praxiserfahrung zu sammeln. Sonnet hält das für den idealen Mix.

Neben Deutschland und Österreich setzen in der EU auch Dänemark und Luxemburg auf dieses Modell. Allerdings ist die Bilanz hier weniger erfolgreich. Dänemark kam im vergangenen März auf eine Jugendarbeitslosenquote von 15,1 Prozent, Luxemburg sogar auf 17,4 Prozent. Warum das so ist? Nach Einschätzung der OECD kümmern sich die Länder nicht ausreichend genug um die Qualifikation in der Schule. Gerade benachteiligten Jugendlichen mit Migrationshintergrund fehle Grundlagenwissen. Damit das duale Ausbildungssystem tatsächlich so erfolgreich sei wie in Deutschland, müsse man das verbessern.

Die Regierungen in den Südländern haben das Problem erkannt. Und es gibt erste Versuche, sich von Deutschland etwas abzuschauen. Spanien und Portugal haben etwa Ausbildungsabkommen mit Deutschland verabschiedet. Doch das Problem ist die Schuldenkrise in den Staaten. Woher das Geld für Investitionen nehmen, wenn allerorts gespart werden soll? „Die Staaten sind in der Schuldenfalle“, sagt Sonnet, „daher scheuen sie Investitionen in Bildung.“

Zudem stoßen die unterschiedlichen Interessen der Sozialpartner aufeinander. Gerade im Süden sind die Gewerkschaften stark – doch sie vertreten die Menschen, die bereits einen Job haben. Die Firmen in diesen Staaten wiederum wollen gerade in wirtschaftlich unsicheren Zeiten nicht auf die Flexibilität von befristeten Arbeitsverhältnissen und kurzfristigen Kündigungen verzichten.

Die EU verspricht derweil Geld. Rund sechs Milliarden Euro haben die Staats- und Regierungschefs vergangene Woche zur Bekämpfung der Jugendarbeitslosigkeit lockergemacht. Ist das die Lösung? Sonnet findet Strukturreformen wichtiger. „Schon vor dem Ausbruch der Krise gab es in den Krisenstaaten strukturelle Probleme auf dem Arbeitsmarkt für Jugendliche.“ Die müssten jetzt angegangen werden. „Eine Lost Generation kann sich Europa nicht leisten.“

Kategorien: Allgemein, Datensatz

Wo wird in Deutschland rechtsextrem gewählt?

Von 16. November 2012 um 10:17 Uhr

In den ostdeutschen Bundesländern breiten sich rechtsextreme Ansichten laut einer aktuellen Studie der Friedrich Ebert Stiftung massiv aus. Das war die zusammenfassende Lesart in der Berichterstattung über diese Studie. Aber wie schaut es bundesweit mit Wählerstimmen für rechtsextreme Parteien aus? Ist es wirklich in erster Linie ein Phänomen in Ostdeutschland? Eigentlich zunächst nur als Fingerübung in einem internen ZEIT ONLINE Workshop zum Thema Kartenvisualisierungen gedacht, sind wir dieser Frage nachgegangen. Aus Gründen der Vergleichbarkeit boten sich Daten der Bundestagswahl 2009 an. Gregor Aisch steuerte für den Testlauf einen Datensatz bei, der die Ergebnisse auf Wahlkreisebene auch für die kleinen Parteien enthält (im Wahlatlas des Bundeswahlleiters werden diese leider nicht aufgeführt). Im nächsten Schritt wurden daraus die Zweitstimmenanteile der rechtsextremen Parteien NPD, DVU und REP auf einer Karte visualisiert. Je nach Höhe des Stimmenanteils zeigen die Farbintensitäten der Wahlkreise sehr deutlich, wo diese Parteien bereits 2009 die meisten Wählerstimmen sammeln konnten. Die traurigen Höchstwerte erreichen übrigens die ostdeutschen Wahlkreise Sächsische Schweiz – Osterzgebirge und Görlitz mit jeweils 5,9 Prozent.

Realisiert wurde diese Karte mit karthograph.js, eine von Gregor Aisch entwickelte JavaScript Bibliothek. Sie ermöglicht es, interaktive Karten unabhängig von Google-Maps oder anderen – meist mit Details überladenen – Kartenlösungen zu realisieren. Basierend auf den beiden JavaScript-Frameworks jQuery und Raphaël werden SVG-Files (vektorbasierende Grafiken) eingelesen und gerendert. Die Lösung läuft komplett Client-basiert, jedoch werden die Karten initial von einem Python-Script generiert (im vorliegenden Beispiel ist das Shapefile der Wahlkreise des Bundeswahlleiters die Kartengrundlage). Anschließend lassen sich die Karten direkt in die eigene Seite einbauen und mit CSS stylen. Im Workshop mit Gregor Aisch haben wir uns in der ZEIT ONLINE Entwicklungsredaktion vom Potential des noch jungem Tools überzeugt und werden es gerade im Hinblick auf datenjournalistische Projekte einsetzen.

Was macht unser Leben teurer?

Von 17. September 2012 um 10:23 Uhr

In keinem Land ist die Angst vor Inflation so ausgeprägt wie in Deutschland. Mit großer Sorge wird reagiert, wenn wie im August die Verbraucherpreise weiter ansteigen. Die Jahresinflationsrate erhöhte sich von 1,7 Prozent im Juli auf 2,1 Prozent und liegt damit wieder über der Marke von zwei Prozent, bis zu der die Europäische Zentralbank von stabilen Preisen spricht. Haben wir eine grundsätzlich drastische Verteuerung von Gütern oder gibt es besondere Preistreiber?

Grundlage für die Berechnung des Verbraucherpreisindex ist ein Warenkorb, bestehend aus rund 700 Gütern. Für jedes Element – also zum Beispiel für Nahrungsmittel, Zugfahrten oder für Benzin – wird die Preisentwicklung erfasst. Die Statistiker errechnen daraus einen gewichteten Mittelwert. Die verwendeten Gewichte gelten als repräsentativ für einen durchschnittlichen Haushalt.

Wir haben einzelne Preisentwicklungen ausgehend vom Jahr 2005 ausgewählt und die Daten des Statistischen Bundesamtes im Kurvenverlauf bis August 2012 dargestellt.


Es wird deutlich, dass in diesem Achtjahreszeitraum vor allem Nahrungsmittel (+19,3 Prozent), Verkehr (+24,8 Prozent) und Wohnen (+17,9 Prozent) teurer geworden sind. Die Preise für Wohnraum und Verkehr wurden maßgeblich von den steigenden Energiekosten in die Höhe getrieben. Hinter der Lebensmittelinflation stecken mehrere Faktoren – die Energie ist einer davon.


Splittet man die wichtigsten Posten rund ums Wohnen auf, wird noch einmal die Rasanz der Verteuerung im Energiebereich deutlich. Hier machen sich stark steigende Heizölpreise und ganz besonders der Strompreisanstieg (45,2 Prozent) bemerkbar. Der Anteil steigender Mieten fällt eher moderat aus (ein Plus von neun Prozent seit 2005 entspricht einem jährlichen Anstieg von rund 1,1 Prozent).


Im Bereich Mobilität haben die Preise für Flugreisen um satte 53,1 Prozent zugelegt. Auch Bahnfahren ist in Zeiten steigender Energiepreise teurer geworden. Preise für Bahntickets legten um 25,1 Prozent zu. Die Kosten für die Anschaffung von Neuwagen haben sich hingegen in den letzten Jahren kaum erhöht. So blieb das Preisniveau bei Neuwagen seit der letzten Erhöhung des Mehrwertsteuersatzes ab Januar 2007 konstant. Zu Zeiten der sogenannten Abwrackprämie gaben die Preise für Gebrauchtwagen Anfang 2010 merklich nach, pendelten sich danach aber wieder auf das vorherige Niveau ein.

Um alle Lebensumstände zu erfassen, wird im statistischen Warenkorb auch die Entwicklung für Dienstleitungen wie “Essen auf Rädern” beobachtet. In der Entwicklungskurve zeigt sich, dass die Kostensteigerungen für Nahrungsmittel und Benzinpreise (plus 49,6 Prozent seit 2005) moderat an die Kunden weitergereicht wurden. Die Belieferung der Senioren zu Hause gehörte zu traditionellen Tätigkeiten junger Zivildienstleistender. Mit der Aussetzung der Wehrpflicht und somit auch des Zivildienstes zum Juli 2011 fiel diese günstige Beschäftigungsmöglichkeit weg. Zwischen Januar und August 2011 wurden die dadurch gestiegenen Personalkosten mit einem Anstieg von vier Prozent an die Kunden weitergegeben.


Für Entlastung im Geldbeutel haben unter anderem sinkende Preise für Festnetztelefonie und Mobilfunk gesorgt (-15,2 Prozent).

Im Warenkorb finden sich zudem einzelne Grundnahrungsmittel. Interessant ist der Blick auf zwischenzeitlich stark unterschiedliche Preisentwicklungen bei Frischmilch und Butter. Während die Erzeuger mit dem Einzelhandel für Frischmilch häufig an langfristige Verträge gebunden sind, lassen sich bei anderen Milchprodukten kurzfristige Preisanhebungen durchsetzen.

Die von Martina Schories visualisierten Daten haben wir in einem GoogleDoc zusammengefasst. Den kompletten Datensatz mit allen Einträgen des Warenkorbs gibt es kostenlos es in der GENESIS-Datenbank des Statistischen Bundesamtes.

Anspruch und Wirklichkeit − deutsche Medaillenerfolge nach Sportarten

Von 13. August 2012 um 14:14 Uhr

Die deutsche Olympiamannschaft kehrt mit einer durchwachsenen Bilanz aus London zurück. Auch wenn die Zahl der gewonnenen Medaillen (44) die der Spiele in Peking um drei übertrifft, enttäuschten einige erfolgsverwöhnte Sportarten. Wir haben die deutschen Medaillengewinne der Sommerspiele von 1952 bis 2012 für die einzelnen Sportarten ausgewertet. Dabei weisen wir die von DDR-Sportlern errungenen Erfolge gesondert aus.

Zum Abschluss der Spiele in London sorgten die Medaillenziele, die zwischen dem Deutschen Olympischen Sportbund und den Fachverbänden ausgehandelt wurden, für Aufsehen. Die Veröffentlichung wurde durch juristischen Druck erzwungen. Die für London 2012 genannten Leistungsziele wirken im historischen aber auch aktuellen Kontext sehr unrealistisch. Die 86 anvisierten Medaillen wurden noch nicht einmal 1992 bei den Spielen in Barcelona erreicht. Damals profitierte die gesamtdeutsche Mannschaft bei 82 gewonnen Medaillen neben der Wiedervereinigungseuphorie auch noch vom frischen Erbe der Kaderschmieden des DDR-Sports.

Die Sportarten sind in der Reihenfolge der seit 1952 gewonnen Medaillen visualisiert.

Grundlage für die historischen Daten ist die Wikipedialiste mit allen bisherigen deutschen Medaillengewinnern sowie die Datenbank des Internationalen Olympischen Komitees. Da beide Quellen jeweils einzelne Athleten aufführen, mussten die Daten der Teamdisziplinen medaillenspiegel-konform normalisiert werden (z.B. der erfolgreiche Ruderachter umfasst neun Sportlernamen, die dann zu einer gewonnen Medaille zusammengefasst wurden). Die 2012er Ergebnisse wurden der offiziellen Website der Spiele in London entnommen.

Die verwendeten Daten haben wir hier in diesem GoogleDoc zusammengefasst.

Offene Daten als Werbung

Von 12. März 2012 um 09:49 Uhr

Prozentualer Anteil der Bevölkerung, der älter als 65 Jahre ist - Screenshot einer Grafik vom Datenportal Europe eXplorer

Die 2010 gegründete schwedische Firma NComVA ist eine Ausgründung des National Center for Visual Analytics der Universität Linköping. NComVA beschäftigt sich damit, Dinge zu visualisieren, also grafisch darzustellen, seien es städtische Strukturen oder demografische Daten. Man wolle, so steht es in der Selbstbeschreibung, statistische Informationen so gut wie nur möglich zugänglich machen, damit sie verstanden werden können.

Wie so etwas aussehen kann, zeigt das Unternehmen beispielsweise anhand der europäischen Bevölkerungsstatistik. Unter dem Titel “Europa eXplorer” ist die Altersstruktur der EU-Länder auf vielfältige Weise verarbeitet.

Auf Karten, Diagrammen und Punktwolken ist zu beobachten, wie sich Junge und Alte in Europa verteilen: Irland und Polen sind jung, Deutschland, Italien und Griechenland sind alt.

Der Nutzer kann selbst mit den Daten herumfummeln, kann verschiedene Darstellungsformen wählen, Filter darüber legen oder neue Kategorien hinzufügen und anzeigen lassen.

Die verwendeten Rohdaten sind frei und können heruntergeladen werden.

Außerdem kann die Plattform genutzt werden, um eigene Daten darzustellen. Hochgeladen werden können Daten im Excel- und im PC-Axis-Format.

Das Unternehmen bietet viele weitere Grafiken an. Beispielsweise eine, die den globalen Handel der USA mit OECD-Staaten darstellt, oder eine über Geburtenraten.

Das Ganze ist selbstverständlich Werbung für die Produkte der Firma. Aber es ist gute Werbung, lässt sie dem Nutzer doch die Freiheit, herumzuprobieren und Daten zu importieren und zu exportieren.

Kategorien: Datenprojekt, Datensatz

Ein Glossar rund um Open Data

Von 13. Mai 2011 um 16:21 Uhr

Die Idee Open Data ist vergleichsweise jung und werden die Begriffe, die damit verbunden sind, längst nicht von allen gleich interpretiert. Der folgende Artikel ist der Versuch eines Glossars, er will Schlüsselworte rund um Standards, Datenformate und Datenarten auflisten und erläutern.

Überblick der Begriffe des Glossars:

  • Daten
  • Datei
  • Open
  • Open Data
  • Schnittstelle/API
  • Formate
  • Rohdaten
  • Scraper
  • Parser
  • Datensatztypen
  • Open-Data-Güte
  • Open Government
  • Government 2.0
  • ePartizipation

Daten (data – Latein, Plural von Datum) meint gruppierte Informationen; wörtliche Bedeutung: etwas Gegebenes, Gegebenheit.

Datei (im Engl. “file”) ist ein Kunstwort aus Daten und Kartei.

Open - englisch für offen, meint vor allem allgemeine Zugänglichkeit. Mit “Open” wird signalisiert, dass eine kostenfreie Weiternutzung möglich ist (siehe z.B. Open Office); also kein klassisches Copyright mit der Software oder Information verbunden ist. Die Nutzung erfolgt über ein Lizenzmodell wie Creative Commons, das die Bedigungen der Verwendung regelt. Für Open Data gibt es mittlerweile verschiedene Lizenzmodelle, beispielsweise die Open Database License (ODbL).

“Offen” muss nicht “frei” bedeuten, die Nutzung kann eingeschränkt sein und beispielsweise eine kommerzielle Verwendung untersagen. Dagegen sind Werke, die als “Public Domain” gekennzeichnet sind, ein Gemeingut und frei für jeden Zweck nutzbar. Als Faustformel mag gelten: Ist etwas nicht kostenfrei und/oder nicht weiternutzbar und/oder liegt nicht in einem offenen Format vor – dann ist es nicht „open“.

Open Data bezeichnet ein Prinzip oder eine Kultur. Bezieht es sich auf die Veröffentlichung von Datensätzen, meint es strukturierte, maschinenlesbare und gerne über eine offene API/Schnittstelle abrufbare Informationen. Oft wird der Begriff synonym für “Open Government Data” benutzt. Letzteres meint Datensätze aus der öffentlichen Hand (Politik, Verwaltung). Open Data kann aber auch von Wissenschaft, Wirtschaft, Nichtregierungsorganisationen (NGO) oder Privatpersonen praktiziert werden.

In der Regel geht es bei Open Data um nicht-personenbezogene Daten oder zumindest anonymisierte Daten. Ein Open-Data-Angebot lässt sich im Netz vor allem daran erkennen, das es erlaubt, die Rohdaten herunterzuladen oder per Schnittstelle abzufragen.

Weiter…

Kategorien: Datenquelle, Datensatz

Die eigenen Nutzungsdaten als Entscheidungshilfe

Von 27. April 2011 um 17:13 Uhr
vw stechuhr

Stechuhr im VW-Werk Wolfsburg in den 70er Jahren

Früher war es die Stechuhr. Ein Zeiterfassungssystem, das automatisch Anfang und Ende der Arbeitszeit festhielt. Im digitalen Zeitalter lässt sich nahezu jeder Tastenschlag, jeder Mausklick oder schlicht jede Interaktion mit einem digitalen Gerät aufzeichnen. Frank Rieger vom Chaos Computer Club fasste das vor einiger Zeit in seinem Text “Der Mensch wird zum Datensatz” gut zusammen.

Doch immer mehr Leute messen freiwillig ihr Verhalten. Oder besser: Lassen messen. Zahlreiche Dienste im Internet bieten die Erfassung persönlicher Daten und deren Auswertung an. Seien es Jogger, die ihre Laufstrecken aufnehmen. Andere beobachten ihr Finanzhandeln, halten ihre Reisebewegungen fest oder monitoren ihr Schlafverhalten.

Eine zentrale Rolle kommt dabei den Mobiltelefonen zu. Sie werden in der Regel nur von einer Person genutzt, bleiben nahezu immer in unmittelbarer Umgebung derselben und werden immer seltener ausgeschaltet. Neuere Modelle besitzen Internetanbindung, GPS, einen Kompass und Beschleunigungssensoren.

Aufgeschreckt durch die heimlichen Aufzeichnungen der iPhone Software, die unlängst einer breiten Öffentlichkeit bekannt wurde, haben sich die Nutzer in den letzten Tagen viele Gedanken über persönliche Daten gemacht. Erfreulicherweise wird im Zusammenhang mit dieser Thematik auch immer wieder auf die Berichterstattung von ZEIT ONLINE und die Mobilfunkdaten des Grünen-Politikers Malte Spitz hingewiesen. Um die Visualisierung vieler solcher Mobilfunkdaten umzusetzen, bittet das eben gestartete Projekt Crowdflow um Spenden solcher iPhone-Datensätze, um ein “geo-soziales Netzwerkexperiment” umzusetzen.

Manche sind sich sicher, dass solch persönliche Datensätze Goldminen sind, die nur darauf warten, ausgebeutet zu werden. In dem lesenswerten Beitrag “The Really Smart Phone” im Wall Street Journal gibt Robert Lee Hotz einen Überblick darüber, was Forscher mit solchen Datensätzen anstellen: So wagen sie Voraussagen darüber, ob Personen gerade über Politik am Telefon debattieren, ohne den Inhalt des Gesprächs zu kennen. Oder sie prognostizieren, ob der Telefoninhaber Symptome einer Grippe zeigt.

Weiter…

Spiel mit dem Haushalt

Von 16. November 2010 um 12:12 Uhr
Haushalt Newsgame NYT Budget

In der NYT kann jeder Hand an den Haushalt legen

Kaum ein Datensatz ist prominenter als der Haushalt eines Staates. Hier findet sich in Zahlen gegossen, wie Politik gemacht wird – zumindest quantitativ lassen sich entsprechende Schwerpunkte identifizieren. Und kaum einer ist komplexer. Kein Wunder, dass sich diverse OpenData-Projekte an diese meist riesigen Informationsmengen heranwagen, um sie zu durchdringen, aufzuarbeiten und verständlicher zu machen: In Deutschland gibt es den Offenen Haushalt; in England findet sich Where does my money go? und auch in Österreich wird sich dem Thema gewidmet.

Eine spielerische Annäherung an den Haushalt der USA bietet seit wenigen Tagen die New York Times. Unter dem Slogan “You fix the budget” wird der User aufgefordert, Haushaltsposten zu kürzen, um das Defizit der Vereinigten Staaten in den Griff zu bekommen. Ein jeder darf sich an der Lösung des Problems beteiligen.

Weiter…