Offene Daten – offene Gesellschaft
Kategorie:

Datensatz

Deutschlands vorbildlicher Jugendarbeitsmarkt

Von 13. Februar 2013 um 14:16 Uhr

Was läuft bloß falsch in Europas Süden? In Spanien und Griechenland liegt die Jugendarbeitslosigkeit mittlerweile bei mehr als 50 Prozent. Auch in Portugal und Italien sieht es nicht besser aus. Fast jeder dritte junge Mensch zwischen 15 und 24 Jahren ist arbeitslos.

Daten als Google-Spreadsheet

Arbeitsmarktexperten sind sich einig: Die Art der Ausbildung ist das Problem. „Es gibt einen klaren Zusammenhang zwischen dem Ausbildungssystem und der Arbeitslosenquote unter jungen Menschen“, sagt die Arbeitsmarktökonomin Anne Sonnet von der Industrieländerorganisation OECD. Gerade in den Südstaaten sei die Ausbildung viel zu theorielastig und praxisfern.

Sie verweist auf Deutschland und Österreich. Beide Länder setzen auf ein duales Ausbildungssystem und weisen zugleich die niedrigsten Arbeitslosenquoten unter jungen Menschen in der EU vor. Wer hierzulande eine Lehre macht, der besucht in der Regel einige Tage in der Woche die Berufsschule, wo er theoretisches Wissen lernt. Die restlichen Tage verbringt er im Betrieb, um Praxiserfahrung zu sammeln. Sonnet hält das für den idealen Mix.

Neben Deutschland und Österreich setzen in der EU auch Dänemark und Luxemburg auf dieses Modell. Allerdings ist die Bilanz hier weniger erfolgreich. Dänemark kam im vergangenen März auf eine Jugendarbeitslosenquote von 15,1 Prozent, Luxemburg sogar auf 17,4 Prozent. Warum das so ist? Nach Einschätzung der OECD kümmern sich die Länder nicht ausreichend genug um die Qualifikation in der Schule. Gerade benachteiligten Jugendlichen mit Migrationshintergrund fehle Grundlagenwissen. Damit das duale Ausbildungssystem tatsächlich so erfolgreich sei wie in Deutschland, müsse man das verbessern.

Die Regierungen in den Südländern haben das Problem erkannt. Und es gibt erste Versuche, sich von Deutschland etwas abzuschauen. Spanien und Portugal haben etwa Ausbildungsabkommen mit Deutschland verabschiedet. Doch das Problem ist die Schuldenkrise in den Staaten. Woher das Geld für Investitionen nehmen, wenn allerorts gespart werden soll? „Die Staaten sind in der Schuldenfalle“, sagt Sonnet, „daher scheuen sie Investitionen in Bildung.“

Zudem stoßen die unterschiedlichen Interessen der Sozialpartner aufeinander. Gerade im Süden sind die Gewerkschaften stark – doch sie vertreten die Menschen, die bereits einen Job haben. Die Firmen in diesen Staaten wiederum wollen gerade in wirtschaftlich unsicheren Zeiten nicht auf die Flexibilität von befristeten Arbeitsverhältnissen und kurzfristigen Kündigungen verzichten.

Die EU verspricht derweil Geld. Rund sechs Milliarden Euro haben die Staats- und Regierungschefs vergangene Woche zur Bekämpfung der Jugendarbeitslosigkeit lockergemacht. Ist das die Lösung? Sonnet findet Strukturreformen wichtiger. „Schon vor dem Ausbruch der Krise gab es in den Krisenstaaten strukturelle Probleme auf dem Arbeitsmarkt für Jugendliche.“ Die müssten jetzt angegangen werden. „Eine Lost Generation kann sich Europa nicht leisten.“

Kategorien: Allgemein, Datensatz

Wo wird in Deutschland rechtsextrem gewählt?

Von 16. November 2012 um 10:17 Uhr

In den ostdeutschen Bundesländern breiten sich rechtsextreme Ansichten laut einer aktuellen Studie der Friedrich Ebert Stiftung massiv aus. Das war die zusammenfassende Lesart in der Berichterstattung über diese Studie. Aber wie schaut es bundesweit mit Wählerstimmen für rechtsextreme Parteien aus? Ist es wirklich in erster Linie ein Phänomen in Ostdeutschland? Eigentlich zunächst nur als Fingerübung in einem internen ZEIT ONLINE Workshop zum Thema Kartenvisualisierungen gedacht, sind wir dieser Frage nachgegangen. Aus Gründen der Vergleichbarkeit boten sich Daten der Bundestagswahl 2009 an. Gregor Aisch steuerte für den Testlauf einen Datensatz bei, der die Ergebnisse auf Wahlkreisebene auch für die kleinen Parteien enthält (im Wahlatlas des Bundeswahlleiters werden diese leider nicht aufgeführt). Im nächsten Schritt wurden daraus die Zweitstimmenanteile der rechtsextremen Parteien NPD, DVU und REP auf einer Karte visualisiert. Je nach Höhe des Stimmenanteils zeigen die Farbintensitäten der Wahlkreise sehr deutlich, wo diese Parteien bereits 2009 die meisten Wählerstimmen sammeln konnten. Die traurigen Höchstwerte erreichen übrigens die ostdeutschen Wahlkreise Sächsische Schweiz – Osterzgebirge und Görlitz mit jeweils 5,9 Prozent.

Realisiert wurde diese Karte mit karthograph.js, eine von Gregor Aisch entwickelte JavaScript Bibliothek. Sie ermöglicht es, interaktive Karten unabhängig von Google-Maps oder anderen – meist mit Details überladenen – Kartenlösungen zu realisieren. Basierend auf den beiden JavaScript-Frameworks jQuery und Raphaël werden SVG-Files (vektorbasierende Grafiken) eingelesen und gerendert. Die Lösung läuft komplett Client-basiert, jedoch werden die Karten initial von einem Python-Script generiert (im vorliegenden Beispiel ist das Shapefile der Wahlkreise des Bundeswahlleiters die Kartengrundlage). Anschließend lassen sich die Karten direkt in die eigene Seite einbauen und mit CSS stylen. Im Workshop mit Gregor Aisch haben wir uns in der ZEIT ONLINE Entwicklungsredaktion vom Potential des noch jungem Tools überzeugt und werden es gerade im Hinblick auf datenjournalistische Projekte einsetzen.

Was macht unser Leben teurer?

Von 17. September 2012 um 10:23 Uhr

In keinem Land ist die Angst vor Inflation so ausgeprägt wie in Deutschland. Mit großer Sorge wird reagiert, wenn wie im August die Verbraucherpreise weiter ansteigen. Die Jahresinflationsrate erhöhte sich von 1,7 Prozent im Juli auf 2,1 Prozent und liegt damit wieder über der Marke von zwei Prozent, bis zu der die Europäische Zentralbank von stabilen Preisen spricht. Haben wir eine grundsätzlich drastische Verteuerung von Gütern oder gibt es besondere Preistreiber?

Grundlage für die Berechnung des Verbraucherpreisindex ist ein Warenkorb, bestehend aus rund 700 Gütern. Für jedes Element – also zum Beispiel für Nahrungsmittel, Zugfahrten oder für Benzin – wird die Preisentwicklung erfasst. Die Statistiker errechnen daraus einen gewichteten Mittelwert. Die verwendeten Gewichte gelten als repräsentativ für einen durchschnittlichen Haushalt.

Wir haben einzelne Preisentwicklungen ausgehend vom Jahr 2005 ausgewählt und die Daten des Statistischen Bundesamtes im Kurvenverlauf bis August 2012 dargestellt.


Es wird deutlich, dass in diesem Achtjahreszeitraum vor allem Nahrungsmittel (+19,3 Prozent), Verkehr (+24,8 Prozent) und Wohnen (+17,9 Prozent) teurer geworden sind. Die Preise für Wohnraum und Verkehr wurden maßgeblich von den steigenden Energiekosten in die Höhe getrieben. Hinter der Lebensmittelinflation stecken mehrere Faktoren – die Energie ist einer davon.


Splittet man die wichtigsten Posten rund ums Wohnen auf, wird noch einmal die Rasanz der Verteuerung im Energiebereich deutlich. Hier machen sich stark steigende Heizölpreise und ganz besonders der Strompreisanstieg (45,2 Prozent) bemerkbar. Der Anteil steigender Mieten fällt eher moderat aus (ein Plus von neun Prozent seit 2005 entspricht einem jährlichen Anstieg von rund 1,1 Prozent).


Im Bereich Mobilität haben die Preise für Flugreisen um satte 53,1 Prozent zugelegt. Auch Bahnfahren ist in Zeiten steigender Energiepreise teurer geworden. Preise für Bahntickets legten um 25,1 Prozent zu. Die Kosten für die Anschaffung von Neuwagen haben sich hingegen in den letzten Jahren kaum erhöht. So blieb das Preisniveau bei Neuwagen seit der letzten Erhöhung des Mehrwertsteuersatzes ab Januar 2007 konstant. Zu Zeiten der sogenannten Abwrackprämie gaben die Preise für Gebrauchtwagen Anfang 2010 merklich nach, pendelten sich danach aber wieder auf das vorherige Niveau ein.

Um alle Lebensumstände zu erfassen, wird im statistischen Warenkorb auch die Entwicklung für Dienstleitungen wie “Essen auf Rädern” beobachtet. In der Entwicklungskurve zeigt sich, dass die Kostensteigerungen für Nahrungsmittel und Benzinpreise (plus 49,6 Prozent seit 2005) moderat an die Kunden weitergereicht wurden. Die Belieferung der Senioren zu Hause gehörte zu traditionellen Tätigkeiten junger Zivildienstleistender. Mit der Aussetzung der Wehrpflicht und somit auch des Zivildienstes zum Juli 2011 fiel diese günstige Beschäftigungsmöglichkeit weg. Zwischen Januar und August 2011 wurden die dadurch gestiegenen Personalkosten mit einem Anstieg von vier Prozent an die Kunden weitergegeben.


Für Entlastung im Geldbeutel haben unter anderem sinkende Preise für Festnetztelefonie und Mobilfunk gesorgt (-15,2 Prozent).

Im Warenkorb finden sich zudem einzelne Grundnahrungsmittel. Interessant ist der Blick auf zwischenzeitlich stark unterschiedliche Preisentwicklungen bei Frischmilch und Butter. Während die Erzeuger mit dem Einzelhandel für Frischmilch häufig an langfristige Verträge gebunden sind, lassen sich bei anderen Milchprodukten kurzfristige Preisanhebungen durchsetzen.

Die von Martina Schories visualisierten Daten haben wir in einem GoogleDoc zusammengefasst. Den kompletten Datensatz mit allen Einträgen des Warenkorbs gibt es kostenlos es in der GENESIS-Datenbank des Statistischen Bundesamtes.

Anspruch und Wirklichkeit − deutsche Medaillenerfolge nach Sportarten

Von 13. August 2012 um 14:14 Uhr

Die deutsche Olympiamannschaft kehrt mit einer durchwachsenen Bilanz aus London zurück. Auch wenn die Zahl der gewonnenen Medaillen (44) die der Spiele in Peking um drei übertrifft, enttäuschten einige erfolgsverwöhnte Sportarten. Wir haben die deutschen Medaillengewinne der Sommerspiele von 1952 bis 2012 für die einzelnen Sportarten ausgewertet. Dabei weisen wir die von DDR-Sportlern errungenen Erfolge gesondert aus.

Zum Abschluss der Spiele in London sorgten die Medaillenziele, die zwischen dem Deutschen Olympischen Sportbund und den Fachverbänden ausgehandelt wurden, für Aufsehen. Die Veröffentlichung wurde durch juristischen Druck erzwungen. Die für London 2012 genannten Leistungsziele wirken im historischen aber auch aktuellen Kontext sehr unrealistisch. Die 86 anvisierten Medaillen wurden noch nicht einmal 1992 bei den Spielen in Barcelona erreicht. Damals profitierte die gesamtdeutsche Mannschaft bei 82 gewonnen Medaillen neben der Wiedervereinigungseuphorie auch noch vom frischen Erbe der Kaderschmieden des DDR-Sports.

Die Sportarten sind in der Reihenfolge der seit 1952 gewonnen Medaillen visualisiert.

Grundlage für die historischen Daten ist die Wikipedialiste mit allen bisherigen deutschen Medaillengewinnern sowie die Datenbank des Internationalen Olympischen Komitees. Da beide Quellen jeweils einzelne Athleten aufführen, mussten die Daten der Teamdisziplinen medaillenspiegel-konform normalisiert werden (z.B. der erfolgreiche Ruderachter umfasst neun Sportlernamen, die dann zu einer gewonnen Medaille zusammengefasst wurden). Die 2012er Ergebnisse wurden der offiziellen Website der Spiele in London entnommen.

Die verwendeten Daten haben wir hier in diesem GoogleDoc zusammengefasst.

Offene Daten als Werbung

Von 12. März 2012 um 09:49 Uhr

Prozentualer Anteil der Bevölkerung, der älter als 65 Jahre ist - Screenshot einer Grafik vom Datenportal Europe eXplorer

Die 2010 gegründete schwedische Firma NComVA ist eine Ausgründung des National Center for Visual Analytics der Universität Linköping. NComVA beschäftigt sich damit, Dinge zu visualisieren, also grafisch darzustellen, seien es städtische Strukturen oder demografische Daten. Man wolle, so steht es in der Selbstbeschreibung, statistische Informationen so gut wie nur möglich zugänglich machen, damit sie verstanden werden können.

Wie so etwas aussehen kann, zeigt das Unternehmen beispielsweise anhand der europäischen Bevölkerungsstatistik. Unter dem Titel “Europa eXplorer” ist die Altersstruktur der EU-Länder auf vielfältige Weise verarbeitet.

Auf Karten, Diagrammen und Punktwolken ist zu beobachten, wie sich Junge und Alte in Europa verteilen: Irland und Polen sind jung, Deutschland, Italien und Griechenland sind alt.

Der Nutzer kann selbst mit den Daten herumfummeln, kann verschiedene Darstellungsformen wählen, Filter darüber legen oder neue Kategorien hinzufügen und anzeigen lassen.

Die verwendeten Rohdaten sind frei und können heruntergeladen werden.

Außerdem kann die Plattform genutzt werden, um eigene Daten darzustellen. Hochgeladen werden können Daten im Excel- und im PC-Axis-Format.

Das Unternehmen bietet viele weitere Grafiken an. Beispielsweise eine, die den globalen Handel der USA mit OECD-Staaten darstellt, oder eine über Geburtenraten.

Das Ganze ist selbstverständlich Werbung für die Produkte der Firma. Aber es ist gute Werbung, lässt sie dem Nutzer doch die Freiheit, herumzuprobieren und Daten zu importieren und zu exportieren.

Kategorien: Datenprojekt, Datensatz

Ein Glossar rund um Open Data

Von 13. Mai 2011 um 16:21 Uhr

Die Idee Open Data ist vergleichsweise jung und werden die Begriffe, die damit verbunden sind, längst nicht von allen gleich interpretiert. Der folgende Artikel ist der Versuch eines Glossars, er will Schlüsselworte rund um Standards, Datenformate und Datenarten auflisten und erläutern.

Überblick der Begriffe des Glossars:

  • Daten
  • Datei
  • Open
  • Open Data
  • Schnittstelle/API
  • Formate
  • Rohdaten
  • Scraper
  • Parser
  • Datensatztypen
  • Open-Data-Güte
  • Open Government
  • Government 2.0
  • ePartizipation

Daten (data – Latein, Plural von Datum) meint gruppierte Informationen; wörtliche Bedeutung: etwas Gegebenes, Gegebenheit.

Datei (im Engl. “file”) ist ein Kunstwort aus Daten und Kartei.

Open - englisch für offen, meint vor allem allgemeine Zugänglichkeit. Mit “Open” wird signalisiert, dass eine kostenfreie Weiternutzung möglich ist (siehe z.B. Open Office); also kein klassisches Copyright mit der Software oder Information verbunden ist. Die Nutzung erfolgt über ein Lizenzmodell wie Creative Commons, das die Bedigungen der Verwendung regelt. Für Open Data gibt es mittlerweile verschiedene Lizenzmodelle, beispielsweise die Open Database License (ODbL).

“Offen” muss nicht “frei” bedeuten, die Nutzung kann eingeschränkt sein und beispielsweise eine kommerzielle Verwendung untersagen. Dagegen sind Werke, die als “Public Domain” gekennzeichnet sind, ein Gemeingut und frei für jeden Zweck nutzbar. Als Faustformel mag gelten: Ist etwas nicht kostenfrei und/oder nicht weiternutzbar und/oder liegt nicht in einem offenen Format vor – dann ist es nicht „open“.

Open Data bezeichnet ein Prinzip oder eine Kultur. Bezieht es sich auf die Veröffentlichung von Datensätzen, meint es strukturierte, maschinenlesbare und gerne über eine offene API/Schnittstelle abrufbare Informationen. Oft wird der Begriff synonym für “Open Government Data” benutzt. Letzteres meint Datensätze aus der öffentlichen Hand (Politik, Verwaltung). Open Data kann aber auch von Wissenschaft, Wirtschaft, Nichtregierungsorganisationen (NGO) oder Privatpersonen praktiziert werden.

In der Regel geht es bei Open Data um nicht-personenbezogene Daten oder zumindest anonymisierte Daten. Ein Open-Data-Angebot lässt sich im Netz vor allem daran erkennen, das es erlaubt, die Rohdaten herunterzuladen oder per Schnittstelle abzufragen.

Weiter…

Kategorien: Datenquelle, Datensatz

Die eigenen Nutzungsdaten als Entscheidungshilfe

Von 27. April 2011 um 17:13 Uhr
vw stechuhr

Stechuhr im VW-Werk Wolfsburg in den 70er Jahren

Früher war es die Stechuhr. Ein Zeiterfassungssystem, das automatisch Anfang und Ende der Arbeitszeit festhielt. Im digitalen Zeitalter lässt sich nahezu jeder Tastenschlag, jeder Mausklick oder schlicht jede Interaktion mit einem digitalen Gerät aufzeichnen. Frank Rieger vom Chaos Computer Club fasste das vor einiger Zeit in seinem Text “Der Mensch wird zum Datensatz” gut zusammen.

Doch immer mehr Leute messen freiwillig ihr Verhalten. Oder besser: Lassen messen. Zahlreiche Dienste im Internet bieten die Erfassung persönlicher Daten und deren Auswertung an. Seien es Jogger, die ihre Laufstrecken aufnehmen. Andere beobachten ihr Finanzhandeln, halten ihre Reisebewegungen fest oder monitoren ihr Schlafverhalten.

Eine zentrale Rolle kommt dabei den Mobiltelefonen zu. Sie werden in der Regel nur von einer Person genutzt, bleiben nahezu immer in unmittelbarer Umgebung derselben und werden immer seltener ausgeschaltet. Neuere Modelle besitzen Internetanbindung, GPS, einen Kompass und Beschleunigungssensoren.

Aufgeschreckt durch die heimlichen Aufzeichnungen der iPhone Software, die unlängst einer breiten Öffentlichkeit bekannt wurde, haben sich die Nutzer in den letzten Tagen viele Gedanken über persönliche Daten gemacht. Erfreulicherweise wird im Zusammenhang mit dieser Thematik auch immer wieder auf die Berichterstattung von ZEIT ONLINE und die Mobilfunkdaten des Grünen-Politikers Malte Spitz hingewiesen. Um die Visualisierung vieler solcher Mobilfunkdaten umzusetzen, bittet das eben gestartete Projekt Crowdflow um Spenden solcher iPhone-Datensätze, um ein “geo-soziales Netzwerkexperiment” umzusetzen.

Manche sind sich sicher, dass solch persönliche Datensätze Goldminen sind, die nur darauf warten, ausgebeutet zu werden. In dem lesenswerten Beitrag “The Really Smart Phone” im Wall Street Journal gibt Robert Lee Hotz einen Überblick darüber, was Forscher mit solchen Datensätzen anstellen: So wagen sie Voraussagen darüber, ob Personen gerade über Politik am Telefon debattieren, ohne den Inhalt des Gesprächs zu kennen. Oder sie prognostizieren, ob der Telefoninhaber Symptome einer Grippe zeigt.

Weiter…

Spiel mit dem Haushalt

Von 16. November 2010 um 12:12 Uhr
Haushalt Newsgame NYT Budget

In der NYT kann jeder Hand an den Haushalt legen

Kaum ein Datensatz ist prominenter als der Haushalt eines Staates. Hier findet sich in Zahlen gegossen, wie Politik gemacht wird – zumindest quantitativ lassen sich entsprechende Schwerpunkte identifizieren. Und kaum einer ist komplexer. Kein Wunder, dass sich diverse OpenData-Projekte an diese meist riesigen Informationsmengen heranwagen, um sie zu durchdringen, aufzuarbeiten und verständlicher zu machen: In Deutschland gibt es den Offenen Haushalt; in England findet sich Where does my money go? und auch in Österreich wird sich dem Thema gewidmet.

Eine spielerische Annäherung an den Haushalt der USA bietet seit wenigen Tagen die New York Times. Unter dem Slogan “You fix the budget” wird der User aufgefordert, Haushaltsposten zu kürzen, um das Defizit der Vereinigten Staaten in den Griff zu bekommen. Ein jeder darf sich an der Lösung des Problems beteiligen.

Weiter…

Schöner Wohnen: Entscheidungshelfer

Von 2. November 2010 um 14:00 Uhr

OpenData, schön und gut – aber was lässt sich damit überhaupt anfangen? Mapnificent mag als gutes Beispiel dafür herhalten, welchen informativen Mehrwert miteinander verschränkte Datensätze bieten können.

“Ich hoffe, Leute nutzen es, um die besten Plätze zum Leben, Arbeiten und Treffen zu finden”, schreibt der Macher Stefan Wehrmeyer über sein so eben veröffentlichtes Projekt. In bislang rund 20 Städten – vor allem in den USA – , aber auch in Berlin und London, lässt sich auf einer Karte herausfinden, wie schnell ein oder mehrere Personen von Punkt A nach B mit dem Nahverkehr gelangen können. Zusätzlich lassen sich beispielsweise Kaffees, Kinos, Parks oder Schwimmbäder einblenden und so feststellen, welche Orte in der Schnittmenge der Radien von zwei Personen liegen. Weiter…

Kategorien: Datenprojekt, Datensatz

Daten in Bewegung

Von 1. November 2010 um 09:40 Uhr

Vor einem Jahr hätte die folgende Karte recht leer ausgesehen: Doch in den vergangenen zwölf Monaten hat sich weltweit in Sachen OpenData einiges getan. Ein österreichisches Projekt hat sich die Mühe gemacht, viele staatliche und private Initiativen für Datenkataloge und Datenwettbewerbe mit “Open Government Data” zu kartieren.

Initiatoren:
ROT lokale/regionale Regierung
GRÜN – lokale/regionale NGO-Initiative
GELB nationale Regierung
TÜRKIS nationale NGO-Initiative
Weiter…