Offene Daten – offene Gesellschaft

Autoren Archiv von Sascha Venohr

Junge Einwanderer, deutsche Babyboomer

Von 18. Dezember 2014 um 13:35 Uhr

Deutschland ist mittlerweile nach Amerika das beliebteste Einwanderungsland der Welt. Doch zugleich ist erneut eine Debatte entbrannt, ob Zuwanderung den Deutschen nützt oder nicht. In der Diskussion wird oft eine Studie der Bertelsmann-Stiftung zitiert, die vor wenigen Wochen erschien. Der Untersuchung zufolge sind die Einwanderer unter dem Strich ökonomisch ein Gewinn. Sie zahlen deutlich mehr Steuern und Sozialbeiträge, als sie umgekehrt vom Staat erhalten.

Die Autoren der Studie führen hierfür einen wesentlichen Grund an: Die Zuwanderer kämen meist in einem Alter nach Deutschland, in dem sie erwerbstätig sind oder sein können. Der Staat müsse deshalb weniger Mittel für die Ausbildung der Menschen aufbringen – zugleich stützten die Zuwanderer die schrumpfende Zahl jener Menschen, die in Deutschland arbeiten können. Doch wie groß ist dieser Effekt wirklich?

Mithilfe von Daten des Statischen Bundesamtes haben wir die prozentualen Verteilungen der Altersgruppen berechnet – einmal für die deutsche Bevölkerung und für die in Deutschland lebenden Ausländer. Altersverteilung Deutschland

Der Kurvenverlauf zeigt sehr eindrücklich, wie sich die Altersstrukturen unterscheiden. Migranten ohne deutschen Pass sind in den Altersgruppen zwischen 20 und 45 Jahren überproportional stark vertreten – also im besten erwerbsfähigen Alter (am stärksten repräsentiert sind die 33-Jährigen). Im Gegensatz dazu dominieren in der deutschen Bevölkerung die Jahrgänge der sogenannten Babyboomer-Generation. Am stärksten ist die Altersgruppe der Menschen Ende Vierzig.

Von den rund 80,8 Millionen Einwohnern Deutschlands hatten im Jahr 2013 rund sieben Millionen Menschen keinen deutschen Pass. Diese Menschen haben die Gesamtbevölkerung zwar in den letzten Jahren verjüngt. Der Effekt ist aber weit weniger groß als oft angenommen. Zum Vergleich ist ein Blick auf die Altersstruktur der USA interessant, bei denen die jüngeren Jahrgänge weit stärker vertreten sind (stärkste Altersgruppe dort: 22 Jahre!).

Kategorien: Allgemein

Deutschland stationär – wo die meisten Patienten behandelt wurden

Von 11. Dezember 2014 um 09:59 Uhr

Die Kosten der stationären Krankenhausversorgung steigen. Im Jahr 2013 waren es 78 Milliarden Euro, die allein für Aufenthalte in den rund 2.000 deutschen Krankenhäusern ausgegeben werden mussten. Das sind 3,2 Prozent mehr als im Vorjahr.

Wird das auf die rund 18,8 Millionen Patientinnen und Patienten umgerechnet, die 2013 vollstationär im Krankenhaus behandelt wurden, dann kostete jeder davon im Durchschnitt 4.152 Euro. Auch dieser Wert ist gestiegen, im Vergleich zum Vorjahr um 2,3 Prozent.

Unsere Karte zeigt auf Basis von Daten des Bundesamtes für Statistik, wo im Jahr 2013 wie viele Menschen im Krankenhaus behandelt wurden. Es sind keine absoluten Zahlen, sondern sie sind zur Einwohnerzahl der Landkreise und kreisfreien Städte ins Verhältnis gesetzt und zeigen die Patienten pro eintausend Einwohner.

Krankenhauspatienten 2013

Lesen Sie hier, wo in deutschen Krankenhäusern die meisten Fälle mit multiresistenten Keimen auftraten.

Wo das Volk auf die Straße ging

Von 8. November 2014 um 08:00 Uhr

Von David Schraven

Vor 25 Jahren brach das Unrechtsregime der DDR in sich zusammen. Das Ende des SED-Staats war das Ergebnis einer friedlichen Revolution. Millionen Bürger demonstrierten zwischen Rostock und Chemnitz, von Suhl bis Neubrandenburg. Sie gingen auf die Straße, nicht nur zum Mauerfall, sondern auch, weil sie für ihre Freiheit protestierten.

Heute ist dieser Volksaufstand und die anschließende Wiedervereinigung in der Erinnerung einiger Menschen zusammengeschnurrt auf das Verhandlungsgeschick weniger Personen. Helmut Kohl, der damalige Bundeskanzler, sagt etwa: Nicht die Bürgerrechtsbewegung hätte “in erster Linie” die Wende durchgesetzt. Vielmehr sei Gorbatschow durch “die Bücher durchgegangen” und habe festgestellt, dass er “am Arsch des Propheten” sei. Vorstellungen, die Revolutionäre im Osten hätten den Zusammenbruch der DDR bewirkt, seien dem „Volkshochschulhirn von Thierse“ entsprungen.

Das Archiv Bürgerbewegung Leipzig e.V. hat die Daten der Revolution gesammelt: Alle Demonstrationen zwischen dem 13. August 1989 und dem 30. April 1990. Die Besetzungen der Stasizentralen, die Proteste und Märsche. Das Recherchebüro CORRECT!V hat diese Daten sichtbar gemacht. Man erkennt, wie der Protest immer größer wird, bis er das ganze Land erfasst, und wie sich aus einzelnen Stimmen ein Sturm der Empörung formt, der die Herrschaft der Honeckers und Mielckes hinwegfegt.

Kategorien: Datenvisualisierung

Wortkarrieren in den Koalitionsverträgen

Von 27. November 2013 um 16:00 Uhr

Der frisch ausgehandelte Koalitionsvertrag zwischen CDU/CSU und SPD ist bereits umfangreich zu den einzelnen Themenbereichen bewertet worden. Wir haben uns die Frage gestellt, ob sich der Text auch als Datensatz auswerten lässt, um Themenschwerpunkte zu erkennen. Dazu wurden zunächst alle Substantive aus dem Text extrahiert und nach Häufigkeit in ein Wordle verwandelt. Diese Textwolke zeigt die Top150:
Koalitionsvertrag2013_Wordle

Im nächsten Schritte interessierte uns, wie häufig einzelne Substantive im neuen Vertrag vorkommen. Spannend ist dabei der Vergleich zum Koalitionsvertrag aus der vergangenen Legislaturperiode (CDU/CSU und FDP 2009-2013). Julian Stahnke hat diesen Vergleich für ausgesuchte Wörter in einer experimentellen Grafik visualisiert:

Kategorien: Allgemein

Twitter-Monitor

Von 9. September 2013 um 12:17 Uhr

Bei Twitter und anderen sozialen Plattformen machen zwar sehr viele Nutzer mit, aber keiner hat den Überblick darüber, was sie in ihrer Gesamtheit sagen. Wir haben für den Zeitraum vor der Wahl ein Tool entwickelt, das die Twitter-Aktivität zu politischen Themen darstellt. In einer Kooperation mit dem Forschungsprojekt tab4 am Zentrum für digitale Kulturen der Universität Lüneburg und dem Berliner Unternehmen tame wollen wir mit dem TwitterMonitor der Öffentlichkeit den Blick auf sich selbst zurückgeben.

twitmon

Von der knappen Million deutscher Nutzer äußern sich ungefähr ein Zehntel regelmäßig zu Politik. Der TwitterMonitor beobachtet davon die wichtigsten. Die Rangliste der top Zehntausend berücksichtigt neben der Anzahl der Follower wie oft ein Nutzer erwähnt wird und wie viel sie oder er tweetet. Welche Themen als politisch relevant gelten, ergibt sich aufgrund der Themen-Nachbarschaft zu vorgegebenen Stichworten. Das dynamische Berechnungsverfahren sorgt dafür, dass Hashtags wie #NSA oder #veggieday automatisch aufgegriffen werden. In zwei Ansichten zeigt der Monitor eine kurz- und eine langfristige Auswahl von Themen, die wichtigsten die letzten 48 Stunden und die wichtigsten seit Anfang August. Zu jedem Thema werden die Tweets dargestellt, die am häufigsten weitergeleitet wurden. Im Detail schlüsseln die Ansichten auf, welche Nutzergruppen sich an der Diskussion am aktivsten beteiligt haben – Journalisten, Interessenverbände, Nutzer oder Politiker, letztere auch nach Parteizugehörigkeit geordnet. So lässt sich rekonstruieren, wo Debatten ihren Ursprung nehmen, wen welche Themen am meisten beschäftigen und wie sie von einer Nutzergruppe eingebracht und von anderen aufgenommen werden.

An der Entwicklung des twitterMonitor sind Leonard Novy (Institut für Medien- und Kommunikationspolitik / CDC Universität Lüneburg), Stefan Heidenreich (CDC Universität Lüneburg) sowie Arno Dirlam und Frederik Fischer (beide tame) und der Designer Mark Wirblich beteiligt.
twit_mon_logos

Kategorien: Allgemein

Die katholische Weltkarte

Von 13. März 2013 um 09:20 Uhr

Der römisch-katholischen Kirche gehören weltweit etwa 1,2 Milliarden Menschen an. Sie alle blicken derzeit nach Rom, wo 115 Kardinäle aus ihrer Mitte den Nachfolger von Papst Benedikt XVI. wählen. Viele Gläubige hoffen, dass dann erstmals ein nicht-europäischer Pontifex die Kirche führen wird – offensichtlich ein längst überfälliger Schritt, wie unsere katholische Weltkarte zeigt.

Bereits 41 Prozent der Kirchenmitglieder leben in Lateinamerika. Zum Vergleich: Europas Katholiken machen lediglich 24 Prozent aus. Unsere interaktive Weltkarte stellt die tatsächlichen Dimensionen der Länder nach der Anzahl der Gläubigen dar. Sie zeigt, wo die meisten Katholiken leben. Die Farbintensität verdeutlicht, wie hoch ihr Anteil an der jeweiligen Landesbevölkerung ist.

katholische_karte580blog

Die Machtverhältnisse im Konklave stehen dazu im Widerspruch. Das Machtzentrum der Kirche ist europäisch. Und so deuten die Kräfteverhältnisse bei der Wahl in der Sixtinischen Kapelle eher auf eine Fortführung der bisherigen Tradition hin. Denn aus Europa kommen 60 der 115 Papst-Wähler. Damit sind die europäischen Kardinäle knapp in der Mehrheit, vertreten jedoch mittlerweile nur eine Minderheit der katholischen Christen. Die Katholiken aus Lateinamerika sind mit lediglich 19 wahlberechtigten Kardinälen unterrepräsentiert.

Für die Wahl des 266. Papstes ist eine Zweidrittelmehrheit nötig. Das entspricht 77 Stimmen.

konklave-vatikan

Wie starr die Kirche trotz steigender Mitgliederzahlen in anderen Erdteilen an ihrer europäischen Machtzentrierung festhält, zeigt der Vergleich der Papstwahlen 1978 (Johannes Paul II.) mit der aktuellen Wahlrunde. Europa konnte demnach sogar noch einmal zwei Prozentpunkte zulegen. Die Regionen mit den größten Zuwächsen, Lateinamerika und Afrika, stagnieren und verloren sogar an Einfluss.

papstwahl_vergleich_1978_2013

Die Daten für die Weltkarte finden Sie in unserem GoogleDoc.

Die 250 meistgenannten Personen 2012

Von 31. Dezember 2012 um 13:17 Uhr

Ein Jahresrückblick mit Hilfe der ZEIT ONLINE API: Wer waren die 250 meistgenannten Personen in unseren Artikeln im Jahr 2012?
Gregor Aisch hat für uns die Personen-Schlagworte der rund 15.000 Artikel von ZEIT ONLINE und DIE ZEIT über unsere neue Datenschnittstelle ausgewertet und visualisiert. Zum Einsatz kam dabei Gephi, ein mächtiges Open-Source Werkzeug zur Visualisierung von Netzwerkgrafiken.

Wir zeigen hier die 250 am häufigsten genannten Personen. Je größer der Name erscheint, desto häufiger die Nennung in den Artikeln. Einzelne Personen sind durch eine Linie (man spricht von “Kanten”) verbunden, sobald sie zusammen als Schlagwort in einem Artikel vorkommen. Die Kanten sind unterschiedlich gewichtet, je nachdem wie oft die Schlagworte zusammen verwendet wurden und wie häufig sie im Gesamtkorpus aufgetaucht sind.
Zusätzlich entstehen so thematische Cluster. So nimmt beispielsweise das Netz der deutschen Innenpolitik Gestalt an. Interessant zu sehen ist die Position des in diesem Jahr gescheiterten Bundespräsidenten Christian Wulff (CDU) und die sichtbare Distanz zwischen ihm und Kanzlerin Merkel. Auch seine Gattin Bettina Wulff ging bereits während der Rücktrittsrede auf Distanz und entfernte sich mit ihrer Buchveröffentlichung im Laufe des Jahres noch weiter von ihm. Durch häufige Wortmeldungen zeigt sich Bundesarbeitsministerin Ursula von der Leyen (CDU) stark vernetzt. Wir wollen aber gar nicht zu viele Aspekte herausgreifen und Sie zum Stöbern in dieser Netzwerkgrafik einladen. Auch für uns als Redaktion ist diese Visualisierung ein wichtiges Spiegelbild des eigenen Schaffens. Wem haben wir vielleicht zu viele Erwähnungen eingeräumt, welcher Stimme gar zu wenig Gehör oder Aufmerksamkeit verschafft?

Wo das Jobwunder stattfindet – und wo nicht

Von 29. November 2012 um 17:06 Uhr

Die Arbeitslosigkeit ist in Deutschland so niedrig wie zuletzt vor rund 20 Jahren. Das deutsche Jobwunder ist in aller Munde. Die gute Entwicklung vollzieht sich allerdings nicht überall im Land, die regionalen Unterschiede sind groß. Unsere Visualisierung zeigt die Entwicklung der Arbeitslosenquoten in allen Landkreisen und kreisfreien Städten: erstmals nicht in Form einer eingefärbten Karte, sondern als Grafikteppich, in dem Sie selbst recherchieren können.

Jede Zeile zeigt die Entwicklung in einem Landkreis beziehungsweise einer kreisfreien Stadt. Dargestellt werden die monatlichen Arbeitslosenquoten seit Januar 2005. Die Farbintensität eines Kästchens steht für die jeweilige Quote: Je dunkler, desto höher ist der Anteil der Arbeitslosen in dieser Region. Auf diese Weise werden im zeitlichen Verlauf regionale Dynamiken am Arbeitsmarkt sichtbar.

Die Idee für diese Darstellung ist entstanden, als wir zunächst nur testweise sehen wollten, welche Muster in den Monatszahlen der Bundesagentur für Arbeit stecken. Jeder Betrachter entdeckte sofort auffällige Häufungen. Schnell war klar, dass diese Form der Visualisierung ganz neue Zugänge schafft, gerade auch, weil alle Regionen im optischen Kontext stehen.

Filter, Sortierungen und Sprungmarken helfen bei der Navigation in dieser opulenten Grafik. Die eigene Region ist am Schnellsten durch die Eingabe der Postleitzahl erreichbar. Zum Einstieg führt eine Tour durch die Visualisierung und stellt drei exemplarische Regionen mit spannenden Verläufen vor. Im Zuge von Gebietsreformen hat sich die räumliche Zusammensetzung von einigen Landkreisen verändert. Um die Grafik nicht noch komplexer zu machen, weisen wir die Zahlen vor der Reform nicht aus.

Hier geht es zur Visualisierung

Technische Umsetzung: Realisiert wurde die Grafik von Paul Blickle (Twitter: @colorfuldata).Die Grafik wurde mit Hilfe der Javascriptbibliothek D3 entwickelt. Die Tour wurde mit guiders.js realisiert.

Kategorien: Allgemein

Wo wird in Deutschland rechtsextrem gewählt?

Von 16. November 2012 um 10:17 Uhr

In den ostdeutschen Bundesländern breiten sich rechtsextreme Ansichten laut einer aktuellen Studie der Friedrich Ebert Stiftung massiv aus. Das war die zusammenfassende Lesart in der Berichterstattung über diese Studie. Aber wie schaut es bundesweit mit Wählerstimmen für rechtsextreme Parteien aus? Ist es wirklich in erster Linie ein Phänomen in Ostdeutschland? Eigentlich zunächst nur als Fingerübung in einem internen ZEIT ONLINE Workshop zum Thema Kartenvisualisierungen gedacht, sind wir dieser Frage nachgegangen. Aus Gründen der Vergleichbarkeit boten sich Daten der Bundestagswahl 2009 an. Gregor Aisch steuerte für den Testlauf einen Datensatz bei, der die Ergebnisse auf Wahlkreisebene auch für die kleinen Parteien enthält (im Wahlatlas des Bundeswahlleiters werden diese leider nicht aufgeführt). Im nächsten Schritt wurden daraus die Zweitstimmenanteile der rechtsextremen Parteien NPD, DVU und REP auf einer Karte visualisiert. Je nach Höhe des Stimmenanteils zeigen die Farbintensitäten der Wahlkreise sehr deutlich, wo diese Parteien bereits 2009 die meisten Wählerstimmen sammeln konnten. Die traurigen Höchstwerte erreichen übrigens die ostdeutschen Wahlkreise Sächsische Schweiz – Osterzgebirge und Görlitz mit jeweils 5,9 Prozent.

Realisiert wurde diese Karte mit karthograph.js, eine von Gregor Aisch entwickelte JavaScript Bibliothek. Sie ermöglicht es, interaktive Karten unabhängig von Google-Maps oder anderen – meist mit Details überladenen – Kartenlösungen zu realisieren. Basierend auf den beiden JavaScript-Frameworks jQuery und Raphaël werden SVG-Files (vektorbasierende Grafiken) eingelesen und gerendert. Die Lösung läuft komplett Client-basiert, jedoch werden die Karten initial von einem Python-Script generiert (im vorliegenden Beispiel ist das Shapefile der Wahlkreise des Bundeswahlleiters die Kartengrundlage). Anschließend lassen sich die Karten direkt in die eigene Seite einbauen und mit CSS stylen. Im Workshop mit Gregor Aisch haben wir uns in der ZEIT ONLINE Entwicklungsredaktion vom Potential des noch jungem Tools überzeugt und werden es gerade im Hinblick auf datenjournalistische Projekte einsetzen.

Was macht unser Leben teurer?

Von 17. September 2012 um 10:23 Uhr

In keinem Land ist die Angst vor Inflation so ausgeprägt wie in Deutschland. Mit großer Sorge wird reagiert, wenn wie im August die Verbraucherpreise weiter ansteigen. Die Jahresinflationsrate erhöhte sich von 1,7 Prozent im Juli auf 2,1 Prozent und liegt damit wieder über der Marke von zwei Prozent, bis zu der die Europäische Zentralbank von stabilen Preisen spricht. Haben wir eine grundsätzlich drastische Verteuerung von Gütern oder gibt es besondere Preistreiber?

Grundlage für die Berechnung des Verbraucherpreisindex ist ein Warenkorb, bestehend aus rund 700 Gütern. Für jedes Element – also zum Beispiel für Nahrungsmittel, Zugfahrten oder für Benzin – wird die Preisentwicklung erfasst. Die Statistiker errechnen daraus einen gewichteten Mittelwert. Die verwendeten Gewichte gelten als repräsentativ für einen durchschnittlichen Haushalt.

Wir haben einzelne Preisentwicklungen ausgehend vom Jahr 2005 ausgewählt und die Daten des Statistischen Bundesamtes im Kurvenverlauf bis August 2012 dargestellt.


Es wird deutlich, dass in diesem Achtjahreszeitraum vor allem Nahrungsmittel (+19,3 Prozent), Verkehr (+24,8 Prozent) und Wohnen (+17,9 Prozent) teurer geworden sind. Die Preise für Wohnraum und Verkehr wurden maßgeblich von den steigenden Energiekosten in die Höhe getrieben. Hinter der Lebensmittelinflation stecken mehrere Faktoren – die Energie ist einer davon.


Splittet man die wichtigsten Posten rund ums Wohnen auf, wird noch einmal die Rasanz der Verteuerung im Energiebereich deutlich. Hier machen sich stark steigende Heizölpreise und ganz besonders der Strompreisanstieg (45,2 Prozent) bemerkbar. Der Anteil steigender Mieten fällt eher moderat aus (ein Plus von neun Prozent seit 2005 entspricht einem jährlichen Anstieg von rund 1,1 Prozent).


Im Bereich Mobilität haben die Preise für Flugreisen um satte 53,1 Prozent zugelegt. Auch Bahnfahren ist in Zeiten steigender Energiepreise teurer geworden. Preise für Bahntickets legten um 25,1 Prozent zu. Die Kosten für die Anschaffung von Neuwagen haben sich hingegen in den letzten Jahren kaum erhöht. So blieb das Preisniveau bei Neuwagen seit der letzten Erhöhung des Mehrwertsteuersatzes ab Januar 2007 konstant. Zu Zeiten der sogenannten Abwrackprämie gaben die Preise für Gebrauchtwagen Anfang 2010 merklich nach, pendelten sich danach aber wieder auf das vorherige Niveau ein.

Um alle Lebensumstände zu erfassen, wird im statistischen Warenkorb auch die Entwicklung für Dienstleitungen wie “Essen auf Rädern” beobachtet. In der Entwicklungskurve zeigt sich, dass die Kostensteigerungen für Nahrungsmittel und Benzinpreise (plus 49,6 Prozent seit 2005) moderat an die Kunden weitergereicht wurden. Die Belieferung der Senioren zu Hause gehörte zu traditionellen Tätigkeiten junger Zivildienstleistender. Mit der Aussetzung der Wehrpflicht und somit auch des Zivildienstes zum Juli 2011 fiel diese günstige Beschäftigungsmöglichkeit weg. Zwischen Januar und August 2011 wurden die dadurch gestiegenen Personalkosten mit einem Anstieg von vier Prozent an die Kunden weitergegeben.


Für Entlastung im Geldbeutel haben unter anderem sinkende Preise für Festnetztelefonie und Mobilfunk gesorgt (-15,2 Prozent).

Im Warenkorb finden sich zudem einzelne Grundnahrungsmittel. Interessant ist der Blick auf zwischenzeitlich stark unterschiedliche Preisentwicklungen bei Frischmilch und Butter. Während die Erzeuger mit dem Einzelhandel für Frischmilch häufig an langfristige Verträge gebunden sind, lassen sich bei anderen Milchprodukten kurzfristige Preisanhebungen durchsetzen.

Die von Martina Schories visualisierten Daten haben wir in einem GoogleDoc zusammengefasst. Den kompletten Datensatz mit allen Einträgen des Warenkorbs gibt es kostenlos es in der GENESIS-Datenbank des Statistischen Bundesamtes.