Offene Daten – offene Gesellschaft

Autoren Archiv von Sascha Venohr

Wortkarrieren in den Koalitionsverträgen

Von 27. November 2013 um 16:00 Uhr

Der frisch ausgehandelte Koalitionsvertrag zwischen CDU/CSU und SPD ist bereits umfangreich zu den einzelnen Themenbereichen bewertet worden. Wir haben uns die Frage gestellt, ob sich der Text auch als Datensatz auswerten lässt, um Themenschwerpunkte zu erkennen. Dazu wurden zunächst alle Substantive aus dem Text extrahiert und nach Häufigkeit in ein Wordle verwandelt. Diese Textwolke zeigt die Top150:
Koalitionsvertrag2013_Wordle

Im nächsten Schritte interessierte uns, wie häufig einzelne Substantive im neuen Vertrag vorkommen. Spannend ist dabei der Vergleich zum Koalitionsvertrag aus der vergangenen Legislaturperiode (CDU/CSU und FDP 2009-2013). Julian Stahnke hat diesen Vergleich für ausgesuchte Wörter in einer experimentellen Grafik visualisiert:

Kategorien: Allgemein

Twitter-Monitor

Von 9. September 2013 um 12:17 Uhr

Bei Twitter und anderen sozialen Plattformen machen zwar sehr viele Nutzer mit, aber keiner hat den Überblick darüber, was sie in ihrer Gesamtheit sagen. Wir haben für den Zeitraum vor der Wahl ein Tool entwickelt, das die Twitter-Aktivität zu politischen Themen darstellt. In einer Kooperation mit dem Forschungsprojekt tab4 am Zentrum für digitale Kulturen der Universität Lüneburg und dem Berliner Unternehmen tame wollen wir mit dem TwitterMonitor der Öffentlichkeit den Blick auf sich selbst zurückgeben.

twitmon

Von der knappen Million deutscher Nutzer äußern sich ungefähr ein Zehntel regelmäßig zu Politik. Der TwitterMonitor beobachtet davon die wichtigsten. Die Rangliste der top Zehntausend berücksichtigt neben der Anzahl der Follower wie oft ein Nutzer erwähnt wird und wie viel sie oder er tweetet. Welche Themen als politisch relevant gelten, ergibt sich aufgrund der Themen-Nachbarschaft zu vorgegebenen Stichworten. Das dynamische Berechnungsverfahren sorgt dafür, dass Hashtags wie #NSA oder #veggieday automatisch aufgegriffen werden. In zwei Ansichten zeigt der Monitor eine kurz- und eine langfristige Auswahl von Themen, die wichtigsten die letzten 48 Stunden und die wichtigsten seit Anfang August. Zu jedem Thema werden die Tweets dargestellt, die am häufigsten weitergeleitet wurden. Im Detail schlüsseln die Ansichten auf, welche Nutzergruppen sich an der Diskussion am aktivsten beteiligt haben – Journalisten, Interessenverbände, Nutzer oder Politiker, letztere auch nach Parteizugehörigkeit geordnet. So lässt sich rekonstruieren, wo Debatten ihren Ursprung nehmen, wen welche Themen am meisten beschäftigen und wie sie von einer Nutzergruppe eingebracht und von anderen aufgenommen werden.

An der Entwicklung des twitterMonitor sind Leonard Novy (Institut für Medien- und Kommunikationspolitik / CDC Universität Lüneburg), Stefan Heidenreich (CDC Universität Lüneburg) sowie Arno Dirlam und Frederik Fischer (beide tame) und der Designer Mark Wirblich beteiligt.
twit_mon_logos

Kategorien: Allgemein

Die katholische Weltkarte

Von 13. März 2013 um 09:20 Uhr

Der römisch-katholischen Kirche gehören weltweit etwa 1,2 Milliarden Menschen an. Sie alle blicken derzeit nach Rom, wo 115 Kardinäle aus ihrer Mitte den Nachfolger von Papst Benedikt XVI. wählen. Viele Gläubige hoffen, dass dann erstmals ein nicht-europäischer Pontifex die Kirche führen wird – offensichtlich ein längst überfälliger Schritt, wie unsere katholische Weltkarte zeigt.

Bereits 41 Prozent der Kirchenmitglieder leben in Lateinamerika. Zum Vergleich: Europas Katholiken machen lediglich 24 Prozent aus. Unsere interaktive Weltkarte stellt die tatsächlichen Dimensionen der Länder nach der Anzahl der Gläubigen dar. Sie zeigt, wo die meisten Katholiken leben. Die Farbintensität verdeutlicht, wie hoch ihr Anteil an der jeweiligen Landesbevölkerung ist.

katholische_karte580blog

Die Machtverhältnisse im Konklave stehen dazu im Widerspruch. Das Machtzentrum der Kirche ist europäisch. Und so deuten die Kräfteverhältnisse bei der Wahl in der Sixtinischen Kapelle eher auf eine Fortführung der bisherigen Tradition hin. Denn aus Europa kommen 60 der 115 Papst-Wähler. Damit sind die europäischen Kardinäle knapp in der Mehrheit, vertreten jedoch mittlerweile nur eine Minderheit der katholischen Christen. Die Katholiken aus Lateinamerika sind mit lediglich 19 wahlberechtigten Kardinälen unterrepräsentiert.

Für die Wahl des 266. Papstes ist eine Zweidrittelmehrheit nötig. Das entspricht 77 Stimmen.

konklave-vatikan

Wie starr die Kirche trotz steigender Mitgliederzahlen in anderen Erdteilen an ihrer europäischen Machtzentrierung festhält, zeigt der Vergleich der Papstwahlen 1978 (Johannes Paul II.) mit der aktuellen Wahlrunde. Europa konnte demnach sogar noch einmal zwei Prozentpunkte zulegen. Die Regionen mit den größten Zuwächsen, Lateinamerika und Afrika, stagnieren und verloren sogar an Einfluss.

papstwahl_vergleich_1978_2013

Die Daten für die Weltkarte finden Sie in unserem GoogleDoc.

Die 250 meistgenannten Personen 2012

Von 31. Dezember 2012 um 13:17 Uhr

Ein Jahresrückblick mit Hilfe der ZEIT ONLINE API: Wer waren die 250 meistgenannten Personen in unseren Artikeln im Jahr 2012?
Gregor Aisch hat für uns die Personen-Schlagworte der rund 15.000 Artikel von ZEIT ONLINE und DIE ZEIT über unsere neue Datenschnittstelle ausgewertet und visualisiert. Zum Einsatz kam dabei Gephi, ein mächtiges Open-Source Werkzeug zur Visualisierung von Netzwerkgrafiken.

Wir zeigen hier die 250 am häufigsten genannten Personen. Je größer der Name erscheint, desto häufiger die Nennung in den Artikeln. Einzelne Personen sind durch eine Linie (man spricht von “Kanten”) verbunden, sobald sie zusammen als Schlagwort in einem Artikel vorkommen. Die Kanten sind unterschiedlich gewichtet, je nachdem wie oft die Schlagworte zusammen verwendet wurden und wie häufig sie im Gesamtkorpus aufgetaucht sind.
Zusätzlich entstehen so thematische Cluster. So nimmt beispielsweise das Netz der deutschen Innenpolitik Gestalt an. Interessant zu sehen ist die Position des in diesem Jahr gescheiterten Bundespräsidenten Christian Wulff (CDU) und die sichtbare Distanz zwischen ihm und Kanzlerin Merkel. Auch seine Gattin Bettina Wulff ging bereits während der Rücktrittsrede auf Distanz und entfernte sich mit ihrer Buchveröffentlichung im Laufe des Jahres noch weiter von ihm. Durch häufige Wortmeldungen zeigt sich Bundesarbeitsministerin Ursula von der Leyen (CDU) stark vernetzt. Wir wollen aber gar nicht zu viele Aspekte herausgreifen und Sie zum Stöbern in dieser Netzwerkgrafik einladen. Auch für uns als Redaktion ist diese Visualisierung ein wichtiges Spiegelbild des eigenen Schaffens. Wem haben wir vielleicht zu viele Erwähnungen eingeräumt, welcher Stimme gar zu wenig Gehör oder Aufmerksamkeit verschafft?

Wo das Jobwunder stattfindet – und wo nicht

Von 29. November 2012 um 17:06 Uhr

Die Arbeitslosigkeit ist in Deutschland so niedrig wie zuletzt vor rund 20 Jahren. Das deutsche Jobwunder ist in aller Munde. Die gute Entwicklung vollzieht sich allerdings nicht überall im Land, die regionalen Unterschiede sind groß. Unsere Visualisierung zeigt die Entwicklung der Arbeitslosenquoten in allen Landkreisen und kreisfreien Städten: erstmals nicht in Form einer eingefärbten Karte, sondern als Grafikteppich, in dem Sie selbst recherchieren können.

Jede Zeile zeigt die Entwicklung in einem Landkreis beziehungsweise einer kreisfreien Stadt. Dargestellt werden die monatlichen Arbeitslosenquoten seit Januar 2005. Die Farbintensität eines Kästchens steht für die jeweilige Quote: Je dunkler, desto höher ist der Anteil der Arbeitslosen in dieser Region. Auf diese Weise werden im zeitlichen Verlauf regionale Dynamiken am Arbeitsmarkt sichtbar.

Die Idee für diese Darstellung ist entstanden, als wir zunächst nur testweise sehen wollten, welche Muster in den Monatszahlen der Bundesagentur für Arbeit stecken. Jeder Betrachter entdeckte sofort auffällige Häufungen. Schnell war klar, dass diese Form der Visualisierung ganz neue Zugänge schafft, gerade auch, weil alle Regionen im optischen Kontext stehen.

Filter, Sortierungen und Sprungmarken helfen bei der Navigation in dieser opulenten Grafik. Die eigene Region ist am Schnellsten durch die Eingabe der Postleitzahl erreichbar. Zum Einstieg führt eine Tour durch die Visualisierung und stellt drei exemplarische Regionen mit spannenden Verläufen vor. Im Zuge von Gebietsreformen hat sich die räumliche Zusammensetzung von einigen Landkreisen verändert. Um die Grafik nicht noch komplexer zu machen, weisen wir die Zahlen vor der Reform nicht aus.

Hier geht es zur Visualisierung

Technische Umsetzung: Realisiert wurde die Grafik von Paul Blickle (Twitter: @colorfuldata).Die Grafik wurde mit Hilfe der Javascriptbibliothek D3 entwickelt. Die Tour wurde mit guiders.js realisiert.

Kategorien: Allgemein

Wo wird in Deutschland rechtsextrem gewählt?

Von 16. November 2012 um 10:17 Uhr

In den ostdeutschen Bundesländern breiten sich rechtsextreme Ansichten laut einer aktuellen Studie der Friedrich Ebert Stiftung massiv aus. Das war die zusammenfassende Lesart in der Berichterstattung über diese Studie. Aber wie schaut es bundesweit mit Wählerstimmen für rechtsextreme Parteien aus? Ist es wirklich in erster Linie ein Phänomen in Ostdeutschland? Eigentlich zunächst nur als Fingerübung in einem internen ZEIT ONLINE Workshop zum Thema Kartenvisualisierungen gedacht, sind wir dieser Frage nachgegangen. Aus Gründen der Vergleichbarkeit boten sich Daten der Bundestagswahl 2009 an. Gregor Aisch steuerte für den Testlauf einen Datensatz bei, der die Ergebnisse auf Wahlkreisebene auch für die kleinen Parteien enthält (im Wahlatlas des Bundeswahlleiters werden diese leider nicht aufgeführt). Im nächsten Schritt wurden daraus die Zweitstimmenanteile der rechtsextremen Parteien NPD, DVU und REP auf einer Karte visualisiert. Je nach Höhe des Stimmenanteils zeigen die Farbintensitäten der Wahlkreise sehr deutlich, wo diese Parteien bereits 2009 die meisten Wählerstimmen sammeln konnten. Die traurigen Höchstwerte erreichen übrigens die ostdeutschen Wahlkreise Sächsische Schweiz – Osterzgebirge und Görlitz mit jeweils 5,9 Prozent.

Realisiert wurde diese Karte mit karthograph.js, eine von Gregor Aisch entwickelte JavaScript Bibliothek. Sie ermöglicht es, interaktive Karten unabhängig von Google-Maps oder anderen – meist mit Details überladenen – Kartenlösungen zu realisieren. Basierend auf den beiden JavaScript-Frameworks jQuery und Raphaël werden SVG-Files (vektorbasierende Grafiken) eingelesen und gerendert. Die Lösung läuft komplett Client-basiert, jedoch werden die Karten initial von einem Python-Script generiert (im vorliegenden Beispiel ist das Shapefile der Wahlkreise des Bundeswahlleiters die Kartengrundlage). Anschließend lassen sich die Karten direkt in die eigene Seite einbauen und mit CSS stylen. Im Workshop mit Gregor Aisch haben wir uns in der ZEIT ONLINE Entwicklungsredaktion vom Potential des noch jungem Tools überzeugt und werden es gerade im Hinblick auf datenjournalistische Projekte einsetzen.

Was macht unser Leben teurer?

Von 17. September 2012 um 10:23 Uhr

In keinem Land ist die Angst vor Inflation so ausgeprägt wie in Deutschland. Mit großer Sorge wird reagiert, wenn wie im August die Verbraucherpreise weiter ansteigen. Die Jahresinflationsrate erhöhte sich von 1,7 Prozent im Juli auf 2,1 Prozent und liegt damit wieder über der Marke von zwei Prozent, bis zu der die Europäische Zentralbank von stabilen Preisen spricht. Haben wir eine grundsätzlich drastische Verteuerung von Gütern oder gibt es besondere Preistreiber?

Grundlage für die Berechnung des Verbraucherpreisindex ist ein Warenkorb, bestehend aus rund 700 Gütern. Für jedes Element – also zum Beispiel für Nahrungsmittel, Zugfahrten oder für Benzin – wird die Preisentwicklung erfasst. Die Statistiker errechnen daraus einen gewichteten Mittelwert. Die verwendeten Gewichte gelten als repräsentativ für einen durchschnittlichen Haushalt.

Wir haben einzelne Preisentwicklungen ausgehend vom Jahr 2005 ausgewählt und die Daten des Statistischen Bundesamtes im Kurvenverlauf bis August 2012 dargestellt.


Es wird deutlich, dass in diesem Achtjahreszeitraum vor allem Nahrungsmittel (+19,3 Prozent), Verkehr (+24,8 Prozent) und Wohnen (+17,9 Prozent) teurer geworden sind. Die Preise für Wohnraum und Verkehr wurden maßgeblich von den steigenden Energiekosten in die Höhe getrieben. Hinter der Lebensmittelinflation stecken mehrere Faktoren – die Energie ist einer davon.


Splittet man die wichtigsten Posten rund ums Wohnen auf, wird noch einmal die Rasanz der Verteuerung im Energiebereich deutlich. Hier machen sich stark steigende Heizölpreise und ganz besonders der Strompreisanstieg (45,2 Prozent) bemerkbar. Der Anteil steigender Mieten fällt eher moderat aus (ein Plus von neun Prozent seit 2005 entspricht einem jährlichen Anstieg von rund 1,1 Prozent).


Im Bereich Mobilität haben die Preise für Flugreisen um satte 53,1 Prozent zugelegt. Auch Bahnfahren ist in Zeiten steigender Energiepreise teurer geworden. Preise für Bahntickets legten um 25,1 Prozent zu. Die Kosten für die Anschaffung von Neuwagen haben sich hingegen in den letzten Jahren kaum erhöht. So blieb das Preisniveau bei Neuwagen seit der letzten Erhöhung des Mehrwertsteuersatzes ab Januar 2007 konstant. Zu Zeiten der sogenannten Abwrackprämie gaben die Preise für Gebrauchtwagen Anfang 2010 merklich nach, pendelten sich danach aber wieder auf das vorherige Niveau ein.

Um alle Lebensumstände zu erfassen, wird im statistischen Warenkorb auch die Entwicklung für Dienstleitungen wie “Essen auf Rädern” beobachtet. In der Entwicklungskurve zeigt sich, dass die Kostensteigerungen für Nahrungsmittel und Benzinpreise (plus 49,6 Prozent seit 2005) moderat an die Kunden weitergereicht wurden. Die Belieferung der Senioren zu Hause gehörte zu traditionellen Tätigkeiten junger Zivildienstleistender. Mit der Aussetzung der Wehrpflicht und somit auch des Zivildienstes zum Juli 2011 fiel diese günstige Beschäftigungsmöglichkeit weg. Zwischen Januar und August 2011 wurden die dadurch gestiegenen Personalkosten mit einem Anstieg von vier Prozent an die Kunden weitergegeben.


Für Entlastung im Geldbeutel haben unter anderem sinkende Preise für Festnetztelefonie und Mobilfunk gesorgt (-15,2 Prozent).

Im Warenkorb finden sich zudem einzelne Grundnahrungsmittel. Interessant ist der Blick auf zwischenzeitlich stark unterschiedliche Preisentwicklungen bei Frischmilch und Butter. Während die Erzeuger mit dem Einzelhandel für Frischmilch häufig an langfristige Verträge gebunden sind, lassen sich bei anderen Milchprodukten kurzfristige Preisanhebungen durchsetzen.

Die von Martina Schories visualisierten Daten haben wir in einem GoogleDoc zusammengefasst. Den kompletten Datensatz mit allen Einträgen des Warenkorbs gibt es kostenlos es in der GENESIS-Datenbank des Statistischen Bundesamtes.

Anspruch und Wirklichkeit − deutsche Medaillenerfolge nach Sportarten

Von 13. August 2012 um 14:14 Uhr

Die deutsche Olympiamannschaft kehrt mit einer durchwachsenen Bilanz aus London zurück. Auch wenn die Zahl der gewonnenen Medaillen (44) die der Spiele in Peking um drei übertrifft, enttäuschten einige erfolgsverwöhnte Sportarten. Wir haben die deutschen Medaillengewinne der Sommerspiele von 1952 bis 2012 für die einzelnen Sportarten ausgewertet. Dabei weisen wir die von DDR-Sportlern errungenen Erfolge gesondert aus.

Zum Abschluss der Spiele in London sorgten die Medaillenziele, die zwischen dem Deutschen Olympischen Sportbund und den Fachverbänden ausgehandelt wurden, für Aufsehen. Die Veröffentlichung wurde durch juristischen Druck erzwungen. Die für London 2012 genannten Leistungsziele wirken im historischen aber auch aktuellen Kontext sehr unrealistisch. Die 86 anvisierten Medaillen wurden noch nicht einmal 1992 bei den Spielen in Barcelona erreicht. Damals profitierte die gesamtdeutsche Mannschaft bei 82 gewonnen Medaillen neben der Wiedervereinigungseuphorie auch noch vom frischen Erbe der Kaderschmieden des DDR-Sports.

Die Sportarten sind in der Reihenfolge der seit 1952 gewonnen Medaillen visualisiert.

Grundlage für die historischen Daten ist die Wikipedialiste mit allen bisherigen deutschen Medaillengewinnern sowie die Datenbank des Internationalen Olympischen Komitees. Da beide Quellen jeweils einzelne Athleten aufführen, mussten die Daten der Teamdisziplinen medaillenspiegel-konform normalisiert werden (z.B. der erfolgreiche Ruderachter umfasst neun Sportlernamen, die dann zu einer gewonnen Medaille zusammengefasst wurden). Die 2012er Ergebnisse wurden der offiziellen Website der Spiele in London entnommen.

Die verwendeten Daten haben wir hier in diesem GoogleDoc zusammengefasst.

Die Rolle deutscher Bundesligaspieler im Fußball und Basketball

Von 10. Mai 2012 um 15:56 Uhr

In unserer “Alles außer Fußball” Kolumne mit Arne Friedrich, Thomas Hitzlsperger und Corny Littmann kam das Gespräch auf eine mögliche Quotenregelung für deutsche Nachwuchskicker. Die Interviewpartner waren unterschiedlicher Meinung, wie es um die Förderung der heimischen Fußballer bestellt ist. Gerade jetzt vor der Europameisterschaft rückt die Nationalmannschaft wieder in den Mittelpunkt. Wie können sich talentierte deutsche Profis in der höchsten Liga durch Spielpraxis entwickeln und sich für die große internationale Fußballbühne empfehlen?

Wir haben das zum Anlass genommen, und uns mit Hilfe einer Datenauswertung ein genaues Bild über die aktuelle Situation in der Bundesliga verschafft.

Auf der offiziellen Website der Bundesliga werden für die einzelnen Spieler auf die Minute genaue Einsatzzeiten aufgeführt. Wir haben die Daten der sieben besten Teams (gleichbedeutend mit der Qualifikation für europäische Wettbewerbe) der Saison 2011/12 eingesammelt und dabei die Spieler im Datensatz mit ihrer Nationalität versehen. Das Ergebnis: Im Schnitt bestreiten deutsche Spieler rund 52 Prozent der Einsatzzeiten in diesen Topteams. Das detaillierte Ergebnis zeigt jedoch, wie unterschiedlich die Vereine auf deutsche Spitzenkräfte setzen.

Im Fußball sind Tore das Wichtigste. Wie schaut es also bei diesen mit der Verteilung aus? Im Schnitt der sieben Topmannschaften kommen die deutschen Fußballer auf rund 42 Prozent der erzielten Tore. Auch hier lohnt der Blick auf die unterschiedlichen Ausprägungen in den Teams:

Bayer Leverkusen setzt mit Abstand am stärksten auf deutsche Spieler, gefolgt von Bayern München, die in den letzten Jahrzehnten traditionell das spielerische Grundgerüst der Nationalmannschaft stellen. Beim frischgebackenen Meister Borussia Dortmund hingegen sind eindeutig internationale Spieler fürs Toreschießen zuständig. Bei Bundesligisten wie Schalke 04 und der VfB Stuttgart ist ein genereller Trend zu ausländischen Spielern zu beobachten. So lange die deutsche Nationalmannschaft erfolgreichen Fußball spielt, scheint noch kein Diskussionsbedarf über Quoten zu bestehen, man darf auf das Abschneiden bei der EM gespannt sein.

Basketball

Auch im Basketball ist Bayern München mittlerweile in der 1.Bundesliga angekommen. Hier wird ebenfalls verstärkt auf deutsche Spieler gesetzt. In unserem Gespräch mit dem ehemaligen Bundestrainer und jetzigen Trainer der Basketballer des FC Bayern, Dirk Bauermann, ging es um die Rolle der deutschen Spieler in der Liga und um die Perspektiven für den heimischen Nachwuchs. In der Vorbereitung des Gesprächs wollten wir es genau wissen: Welche konkreten Anteile an der Gesamtspielzeit haben die heimischen Basketballer in der höchsten deutschen Spielklasse?

Da im Basketball auf die Sekunde genaue Spielstatistiken vorliegen, konnten wir leicht eine Gesamtrechnung für die acht besten Teams der Hauptrunde (qualifizierte Teams für die Playoffs) aufstellen. Dazu wurden auch hier Nationalitäten der einzelnen Spieler zugeordnet, um eine sattelfeste Unterscheidung in den Daten zu haben. Das Ergebnis zeigt, wie stark die Vereine auf ausländische Kräfte setzen:

Außerdem wollten wir wissen, wie hoch die Verteilung bei der Punkteausbeute in den Vereinen war. Rechnet man die Hauptrundenspiele aller acht Playoffteilnehmer zusammen, kommen die deutschen Korbjäger auf einen mageren Anteil von knapp 20 Prozent der erzielten Punkte. Dieses Diagramm zeigt, wie schwer es deutsche Spieler in den Vereinen haben:

Diese Statistiken legen gerade beim Basketball den Finger in die Wunde. Regeländerungen sollen nun den deutschen Nachwuchs fördern. So gilt in der neuen Saison der Grundsatz: Im Kader dürfen nicht mehr als sechs Ausländer sein. Dirk Bauermann geht sogar weiter und fordert, dass in der ersten Liga jederzeit einer der fünf Akteure auf dem Feld ein deutscher Spieler sein muss.