Data Blog

Offene Daten – offene Gesellschaft

Junge Einwanderer, deutsche Babyboomer

Von 18. Dezember 2014 um 13:35 Uhr

Deutschland ist mittlerweile nach Amerika das beliebteste Einwanderungsland der Welt. Doch zugleich ist erneut eine Debatte entbrannt, ob Zuwanderung den Deutschen nützt oder nicht. In der Diskussion wird oft eine Studie der Bertelsmann-Stiftung zitiert, die vor wenigen Wochen erschien. Der Untersuchung zufolge sind die Einwanderer unter dem Strich ökonomisch ein Gewinn. Sie zahlen deutlich mehr Steuern und Sozialbeiträge, als sie umgekehrt vom Staat erhalten.

Die Autoren der Studie führen hierfür einen wesentlichen Grund an: Die Zuwanderer kämen meist in einem Alter nach Deutschland, in dem sie erwerbstätig sind oder sein können. Der Staat müsse deshalb weniger Mittel für die Ausbildung der Menschen aufbringen – zugleich stützten die Zuwanderer die schrumpfende Zahl jener Menschen, die in Deutschland arbeiten können. Doch wie groß ist dieser Effekt wirklich?

Mithilfe von Daten des Statischen Bundesamtes haben wir die prozentualen Verteilungen der Altersgruppen berechnet – einmal für die deutsche Bevölkerung und für die in Deutschland lebenden Ausländer. Altersverteilung Deutschland

Der Kurvenverlauf zeigt sehr eindrücklich, wie sich die Altersstrukturen unterscheiden. Migranten ohne deutschen Pass sind in den Altersgruppen zwischen 20 und 45 Jahren überproportional stark vertreten – also im besten erwerbsfähigen Alter (am stärksten repräsentiert sind die 33-Jährigen). Im Gegensatz dazu dominieren in der deutschen Bevölkerung die Jahrgänge der sogenannten Babyboomer-Generation. Am stärksten ist die Altersgruppe der Menschen Ende Vierzig.

Von den rund 80,8 Millionen Einwohnern Deutschlands hatten im Jahr 2013 rund sieben Millionen Menschen keinen deutschen Pass. Diese Menschen haben die Gesamtbevölkerung zwar in den letzten Jahren verjüngt. Der Effekt ist aber weit weniger groß als oft angenommen. Zum Vergleich ist ein Blick auf die Altersstruktur der USA interessant, bei denen die jüngeren Jahrgänge weit stärker vertreten sind (stärkste Altersgruppe dort: 22 Jahre!).

Kategorien: Allgemein

Deutschland stationär – wo die meisten Patienten behandelt wurden

Von 11. Dezember 2014 um 09:59 Uhr

Die Kosten der stationären Krankenhausversorgung steigen. Im Jahr 2013 waren es 78 Milliarden Euro, die allein für Aufenthalte in den rund 2.000 deutschen Krankenhäusern ausgegeben werden mussten. Das sind 3,2 Prozent mehr als im Vorjahr.

Wird das auf die rund 18,8 Millionen Patientinnen und Patienten umgerechnet, die 2013 vollstationär im Krankenhaus behandelt wurden, dann kostete jeder davon im Durchschnitt 4.152 Euro. Auch dieser Wert ist gestiegen, im Vergleich zum Vorjahr um 2,3 Prozent.

Unsere Karte zeigt auf Basis von Daten des Bundesamtes für Statistik, wo im Jahr 2013 wie viele Menschen im Krankenhaus behandelt wurden. Es sind keine absoluten Zahlen, sondern sie sind zur Einwohnerzahl der Landkreise und kreisfreien Städte ins Verhältnis gesetzt und zeigen die Patienten pro eintausend Einwohner.

Krankenhauspatienten 2013

Lesen Sie hier, wo in deutschen Krankenhäusern die meisten Fälle mit multiresistenten Keimen auftraten.

Keim bleibt geheim

Von 22. November 2014 um 09:00 Uhr

Von Haluka Maier-Borst

Resistente Keime wie MRSA und VRE sind in deutschen Kliniken ein großes Problem. Bis zu 15.000 Menschen sterben schätzungsweise jedes Jahr an einer Infektion mit einem solchen Erreger. Das sind viereinhalb Mal so viele, wie bei Verkehrsunfällen umkommen.

Wer allerdings genauer wissen will, wie groß das Problem ist und wie es sich entwickelt, muss feststellen, dass es erstaunlich schwierig ist, an Zahlen zu gelangen. Für uns waren zu Beginn der Recherche vor allem diese drei Fragen unbeantwortet:

  1. Ist ganz Deutschland gleichermaßen von dem Problem betroffen?
  2. Gibt es bestimmte Regionen, bestimmte Krankenhäuser, in denen solche Infektionen häufiger auftreten?
  3. Gibt es Schwerpunkte, bei denen es wichtig wäre, die Ursachen genauer anzuschauen?

Der erste Schritt, diese Fragen zu beantworten, war noch einfach. Seit Mitte 2009 muss jedes Labor melden, wenn es einen MRSA-Keim im Blut oder in der Wirbelsäulenflüssigkeit eines Patienten findet. Die Statistik darüber führt das Robert-Koch-Institut (RKI), die wichtigste Institution in Deutschland, wenn es um Seuchen und Infektionsbekämpfung geht.

Das RKI lieferte entsprechende Daten auf Anfrage problemlos – solange wir nicht zu detailliert wissen wollten, wie viele Menschen sich wo infiziert hatten. Wir bekamen Daten, die zeigen, wie viele MRSA-Fälle pro 10.000 Einwohner in allen Landkreisen und Städten gemeldet werden.

Daran ist zu erkennen, dass sich vor allem in Nordrhein-Westfalen und Niedersachsen MRSA-Infektionen häufen. Betrachtet man zusätzlich, welche Kreise und Städte die meisten Infektionen im Verhältnis zu ihrer Einwohnerzahl gemeldet haben, kommt man auf diese zehn: Holzminden, Sächsische Schweiz-Osterzgebirge, Goslar, Nienburg (Weser), Northeim, Peine, Mönchengladbach, Hameln-Pyrmont, Höxter, Duisburg.

Diese zehn Städte und Kreise verzeichneten nicht nur in einem Jahr die meisten Fälle. Sie tauchen vielmehr in nahezu jedem Jahr an der Spitze der Liste der Infektionsherde auf. Es geht also nicht um einzelne Ausbrüche.

Die nächste Frage, welche Krankenhäuser in den jeweiligen Kreisen und Städten konkret betroffen sind, war nicht mehr so einfach zu beantworten. Doch nur so lässt sich beurteilen, ob hinter hohen Zahlen beispielsweise eine auf multiresistente Keime spezialisierte Klinik steckt, die naturgemäß hohe Fallzahlen hat. Oder ob es die besonders großen Krankenhäuser mit sehr vielen Patienten sind. Oder ob die Zahlen auf ein Problem hinweisen, schlechtere hygienische Zustände beispielsweise. Und natürlich sind entsprechende Informationen für die Bewohner der Regionen interessant.

Gesundheitsämter schwiegen

Das RKI hat solche Daten nicht, sie liegen bei den örtlichen Gesundheitsämtern. Diese registrieren die Fälle und melden sie anschließend anonymisiert an das Institut.

Für Duisburg hatten wir dank der Vorarbeit des Rechercheteams der Funke-Mediengruppe schon eine Aufschlüsselung der Fallzahlen nach den einzelnen Krankenhäusern. Vier weitere Kreisgesundheitsämter beantworteten unsere Frage. Die fünf übrigen taten das nicht.

Sie führten dafür unterschiedliche Gründe an. Personalmangel zum Beispiel, verbunden mit dem Vorwurf, wir behinderten die Arbeit der Behörde: “Im zuständigen Fachbereich sind wir personell (…) sehr eng aufgestellt. Es würde bedeuten, dass eine Kraft sich ihren Beratungs- und Kontrollaufgaben nicht widmen könnte, weil die Daten für Sie herausgesucht werden müssen.“ Auch Datenschutz wurde genannt, ohne Verweis auf ein entsprechendes Gesetz: “Informationen, wie von Ihnen gewünscht, unterliegen dem Datenschutz. Daher ist eine Auskunft dazu leider nicht möglich.“

Uns wurde auch vorgeworfen, Kliniken wirtschaftlich zu schaden: “So kann unter dem Gesichtspunkt von § 823 BGB, § 1004 BGB (eingerichteter und ausgeübter Gewerbebetrieb) z.B. eine negative betriebsbezogene Berichterstattung im Sinne einer unerlaubten Handlung zu missbilligen sein und einen entsprechenden Unterlassungsanspruch auslösen, wenn dies zu entsprechenden Vermögensnachteilen führt oder solche zu befürchten (sind).”

Ein Gesundheitsamt nahm es als gegeben hin, dass sich einige Krankenhäuser nicht an die gesetzlich vorgeschriebene Meldepflicht halten und daher die Ehrlichen die Dummen wären: “Tatsächlich spricht aber gegen eine Einzelmeldung, dass nicht alle Krankenhäuser ihre MRSA-Fälle melden, das heißt, würden wir die meldenden Krankenhäuser benennen, würden diejenigen bestraft, die sich an die Meldepflicht halten. Jene, die der Meldepflicht nicht nachkommen, würden in einem guten Licht da stehen.“ Dabei ist es Aufgabe der Gesundheitsämter, die Einhaltung des Infektionsschutzgesetzes zu gewährleisten.

Nur eins der Gesundheitsämter brachte ein berechtiges, sachliches Argument vor: “Es sei erwähnt, dass (…) belegbar ist, dass weit überwiegend bei den gemeldeten Fällen schon bei Aufnahme ein positiver MRSA (…) Befund vorgelegen hat! (…) Eine krankenhausinterne Verursachung ist damit nicht ersichtlich (…).“

Woher die Keime kamen? Keine Daten

An diesem Argument zeigt sich die größte Schwäche der offiziellen RKI-Statistik: Sie gibt keine Auskunft darüber, ob sich Patienten einen Keim im Krankenhaus einfingen oder ob sie ihn mitbrachten und er im Krankenhaus ausbrach. Was erstaunlich ist, denn die sogenannten Krankenhauskeime sind ein Schwerpunkt der Bemühungen um mehr Hygiene im Gesundheitswesen. Die konkreten Infektionswege zu kennen sollte selbstverständlich sein.

In Großbritannien müssen Kliniken seit Jahren offenlegen, wie viele MRSA-Fälle sie im vergangenen Jahr hatten. Die Zahl der MRSA-Infektionen ist innerhalb von zehn Jahren von 7.700 auf 862 pro Jahr gesunken – wohl auch eine Folge dieser Transparenz. Auch in Frankreich kann jeder sehen, wie gut die Hygiene in seinem Krankenhaus ist.

Nach langem Hin und Her haben wir für neun der zehn angefragten Kreise eine Auflistung bekommen, die zeigt, wie sich die MRSA-Fälle auf die einzelnen Krankenhäuser verteilen. Die Stadt Mönchengladbach und der Landkreis Goslar wollten uns keine Detailzahlen nennen. Mönchengladbach hat sich das im letzten Moment anders überlegt und kurz vor Veröffentlichung dieses Blogeintrags die Zahlen geschickt. Gegen Goslar haben wir Klage eingereicht und hoffen, die entsprechenden Zahlen nachreichen zu können.

Kategorien: Datenjournalismus

Wo das Volk auf die Straße ging

Von 8. November 2014 um 08:00 Uhr

Von David Schraven

Vor 25 Jahren brach das Unrechtsregime der DDR in sich zusammen. Das Ende des SED-Staats war das Ergebnis einer friedlichen Revolution. Millionen Bürger demonstrierten zwischen Rostock und Chemnitz, von Suhl bis Neubrandenburg. Sie gingen auf die Straße, nicht nur zum Mauerfall, sondern auch, weil sie für ihre Freiheit protestierten.

Heute ist dieser Volksaufstand und die anschließende Wiedervereinigung in der Erinnerung einiger Menschen zusammengeschnurrt auf das Verhandlungsgeschick weniger Personen. Helmut Kohl, der damalige Bundeskanzler, sagt etwa: Nicht die Bürgerrechtsbewegung hätte “in erster Linie” die Wende durchgesetzt. Vielmehr sei Gorbatschow durch “die Bücher durchgegangen” und habe festgestellt, dass er “am Arsch des Propheten” sei. Vorstellungen, die Revolutionäre im Osten hätten den Zusammenbruch der DDR bewirkt, seien dem „Volkshochschulhirn von Thierse“ entsprungen.

Das Archiv Bürgerbewegung Leipzig e.V. hat die Daten der Revolution gesammelt: Alle Demonstrationen zwischen dem 13. August 1989 und dem 30. April 1990. Die Besetzungen der Stasizentralen, die Proteste und Märsche. Das Recherchebüro CORRECT!V hat diese Daten sichtbar gemacht. Man erkennt, wie der Protest immer größer wird, bis er das ganze Land erfasst, und wie sich aus einzelnen Stimmen ein Sturm der Empörung formt, der die Herrschaft der Honeckers und Mielckes hinwegfegt.

Kategorien: Datenvisualisierung

Rostige Brücken, unverständliche Daten

Von 2. September 2014 um 12:14 Uhr
Darstellung der Geodaten einer Bahnbrücke auf der Strecke 4111 im Portal von Geo++. Quelle: http://db.geopp.de/gnrailnav_servlet/GNOpenLayersV3

Darstellung der Geodaten einer Bahnbrücke auf der Strecke 4111 im Portal von Geo++. Quelle: http://db.geopp.de/gnrailnav_servlet/GNOpenLayersV3

Woher stammen die Daten für unsere Karte über den Zustand deutscher Bahnbrücken? Ursprung ist ein Datensatz der Deutschen Bahn, genauer: 16 Datensätze. Die Grünen hatten im Bundestag in kleinen Anfragen wissen wollen, in welchem Zustand die deutschen Bahnbrücken sind. Sie stellten für jedes Bundesland eine entsprechende Anfrage.


Als Antwort veröffentlichte das Bundesverkehrsministerium für jedes Bundesland PDF’s mit langen Listen der Bahn, hier beispielsweise die für Baden-Württemberg. Zum Teil waren die Tabellen dabei nur als Grafik eingebunden. Diese Daten ließen sich dann nur mittels einer Texterkennungssoftware weiterverarbeiten.

Außerdem lieferte die Deutsche Bahn die Informationen in einem Format, das nur die Bahn selbst nutzen kann. Die Lage der Brücken wurde mit einer internen Streckennummer und einer Kilometerbezeichnung angegeben. Dort stand dann also beispielsweise “Karlsruhe, 4111, 23,2 + 33, 23,2 + 36 4″. Karlsruhe ist der Name des Netzsegments, einer internen Aufteilung der Strecken, 4111 ist die Streckennummer. Die Kilometerzahl bezeichnet den Beginn und das Ende der Brücke auf dieser bestimmten Strecke. In diesem Fall also beginnt die oben im Bild zu sehende Brücke an Kilometer 23,2 und 33 Metern und endet an Kilometer 23,2 und 36,4 Metern.

Wo genau sich diese eine Brücke befindet, lässt sich damit nicht sagen. Das aber dürfte die Information sein, die die meisten Bahnfahrer interessiert. Trotzdem hat die Bahn die Daten für den Bundestag nur in ihrem schwer verständlichen Format herausgegeben.

Die Bahn selbst war bei der Suche nach den Standorten keine Hilfe. Die Antwort dort: Das Lokalisieren aller Brücken sei zu aufwändig. Bahnmitarbeiter würden aber TomTom-Navigationsgeräte nutzen, wenn sie zu bestimmten Streckenkilometern fahren sollten. Man solle doch mal bei TomTom nachfragen, da gebe es die Daten vielleicht.

Wir haben dort gar nicht erst gefragt. Wer erfahren will, wo die Schrottbrücken sind, kann auch im sogenannten Eisenbahnatlas nachschlagen. Den gibt es gedruckt zum Preis von 44 Euro.

Glücklicherweise gibt es außerdem das Unternehmen Geo++. Das entwickelt für die Bahn AG geodatenbasierte Anwendungen. Im Internet hat es eine Seite bereitgestellt, auf der sich die Positionen auf dem Streckennetz suchen und anzeigen lassen. Dort allerdings alle 25.919 Brücken einzeln herauszusuchen, ist etwas mühsam.

Geo++ erklärte sich bereit, bei der Darstellung zu helfen und schickte einen Datensatz mit der Geoposition jeder einzelnen Brücke. Erst mit diesem Datensatz war es möglich, die Bauwerke auf eine Karte zu projizieren. Dazu nutzen wir die Karten von MapBox auf der Basis der offenen Daten von OpenStreetMap.

Damit auch andere diese Informationen nutzen können, stellen wir hier den Datensatz zur Verfügung. Außerdem haben wir ihn OpenStreetMap gespendet, beziehungsweise dem Eisenbahn-Ableger der freien Kartensoftware, OpenRailwayMap. Dort fehlen viele Brücken bislang. Die vorliegenden Daten zu Brücken habe man durch Beobachtungen bei Zugfahrten und Auswertungen von freigegebenen Luftbildern gemacht.

Nachtrag 3. September: Simon Woerpel hat die Daten genommen und neu zusammengebaut. Auf seiner Karte ist zu jeder Position das Satellitenbild der Brücke zu sehen.

Nachtrag 8. September: Die Ruhrnachrichten haben eine lokale Version zusammengestellt und nachgefragt, welche der kaputten Brücken in ihrer Region erneuert werden sollen und welche nicht.

 

Kategorien: Datenjournalismus

Festgenommene in Ferguson

Von 22. August 2014 um 16:11 Uhr
Festnahmen bei Protesten in Ferguson nach Ort der Festnahme Quelle: http://www.washingtonpost.com/wp-srv/special/national/ferguson-arrests/

Festnahmen bei Protesten in Ferguson nach Ort der Festnahme Quelle: http://www.washingtonpost.com/wp-srv/special/national/ferguson-arrests/

Wer wurde bei den Protesten in Ferguson in den USA warum festgenommen? Die Washington Post präsentiert hier die Zahlen. Häufigster Grund: “refusal to disperse“, also die Weigerung, sich zu zerstreuen, auseinander zu gehen.

In der Grafik zu sehen sind nur diejenigen, die ins St. Louis County Jail kamen. Nicht enthalten sind Festgenommene, die in Gemeindegefängnissen sitzen. Hier hat die Zeitung noch eine Auflistung der Festnahmen pro Tag der Proteste.

Festgenommene Journalisten sind nicht extra ausgewiesen.

(via @ChElm)

Kategorien: Datenjournalismus

Nicholas Feltons Leben als Datenquelle

Von 21. August 2014 um 16:20 Uhr
Nicholas Feltons Kontaktnetzwerk Quelle: http://feltron.com/FAR13.html

Nicholas Feltons Kontaktnetzwerk Quelle: http://feltron.com/FAR13.html

Jedes Jahr präsentiert Nicholas Felton sein Leben. In Grafiken und Charts zeigt er allen, die es interessiert, womit er seine Zeit verbrachte, was er aß, wie er schlief, wo er sich herumtrieb.

Felton wurde mit seinen Jahresberichten über sich selbst zum Vorreiter einer ganzen Bewegung, die es sich zur Aufgabe gemacht hat, das eigene Tun zu überwachen und zu vermessen: quantified self. Die Idee: Das Selbst mehr oder weniger genau in Daten auszudrücken, um mehr über sich zu erfahren. Und er ist einer der Architekten der Timeline von Facebook, in der den Nutzern Informationen von diversen Quellen präsentiert werden.

Gerade hat Felton zum neunten Mal seinen Bericht veröffentlicht. In diesem Jahr hat er darin vor allem sein Kommunikationsverhalten analysiert. Wie viele E-Mails, wie viele SMS; über welche Themen redete er mit wie vielen Menschen – all das, was Geheimdienste interessiert, wenn sie jemanden ausspähen, hat Felton über sich selbst gesammelt und in aufwendigen Grafiken visualisiert.

Er analysierte dazu die Metadaten und den Inhalt von 44.041 SMS, 31.769 E-Mails, 12.464 Gesprächen, 4.511 Facebook Messages und 1.719 physischen Briefen und Postkarten.

Nicholas Feltons Kommunikation 2013 Quelle: http://feltron.com/FAR13.html

Nicholas Feltons Kommunikation 2013 Quelle: http://feltron.com/FAR13.html

Was hat Felton über sich erfahren? Der Kommunikationsreport 2013 habe ihn zu der Einsicht gebracht, dass er zu viel Zeit mit Belanglosem verbringe. Dem Bits-Blog der New York Times sagte er: “I need to do a better job of engaging in more meaningful communication and spend less time with trivial email and social media.

Wer sich selbst überwachen will, Felton hat inzwischen auch eine kostenpflichtige App entwickelt (nur für iOS), mit der jeder seine eigenen Daten sammeln kann. Übermittelt werden sie nicht. Der Nutzer entscheidet, was er anschließend damit anstellt und ob er sie irgendwann löscht oder zu einem Bericht seines Lebens baut, wie Felton es tut.

Felton tut das nicht zum Selbstzweck, sein Beruf ist es, Daten so aufzubereiten, dass andere sie verstehen können. Daten sind sein Leben. Und nicht nur seins. Unsere Daten seien Teil unserer Identität, sagt er in einem Video der New York Times. Daher sei es wichtig zu wissen, wer Zugriff auf unsere Daten habe und was er damit anstelle.

Racial Profiling in St. Louis

Von 14. August 2014 um 15:16 Uhr
Karte von St. Louis, die Farben zeigen die Ethnie der Bewohner, Weiße in blau, Schwarze in grün. Der eingekreiste Bezirk Ferguson wird von beiden bewohnt. Quelle: US-Zensusdaten, Racial Dot Map

Karte von St. Louis, die Farben zeigen die Ethnie der Bewohner, Weiße in blau, Schwarze in grün. Der eingekreiste Bezirk Ferguson wird von beiden bewohnt. Quelle: US-Zensusdaten, Racial Dot Map

Im Bezirk Ferguson der Stadt St. Louis gibt es seit Tagen Unruhen, ein schwarzer Jugendlicher wurde von einem Polizisten erschossen. Der Vorwurf lautet, dass die Polizei rassistische Vorurteile hegt. In dem Bezirk leben Schwarze und Weiße nebeneinander – ganz im Gegensatz zu den meisten anderen Vierteln der Stadt. Doch werden beide Bevölkerungsgruppen von der Polizei nicht gleich behandelt. Das zeigen Daten des Generalstaatsanwalts des Bundesstaates Missouri, in dem St. Louis liegt.

Seit dem Jahr 2000 gibt es in Missouri ein Gesetz, das von der Polizei fordert, bei jeder Verkehrskontrolle auch die Hautfarbe des Fahrers oder der Fahrerin zu registrieren. Die Daten werden erhoben, um das sogenannte racial profiling zu verhindern, die Ungleichbehandlung von Menschen aufgrund ihrer Hautfarbe. Besonders gut funktioniert das nicht, wie die Daten zeigen, die der Attorney General veröffentlicht hat: Schwarze und Hispanics werden in Missouri häufiger von der Polizei angehalten, häufiger durchsucht und dabei häufiger festgenommen als es ihrem Anteil in der Gesamtbevölkerung entspräche. Gleichzeitig findet die Polizei bei diesen Kontrollen bei ihnen weniger illegale Gegenstände.

Ergänzung: Die Einzeldaten der Bezirke wie Ferguson, die in der Grafik zu sehen sind, finden sich hier.

 

Wen die Polizei in Missouri im Jahr 2013 wie oft bei Verkehrskontrollen anhielt und durchsuchte. Quelle: Missouri Attorney General http://ago.mo.gov/VehicleStops/2013/. Grafik: ZON/Leslie Young

Wen die Polizei in Missouri im Jahr 2013 wie oft bei Verkehrskontrollen anhielt und durchsuchte. Quelle: Missouri Attorney General http://ago.mo.gov/VehicleStops/2013/. Grafik: ZON/Leslie Young

(via St. Louis Post-Dispatch)

Kategorien: Datenvisualisierung

Personalisierte Propaganda

Von 8. August 2014 um 14:22 Uhr
Gilad Lotans Analyse von Twitter-Accounts zum Thema Gaza-Konflikt. Proisraelische Twitterer (hellblau), propalästinensische Twitterer (grün) und internationale Medien (grau). Quelle: Medium

Gilad Lotans Analyse von Twitter-Accounts zum Thema Gaza-Konflikt. Proisraelische Twitterer (hellblau), propalästinensische Twitterer (grün) und internationale Medien (grau). Quelle: Medium

In Konflikten wie dem in Gaza geht die Meinung darüber, was bei den Kämpfen passiert, weit auseinander. Beide Seiten beschuldigen sich immer wieder der Desinformation und beide werfen Medien vor, parteiisch zu sein. Ursache dafür ist ein Phänomen, das Eli Pariser die Filter-Blase genannt hat – beide Seiten informieren sich aus unterschiedlichen Quellen und es gibt kaum Informationslieferanten, die von allen genutzt werden.

Das ist nicht überraschend und auch kein neues Phänomen. Spannend aber ist, wie eindeutig sich dieser Bias in den Daten sozialer Netzwerke beobachten lässt.

Gilad Lotan ist Chief Data Scientist bei Betaworks, einer Risikokapitalfirma, die auch eigene Projekte wie beispielsweise die GIF-Suche Giphy entwickelt. Lotan hat Daten von Twitter, Instagram und anderen Netzwerken analysiert und visualisiert, um diese Form der “personalisierten Propaganda”, wie er es nennt, zu zeigen. Dazu hat er bei Medium einen Text veröffentlicht.

Lotan untersuchte Twitterer, die im Juli 2014 in irgendeiner Form auf die Bombardierung der Schule des Flüchtlingshilfswerks der Vereinten Nationen (UNRWA) in Gaza reagierten. Der Inhalt der Reaktionen waren nicht entscheidend, vielmehr erstellte Lotan eine Karte, auf der die Accounts danach angeordnet wurden, wem sie folgen.

Die Größe der Punkte gibt an, wie viele Follower ein Account hat, je größer der Punkt, desto mehr Menschen folgen diesem Twitterer. Je enger zusammen zwei Punkte stehen, desto mehr gemeinsame Kontakte haben die beiden Accounts – folgen also denselben Quellen. Durch das zweite Kriterium ergaben sich mehrere Cluster oder Ballungen in den Daten. Innerhalb dieser Ballungen folgt man den gleichen Accounts. Dabei ging es nicht darum, was diejenigen twittern, sondern lediglich um die Analyse, wer wem folgt. Zwischen diesen Ballungen bestehen demnach kaum oder gar keine Verbindungen, sie sind deutlich voneinander abgegrenzt.

Lotan konnte so mehrere Gruppen in der Kommunikation über den Konflikt identifizieren. Die von ihm hellblau eingefärbte Wolke auf der linken Seite zeigt Cluster, die vor allem sich selbst und proisraelischen Accounts folgen, die von ihm hellgrün eingefärbte Wolke rechts die Twitterer, die sich vor allem bei (pro-)palästinensischen Quellen informieren. Dazwischen befinden sich – grau eingefärbt – internationale Medien. Am linken Rand oben in dunkelblau sortieren sich Konservative aus den USA und Anhänger der dortigen Tea-Party-Bewegung.

Das Bild legt nahe, dass zwischen diesen einzelnen Gruppen nahezu keine Informationen ausgetauscht werden. Jede kommuniziert vor allem innerhalb ihres eigenen Clusters, da die Accounts nur denen folgen, die ihre Interessen teilen. Das belegt die These von Pariser, dass Menschen in einer Filter-Blase leben, die durch die Werkzeuge des Internets noch verstärkt wird. Denn Netzwerke wie beispielsweise Facebook analysieren, wofür sich jemand interessiert und schicken ihm dann noch mehr solcher Inhalte in seine Timeline, um mehr seiner Aufmerksamkeit und damit mehr Klicks zu bekommen. Bei Twitter ist das anders, trotzdem scheint es die Tendenz zu geben, eher jenen zu folgen, mit denen man übereinstimmt.

In der Grafik von Lotan werden internationale Medien vor allem von der propalästinensischen Gruppe genutzt. Das erkläre, schreibt Lotan, warum in Israel die Überzeugung existiere, internationale Medien würden vor allem israelfeindlich berichten.

Außerdem ist zu sehen, dass es nur eine Quelle gibt, denen beide Fraktionen gleichermaßen folgen: die israelische Zeitung Haaretz. Sie scheint die einzige zu sein, die von beiden Lagern gleichermaßen akzeptiert ist.

Das alles sagt nichts darüber aus, wie Medien über den Konflikt berichten und welche Berichte nun richtig oder falsch sind. Es zeigt aber, dass diejenigen, die die Berichte lesen und kommentieren, sich in vollkommen unterschiedlichen Sphären bewegen. Was die Gefahr erhöht, dass sie kein Verständnis füreinander aufbringen und die andere Seite als Gegner erleben, den es zu bekämpfen gilt. Und es erhöht die Gefahr dafür, dass die Beteiligten auf jeder Seite anfällig für Propaganda sind. Der Krieg am Boden hat also offensichtlich leider auch im Netz zu einer klaren Front geführt.

Noch mal, das ist nicht neu. Aber es ist dank Lotans Analyse nun sichtbar.

Kategorien: Datenprojekt

Graph TV gibt Einblicke in die Fernsehkultur

Von 15. April 2014 um 16:37 Uhr

Nein, wir möchten an dieser Stelle nicht zu viel spoilern, aber sagen wir so: Hochzeiten sind in der Serienwelt von Game of Thrones ein gefährliches Pflaster; unvergessen ist die vorletzte Folge der dritten Staffel, in der gleich mehrere Hauptfiguren das Zeitliche segneten.

Selten hatte eine einzelne TV-Episode für so viele unterschiedliche Reaktionen im Netz und bei den Zuschauern gesorgt; der Begriff Red Wedding ist für viele Serienfans längst ein geflügeltes Wort. Umso überraschender ist, dass die Episode mit einer Nutzerwertung von 9,9 in der Internet Movie Database (IMDb) ziemlich nah dran ist an dem perfekten Ergebnis, wie die Datenvisualisierung Graph TV von Kevin Wu zeigt.

got

Die IMDb gilt als die größte Datenbank für TV- und Filminhalte, und mit ihren Bewertungen als ein guter Gradmesser für die Rezeption in der Öffentlichkeit. Graph TV nimmt diese Nutzerbewertungen und visualisiert sie für jede Serie. Das ist simpel, gibt aber einen interessanten Einblick in die Serienkultur. Die Wertungen von Game of Thrones steigen auch nach drei Staffeln noch leicht, wie die weiße Trendlinie zeigt.

Andere Serien können das nicht von sich behaupten. Der moralische Serienmörder Dexter etwa konnte in der siebten Staffel zwar noch einmal aufholen, bevor er in der achten Staffel dann endgültig – Achtung Spoiler – baden ging. Die letzte Dexter-Episode gilt gemeinhin als ein Desaster der jüngeren TV-Geschichte, wie auch die miese Wertung von 4,9 beweist.

dexter

Generell ist es wenig überraschend, dass die meisten Serien in der Gesamtwertung abfallen, je länger sie dauern. Dr. House, The Big Bang Theory und das kürzlich beendete How I Met Your Mother sind nur drei Beispiele von Serien, die sich nach mehreren Jahren zunehmend erschöpften, wenn auch nur gering.

him

Breaking Bad scheint dagegen eine Ausnahme zu sein. Während die Serie von Beginn an gut aufgenommen wurde, stieg sie sogar mit jeder Staffel um einen viertel Punkt in der Gunst der IMDb-Nutzer. Die Daten korrelieren in diesem Fall stark mit den Einschaltquoten: Während in der ersten Staffel gerade einmal 1,5 Millionen Menschen zuguckten, waren es beim Finale über zehn Millionen.

breakingbad

Doch bedeuten mehr Zuschauer automatisch bessere Bewertungen? Auch wenn Graph TV nicht direkt die Einschaltquoten mitliefert, lässt sich die Annahme schnell widerlegen. Veronica Mars, die Serie, die gerade erst mithilfe einer Crowdfunding-Kampagne verfilmt wurde, hatte zum Ende hin die schlechtesten Einschaltquoten. Bei den den Nutzern von IMDb aber konnte sie zum Ende hin noch einmal sehr positive Bewertungen holen. Denkbar ist, dass die treuen Fans der Serie sich angesichts des drohenden Endes gütiger zeigten.

veronica

Auch ungewöhnliche Phänomene legt GraphTV offen. So fällt bei den Sopranos die gesamte vierte Staffel komplett ab im Vergleich zu den restlichen. Für Kritiker wie Matt Zoller Seitz von Vulture fühlte sich die Staffel an wie “die zweite Hälfte einer sehr langen dritten Staffel”, die Figuren entwickelten sich kaum weiter. Das fiel offenbar auch den Zuschauern auf. Dennoch ist die starke Abweichung von fast einem ganzen Punkt kurios.

sopranos1

Interessant ist zudem, dass viele Serien zu Beginn der Staffel niedriger bewertet werden als zum Ende hin. Beobachten lässt sich das unter anderem bei den beiden erfolgreichen Drama-Serien Mad Men und The Wire.

wire

Eine Erklärung könnte sein, dass diese Serien stark von der Entwicklung ihrer Protagonisten leben, die sich erst im Laufe einer Staffel zeigt. In anderen Worten: Eine gute Serie steigert sich stets zum Ende hin. Und zur Not gibt es ja immer noch blutige Hochzeiten.

(via Wired)

Kategorien: Datenvisualisierung