Ihr Standort: movisco // Blog »
kontakt mail icon
kontakt phone icon

Glaube nur der Statistik, die du selbst gefälscht hast oder: die häufigsten Tücken beim Lesen einer visualisierten Statistik

„Die Statistik sagt aber etwas anderes“, so oder so ähnlich hört man es heutzutage häufig in unserer datendurchzogenen Welt. Zu jedem Thema gibt es Statistiken. Wussten Sie zum Beispiel, dass es donnerstags in England statistisch gesehen am häufigsten regnet? Ob Sie deswegen jetzt Ihren Regenschirm an den anderen Tagen zuhause lassen, müssen Sie dann selbst entscheiden. Neben eher kuriosen Statistiken gibt es natürlich auch viele sehr wichtige Statistiken wie beispielsweise, dass China im Jahr 2021 noch deutlich vor den USA und Deutschland Exportweltmeister waren. Aber sind Statistiken wirklich immer so aussagekräftig, sind sie nicht vielleicht auch mal zweideutig oder können sie gar fehlerhaft sein?

Seit 2010 findet alle fünf Jahre im Oktober der Weltstatistiktag statt. Als kleine Überbrückung zum nächsten Termin im Jahr 2025 möchte die movisco AG Sie einmal auf eine kleine Reise mitnehmen in die Welt der Statistik.

Letztendlich geht es bei Statistik vor allem darum, aus rohen Daten Erkenntnisse zu gewinnen. Da wir Menschen allerdings nur begrenzte Vorstellungskraft haben, werden diese Statistiken gerne visuell dargestellt. Dadurch werden sie leichter konsumierbar, Sachverhalte sind auf einem Blick schneller erkennbar und bleiben leichter im Kopf.

Neben diesen Vorteilen hat die visuelle Darstellung allerdings auch einige Tücken. Beispielsweise kann eine verzerrte Darstellung dazu führen, dass eine bestimmte Story erzählt wird, die im Sinne des Autors ist.

In unserem heutigen Blogbeitrag möchten wir einmal auf die häufigsten Tücken gerade beim Lesen einer visualisierten Statistik eingehen. Hierfür betrachten wir drei häufig genutzte Visualisierungen, gehen auf die Tücken ein und liefern eine Checkliste zum Erkennen von Verzerrungen.

Liniendiagramme

In Abbildung 1 sehen wir die viel besprochenen Großhandelsbenzinpreise im Zeitablauf von Januar 2005 bis April 2020.

Man erkennt in Abbildung 1 einen fluktuierenden Verlauf, der aber im Großen und Ganzen stabil ist.

Dieser Eindruck kann leicht verändert werden. In Abbildung 2 wurde die y-Achse reskaliert. Durch den verkleinerten Wertebereich (die Skala beginnt nicht mehr bei 0) erscheinen Ausschläge nun extremer. Der Abfall am Ende wirkt dadurch nun drastischer. Ein zusätzlicher Pfeil am Ende erweckt leicht den Eindruck, dass dieser Trend fortgesetzt wird.

Wenn wir die Grafik nun allerdings um weitere 2 Jahre ergänzen sehen wir ein ganz anderes Bild. Der Verlauf geht wie folgt weiter (Abbildung 3); der erweckte Trend stellt sich als falsch heraus und es gibt stattdessen einen steilen Anstieg. Falls man diesen nochmal besonders hervorheben möchte, kann dies durch eine Streckung der y-Achse noch einmal verstärkt werden kann (Abbildung 4).

Falls man stattdessen einen gegenteiligen Eindruck erwecken und zeigen möchte, dass die Benzinpreise nicht so stark gestiegen sind, kann man auch nur die letzten Datenpunkte abbilden. Das Ergebnis wäre dann Abbildung 5.

Individuell durch Parameter

Durch drei verschiedene Abbildungsansätze haben wir jeweils die Interpretation der Daten in verschiedene Richtungen gelenkt.

Die insgesamte Grafik, wie sie das Statistische Bundesamt (Destatis) veröffentlicht hat, ist in Abbildung 6 zu sehen.

Balkendiagramme

PISA-Studien sind internationale Untersuchungen, um die Leistung 15-jähriger Schülerinnen und Schüler aus verschiedenen Ländern in verschiedenen Bereichen zu messen und zu vergleichen. Die Ergebnisse erzeugen zuverlässig mediales Interesse und zu Recht heftige wissenschaftliche Debatten aus. Eine Auswertung der durchschnittlich erreichten Punktzahlen deutscher Nachbarländer im Bereich „Mathematik“ (Quelle: OECD) ergibt Abbildung 7. Man erkennt, dass es innerhalb dieser zehn Länder deutliche Leistungsunterschiede gibt. Die Niederlande als Primus ist hier mehr als doppelt so gut als das Schlusslicht Luxemburg.

Falls Sie nun stutzen, dann ist das genau die richtige Reaktion. Denn auch hier beginnt die y-Achse nicht bei 0, was zu einer falschen Schlussfolgerung führen kann. Tatsächlich beträgt der Unterschied zwischen beiden Ländern 7,45%.

Eine korrektere Skalierung ergäbe dies:

Die Unterschiede sind immer noch erkennbar, werden aber nun wahrheitsgemäßer abgebildet.

Tortendiagramme/Kreisdiagrammen

Ergebnisse von Wahlen werden oft in kreisförmigen Diagrammen dargestellt, um Anteile untereinander schnell ersichtlich zu machen. In der Regel findet man hierzu hierzu Torten- oder Kuchendiagramme. In Abbildung 9 ist ein Tortendiagramm auf dem die Zweitstimmenanteile der Bundestagswahl 2021 ersichtlich sind zu sehen.

Aufgrund der Perspektive entsteht der Eindruck, dass - besonders weil sämtliche Zahlen fehlen - die Partei, die farblich schwarz markiert ist, die größten Stimmenanteile besitzt. Dem ist aber nicht so. Wenn die gleichen Daten über ein Kreisdiagramm abgebildet werden, erkennt man (auch ohne Zahlen), dass diese nur zweitstärkste Partei ist.

„Ich glaube nur der Statistik, die ich selbst gefälscht habe.“

Wie man erkennt, können Informationen, die aus statistischen Erhebungen gewonnen werden, durch einfache Maßnahmen in verschiedenste Richtungen verzerrt werden. Besonders aufgrund dessen wird oft diese berühmte Aussage zitiert, die Winston Churchill zugeschrieben wird. Diese Aussage beinhaltet sicherlich einen Kern der Wahrheit. Eine gewisse Skepsis sollte immer gegeben sein, wenn man mit einer vereinfachten Darstellung von Zahlen konfrontiert wird. Doch wenn man dies berücksichtigt und neutral an die Statistik herantritt, erleichtern die daraus gewonnenen Informationen viele Entscheidungen.

Übrigens, das Statistische Landesamt Baden-Württemberg ist den Wurzeln des obigen Zitats nachgegangen und die Quellenlage deutet eher darauf hin, dass Winston Churchill dieses Zitat nie gesagt hat. Im Gegenteil, eine Auswertung der Quellen zeigt eher eine Person, die die Statistik sehr zu schätzen wusste. Die Richtigkeit des Zitats ist also fragwürdig. Hier haben Zitate etwas mit guten Statistiken gemeinsam. Die Quellen müssen korrekt belegt sein, sodass jede Aussage nachvollziehbar ist.

Tipp:

Besonders die letzte Checkliste fordert von den benutzten Daten eine hohe Qualität. Die movisco AG ist ihr Ansprechpartner bei allen Fragen rund um das Thema Datenqualitätsmanagement (DQM). Für einen Einblick, wie Sie von unserer Expertise profitieren können, lesen Sie gerne hier weiter.

 


Ihre Ansprechpartnerin

Susanne Jung

info@movisco.com
elektronische Visitenkarte

Fon +49 40 767 53 777

Schnellkontakt-Formular

Die abgesendeten Daten werden nur zum Zweck der Bearbeitung Ihres Anliegens verarbeitet. Weitere Informationen finden Sie in unserer Datenschutzerklärung.

Datenschutz bestätigt?

Sie haben Fragen?

Wir freuen uns über Ihre direkte Kontaktaufnahme!

  • Telefon: +49 40 767 53 777
  • E-Mail