Boxplot

Ein Boxplot ist ein boxartiges Diagramm, das zur Übersicht über die Verteilung eines Datensatzes dient.
Boxplot
Boxplot

Was ist ein Boxplot? – einfach erklärt

Der Boxplot ist ein wichtiges Darstellungstool in der Marktforschung, mit Hilfe dessen Lage- und Streuungsmaßnahmen übersichtlich dargestellt werden können. Durch die Abbildung von Minimum, Maximum, Median, aber auch „Ausreißern“, lässt sich ein schneller Eindruck über die angegeben numerischen Werte gewinnen. Ein Boxplot ist also vor allem dann sinnvoll, wenn es darum geht, einen Trend grafisch darzustellen.

  • Maximum / Minimum: Der höchste bzw. niedrigste numerische Wert.
  • Median: Teilt den Datensatz in zwei gleiche Hälften und darf nicht mit dem Mittelwert verwechselt werden. Der Median befindet sich mittig der Box, wenn die Daten symmetrisch verteilt sind, bei schiefer Verteilung, liegt der Median näher an einem Ende der Box.
  • Quartile: Zu unterteilen in unteres (Q1) und oberes (Q3) Quartil, wobei Q1 das untere Ende der Box markiert, in denen 25 % der Daten unterhalb dieses Wertes liegen. Q3 zeigt das obere Ende der Box, in der 75 % unterhalb dieses Wertes liegen.
  • Interquartilsabstand (IQR): Stellt die Differenz zwischen Q1 und Q3, also die Länge der Box dar und somit die mittleren 50 % der Daten. Der IQR ist damit ein Maß für die Streuung.
  • Whisker: Zeigen die Verteilung der Daten außerhalb der Box (IQR) an, umfassen aber nicht die Ausreißer, und werden mithilfe von Linien dargestellt. Auch die Whisker sind ein Maß für die Streuung.
  • Ausreißer: Alle Datenpunkte, die außerhalb der Whisker liegen.

Boxplot in der Marktforschung

Die Anwendung von Boxplots in der Marktforschung ist vielseitig. Das kann z.B. die Analyse von Umsatz- und Verkaufszahlen, der Vergleich verschiedener Gruppen, die Identifikation von Ausreißern, die Bewertung zentraler Tendenzen sowie Streuungen oder auch nur für die Visualisierung der Daten sein.

Boxplot Beispiel

Wenn beispielsweise die Kundezufriedenheit in der Marktforschung für verschiedene Produkte, Dienstleistungen oder andere Aspekte untersucht werden soll, ist es sinnvoll die gewonnenen Zufriedenheitswerte (z.B. auf einer Skala von 0 bis 10) für jede einzelne Abfrage zu visualisieren, um diese dann vergleichen zu können.

Die Visualisierung der Daten ermöglicht es dem Auftraggeber, schnell Erkenntnisse gewinnen zu können. Mit weiteren Analysen ist es dann möglich, basierend auf den erhobenen Ergebnissen, fundierte Entscheidungen treffen zu können, die wiederum zur Verbesserung der Kundezufriedenheit führen.

Boxplot Vorteile

Die Boxplot-Darstellung von Befragungsergebnissen birgt Vor- aber auch Nachteile. Auf der einen Seite ist die Darstellung der wichtigsten statistischen Kennzahlen mithilfe der Boxplot übersichtlicher. Dadurch lassen sich diese Kennzahlen, also Median, Quartile, Minimum und Maximum, besser vergleichen, vor allem, wenn mehrere Gruppen befragt worden sind. Die einzelnen Ergebnisse werden dann in mehreren Boxplots nebeneinander dargestellt, wodurch Unterschiede leicht erkennbar sind. Auch die Darstellungsform des Boxplots ermöglicht eine effiziente Identifikation von Besonderheiten, wie etwa Ausreißern oder ungewöhnliche Verteilungen. Ein weiterer Vorteil von Boxplots ist die schnelle Analyse von ersten Erkenntnissen ohne zeitaufwendige und kostenintensive Berechnungen.

Die Darstellung von Daten in Form einer Boxplot in der Ergebnispräsentation ist also übersichtlich, einfach und zeiteffizient.

Boxplot Nachteile

Auf der anderen Seite kann die Datendarstellung in Form einer Boxplot auch Nachteile haben. Die schnelle Übersicht über die Datenverteilung ist gut für einen schnellen Überblick, eignet sich jedoch nicht für detaillierte Analysen. Auch die vereinfachte Darstellung der Daten kann zu einem Informationsverlust führen, das heißt, dass teilweise Feinheiten in der Datenstruktur nicht erkannt werden können. Die Darstellung der Daten in einer Boxplot liefert also auch über die gegebenen Informationen keine weiteren. Boxplots bieten sich vor allem an, wenn es sich bei dem Datensatz um (überwiegend) numerische Daten handelt, die Anwendbarkeit ist also vor allem bei kategorisierten Daten und Datensätzen mit einigen wenigen Datenpunkten oder kleinen Wertebereichen eingeschränkt. Sind die Datensätze zu komplex oder mehreren sich in der Verteilung überlappenden Boxplots, kann es schwierig sein, diese richtig zu interpretieren, es ist daher umso wichtiger Boxplots gezielt einzusetzen um die auszuwertenden Daten einschätzen zu können.

Alles in allem eignen sich Boxplots insbesondere für einen ersten Überblick von numerischen Daten(-sätzen), die vereinfachte Darstellung sollte jedoch nicht die Komplexität des Datensatzes vergessen lassen. Boxplots ersetzen nämlich nicht tiefere und spezifischere Analysen.

Es gilt also der Grundsatz, wie sonst auch in der Marktforschung, dass stets das Forschungsziel im Auge behalten werden muss.