Ein Boxplot zeigt in kompakter Form, wie sich Werte verteilen, wo die Mitte liegt und ob einzelne Beobachtungen aus dem Rahmen fallen. Wer einen Boxplot interpretieren kann, erkennt schnell Lage, Streuung, Schiefe und Ausreißer, ohne sich durch lange Tabellen zu kämpfen. Genau darum geht es hier: Ich zeige die Bauteile, die Leseregeln und die typischen Fallen, die in Matheaufgaben und Datenauswertungen immer wieder auftreten.
Die wichtigsten Signale in einem Boxplot auf einen Blick
- Der Median markiert die Mitte der Daten, die Box enthält die mittleren 50 %.
- Der Interquartilsabstand IQR ist die Boxbreite und misst die Streuung im Kern der Daten.
- Lange oder ungleich lange Whisker deuten auf Schiefe oder ungleiche Streuung hin.
- Ausreißer sind Werte, die deutlich außerhalb des üblichen Bereichs liegen und immer geprüft werden sollten.
- Für Vergleiche sind Boxplots stark, für feine Verteilungen oder sehr kleine Stichproben nur eingeschränkt aussagekräftig.

So liest man die Elemente eines Boxplots
Der Boxplot, auch Kastendiagramm oder Box-Whisker-Plot genannt, verdichtet fünf Kennwerte auf engem Raum. Ich lese ihn immer in derselben Reihenfolge: erst die Mitte, dann die Streuung, dann die Form, dann mögliche Ausreißer. Das verhindert, dass man sich von einzelnen Extremwerten zu schnell blenden lässt.
| Element | Bedeutung | Was ich daraus ableite |
|---|---|---|
| Unteres Ende / Minimum | Der kleinste Wert im Datensatz oder der kleinste Wert ohne Ausreißer, je nach Darstellung | Wo der Datenbereich beginnt |
| Unteres Quartil Q1 | 25 % der Werte liegen darunter | Unterer Rand der Box |
| Median | 50 % der Werte liegen darunter und 50 % darüber | Typische Mitte der Verteilung |
| Oberes Quartil Q3 | 75 % der Werte liegen darunter | Oberer Rand der Box |
| Oberes Ende / Maximum | Der größte Wert im Datensatz oder der größte Wert ohne Ausreißer | Wo der Datenbereich endet |
| Ausreißerpunkte | Werte, die deutlich außerhalb des üblichen Bereichs liegen | Sonderfälle prüfen, nicht vorschnell ignorieren |
Wichtig ist eine kleine, aber relevante Nuance: In der klassischen Tukey-Darstellung reichen die Whisker bis zum äußersten Wert innerhalb von 1,5 × IQR, also innerhalb von 1,5-mal Interquartilsabstand. Manche Schulbücher und vereinfachte Darstellungen ziehen die Antennen dagegen bis Minimum und Maximum. Ich achte deshalb immer darauf, welche Konvention die Grafik verwendet, bevor ich zu viel hineinlese.
Wenn die Grundelemente klar sind, wird auch der nächste Schritt leichter: die Lage der Daten präzise zu deuten.
Median, Quartile und Interquartilsabstand richtig einordnen
Für die eigentliche Interpretation sind drei Größen zentral: Median, Q1 und Q3. Zwischen Q1 und Q3 liegt die mittlere Hälfte aller Werte, also 50 % der Daten. Genau dieser Bereich ist oft aussagekräftiger als Extremwerte, weil er weniger von Ausreißern beeinflusst wird. Das nennt man robust: Ein Maß bleibt brauchbar, auch wenn einzelne Werte ungewöhnlich hoch oder niedrig sind.
Ein kurzes Beispiel macht das greifbar: Liegen Q1 = 12, Median = 18 und Q3 = 26, dann liegen 50 % der Werte zwischen 12 und 26. Der Interquartilsabstand beträgt dann IQR = 26 - 12 = 14. Die Box ist in diesem Fall relativ breit, also ist die Streuung im Kern der Daten spürbar. Liegt der Median eher nah bei Q1, dann zieht sich die obere Hälfte stärker auseinander; liegt er näher bei Q3, ist es umgekehrt. Genau daran erkenne ich oft schon, ob eine Verteilung symmetrisch wirkt oder nicht.
Ein häufiger Denkfehler besteht darin, den Median mit dem Mittelwert gleichzusetzen. Das ist nicht dasselbe. Der Mittelwert reagiert empfindlich auf extreme Werte, der Median viel weniger. Deshalb ist der Median im Boxplot das wichtigere Maß, wenn es um eine stabile Lagebeschreibung geht. Manche Programme blenden den Mittelwert zusätzlich ein, aber das ist eine Ergänzung, nicht das Herzstück der Grafik.
Wer die Box richtig liest, versteht meist auch schon, warum die Whisker manchmal so unterschiedlich ausfallen.
Whisker, Schiefe und Ausreißer lesen
Die Whisker, also die Antennen links und rechts der Box, erzählen etwas über die Form der Verteilung. Sind sie ungefähr gleich lang und liegt der Median eher mittig in der Box, spricht das für eine eher symmetrische Verteilung. Ist der rechte Whisker deutlich länger, deutet das oft auf eine Rechtsschiefe hin. Ist der linke Whisker länger, spricht das eher für eine Linksschiefe.
Ich formuliere das bewusst vorsichtig, denn die Länge der Whisker ist ein Hinweis, kein Beweis. Eine Schiefe lässt sich aus dem Boxplot gut vermuten, aber nicht in jedem Fall endgültig feststellen. Dafür braucht man manchmal zusätzliche Darstellungen wie ein Histogramm oder die Rohdaten. Ein Boxplot verdichtet schließlich, er ersetzt keine vollständige Verteilungsanalyse.
Für Ausreißer nutze ich im Kopf meist diese einfache Regel:
- Untere Grenze = Q1 - 1,5 × IQR
- Obere Grenze = Q3 + 1,5 × IQR
- Werte außerhalb dieser Grenzen gelten als Ausreißer
Nochmal mit dem Beispiel von oben: Wenn Q1 = 12 und Q3 = 26, dann ist IQR = 14. Daraus folgt eine untere Grenze von 12 - 21 = -9 und eine obere Grenze von 26 + 21 = 47. Werte oberhalb von 47 oder unterhalb von -9 wären in dieser Rechnung auffällig. In der Praxis heißt das aber nicht automatisch, dass sie falsch sind. Ein Ausreißer kann ein Messfehler sein, er kann aber genauso gut ein echter Sonderfall sein, den man gerade nicht wegwerfen sollte.
Genau deshalb schaue ich bei Ausreißern nie nur auf die Grafik, sondern auch auf den Kontext der Daten. Das ist der Punkt, an dem aus einem rein formalen Diagramm eine wirklich brauchbare Analyse wird.
Mehrere Gruppen sinnvoll vergleichen
Boxplots spielen ihre Stärke vor allem dann aus, wenn man Gruppen gegenüberstellen will. Zwei oder drei Verteilungen lassen sich viel schneller vergleichen als in einer langen Werteliste. Ich achte dabei zuerst auf den Median, dann auf die Boxbreite und erst danach auf die Whisker. So bleibt der Blick auf die typische Lage und die Kernstreuung gerichtet, statt sich an einzelnen Endpunkten festzuhaken.
| Vergleichsfrage | Worauf ich schaue | Was das meist bedeutet |
|---|---|---|
| Welche Gruppe liegt höher? | Median | Welche Werte typischerweise größer sind |
| Welche Gruppe streut stärker? | Boxbreite / IQR | Wo die mittleren 50 % weiter auseinanderliegen |
| Welche Gruppe hat längere Extrembereiche? | Whisker | Ob die Verteilung in eine Richtung länger ausläuft |
| Wo gibt es ungewöhnliche Werte? | Ausreißerpunkte | Ob einzelne Beobachtungen außerhalb des Normbereichs liegen |
| Sind die Gruppen fair vergleichbar? | Skala und Stichprobengröße | Ob die Grafik dieselbe Bezugsbasis hat |
Ein kleines Beispiel: Gruppe A hat einen Median von 68 und einen IQR von 6, Gruppe B einen Median von 70 und einen IQR von 14. Dann liegt B zwar leicht höher, streut aber deutlich stärker. Genau diese Kombination ist in Prüfungsaufgaben oft der entscheidende Punkt: Nicht nur, wer oben liegt, sondern auch, wie stabil die Werte sind. Eine höhere Mitte bei gleichzeitig viel größerer Streuung ist etwas anderes als eine eng gebündelte Gruppe.
Bei kleinen Stichproben bin ich vorsichtig. Unter etwa 20 Werten kann ein Boxplot schnell grob wirken, obwohl die Datenlage noch zu dünn ist, um sichere Schlüsse zu ziehen. Zwei Boxplots können optisch deutlich unterschiedlich aussehen und trotzdem aus derselben Grundgesamtheit stammen, wenn die Zufallsschwankung groß genug ist. Für saubere Vergleiche zählt deshalb nicht nur die Form der Grafik, sondern auch der Umfang der Daten.
Wenn der Vergleich sitzt, lohnt sich der Blick auf die typischen Fehler, die in Aufgaben und Anwendungen immer wieder vorkommen.
Typische Fehler, die ich immer wieder sehe
Die meisten Fehlinterpretationen sind erstaunlich simpel. Sie entstehen nicht, weil der Boxplot schwer wäre, sondern weil man ein oder zwei zentrale Regeln übersieht. Ich achte deshalb auf dieselben Stolperstellen:
- Median und Mittelwert werden verwechselt. Der Median steht im Boxplot im Vordergrund, nicht der arithmetische Mittelwert.
- Die Whisker werden als absolute Minimum- und Maximumwerte gelesen, obwohl manche Darstellungen die 1,5-IQR-Regel verwenden.
- Die Box wird mit dem gesamten Datenbereich verwechselt. Tatsächlich zeigt sie nur die mittleren 50 %.
- Ausreißer werden automatisch als Fehler behandelt. Das ist riskant, weil ein ungewöhnlicher Wert auch inhaltlich korrekt sein kann.
- Boxplots werden als vollständiges Bild der Verteilung missverstanden. Häufigkeiten, Lücken oder mehrere Gipfel sieht man damit nur eingeschränkt.
- Grafiken mit unterschiedlichen Skalen werden direkt nebeneinander verglichen. Dann kann die Optik täuschen, obwohl die Zahlen anders sprechen.
Gerade der letzte Punkt ist wichtig: Wenn zwei Boxplots auf verschiedenen Achsen oder mit unterschiedlich gewähltem Maßstab dargestellt werden, kann ein Blick schnell in die Irre führen. Ich prüfe deshalb immer zuerst die Skala und dann die Form. Wer zusätzlich ein Histogramm oder die Rohdaten hat, sieht oft noch genauer, ob die Verteilung glatt, schief oder mehrgipflig ist.
Am Ende hilft ein kurzer Prüfungscheck, damit die Interpretation in wenigen Sekunden sitzt.
Ein schneller Prüfungscheck für sichere Aussagen
Wenn ich einen Boxplot in einer Aufgabe oder in einer Auswertung bewerte, gehe ich immer in derselben Reihenfolge vor. Das spart Zeit und macht die Aussage belastbarer:
- Ich prüfe den Median und frage zuerst: Wo liegt die typische Mitte?
- Ich vergleiche die Boxbreite und frage: Wie stark streuen die mittleren 50 %?
- Ich schaue auf die Whisker und frage: Gibt es Schiefe oder auffällige Extrembereiche?
- Ich prüfe mögliche Ausreißer und bewerte sie im Kontext, nicht automatisch als Fehler.
- Ich schaue auf Stichprobengröße und Skala, damit ich die Grafik nicht überinterpretiere.
Wenn du diese Reihenfolge beibehältst, wird aus dem Diagramm kein Rätsel, sondern ein schnelles Werkzeug für klare Aussagen. Für Matheaufgaben reicht oft schon eine saubere Dreiteilung: Lage, Streuung und Auffälligkeiten. Genau so lese ich einen Boxplot auch dann noch, wenn die Grafik auf den ersten Blick unscheinbar wirkt.