Boxplots
Ein Boxplot ist ein nützliches statistisches Werkzeug zur Veranschaulichung von Datensätzen. Er zeigt den Median, die Quartile, das Minimum und das Maximum der Daten. Durch die Box und die "Antennen" werden Datenpunkte gruppiert und ihre Verteilung verdeutlicht. Neugierig geworden? Dies und vieles mehr finden Sie im folgenden Text.
die Noten verbessern
In wenigen Schritten dieses Video freischalten & von allen sofatutor-Inhalten profitieren:
in nur 12 Minuten? Du willst ganz einfach ein neues
Thema lernen in nur 12 Minuten?
-
5 Minuten verstehen
Unsere Videos erklären Ihrem Kind Themen anschaulich und verständlich.
92%der Schüler*innen hilft sofatutor beim selbstständigen Lernen. -
5 Minuten üben
Mit Übungen und Lernspielen festigt Ihr Kind das neue Wissen spielerisch.
93%der Schüler*innen haben ihre Noten in mindestens einem Fach verbessert. -
2 Minuten Fragen stellen
Hat Ihr Kind Fragen, kann es diese im Chat oder in der Fragenbox stellen.
94%der Schüler*innen hilft sofatutor beim Verstehen von Unterrichtsinhalten.
Das Boxplot Quiz besiegt 60% der Teilnehmer! Kannst du es schaffen?
Quiz startenDu musst eingeloggt sein, um bewerten zu können.
Wow, Danke!
Gib uns doch auch deine Bewertung bei Google! Wir freuen uns!
Grundlagen zum Thema Boxplots
Boxplot – Definition
Wenn du Median und Mittelwert bereits kennst, ist der Boxplot der nächste Schritt für eine aufschlussreiche Darstellung von Datensätzen und Messungen in der Mathematik bzw. Statistik.
Der Boxplot dient der Auswertung statistischer Daten. Durch den Median und zwei kleine Mediane, die sogenannten Quartile, wird eine Box definiert. Durch diese werden Datenpunkte übersichtlich gruppiert und ihre Verteilung verdeutlicht.
Boxplot – Erklärung
Boxplots werden genutzt, um Datensätze übersichtlich darzustellen. Dazu wird die Menge aller Datenpunkte in vier Bereiche eingeteilt. Die Verteilung der Daten auf die Bereiche wird so vorgenommen, dass in jedem der vier Bereiche gleich viele Datenpunkte liegen. Das geht so:
- Durch den Median werden die Daten in zwei Bereiche geteilt. Links und rechts des Medians liegen gleich viele Datenpunkte. Damit das klappt, muss es zwischen den Datenpunkten eine Rangfolge geben und die Daten müssen dementsprechend geordnet sein.
- Der Datenpunkt, der am weitesten links vom Median liegt, ist das Minimum. Der Datenpunkt, der am weitesten rechts vom Median liegt, ist das Maximum.
- Zwischen dem Minimum und dem Median liegt ein weiterer Median, der diese Hälfte des Datensatzes wiederum in zwei Bereiche unterteilt. Dieser kleine Median wird auch erstes Quartil genannt.
- Zwischen dem Median und dem Maximum liegt ebenfalls ein kleiner Median, das sogenannte dritte Quartil. (Das zweite Quartil ist gleichbedeutend mit dem ursprünglichen Median.)
- Durch das Minimum, die drei Quartile und das Maximum werden die Daten in vier Bereiche geteilt. In diesen vier Bereichen liegt jeweils eine gleich große Anzahl an Datenpunkten.
Der Bereich zwischen erstem und dritten Quartil wird durch eine Box umschlossen – das ist die Box des Boxplots. Der Abstand der Werte zwischen erstem und dritten Quartil wird auch Interquartilsabstand genannt. Dieser Abstand entspricht der Länge der Box. Vom linken und rechten Rand dieser Box werden Linien zum Minimum bzw. Maximum gezeichnet – das sind die Antennen der Box, auf Englisch auch Whiskers genannt. Der Boxplot wird auch
Wusstest du schon?
Der Boxplot wurde 1977 von dem Mathematiker John Tukey entwickelt. Tukey war bekannt für seine kreative Herangehensweise an Statistik. Er hat den Boxplot genutzt, um Daten übersichtlicher darzustellen. Also, jedes Mal, wenn du einen Boxplot zeichnest, folgst du in seinen Fußstapfen!
Boxplot – Diagramm
Um einen Boxplot zeichnen zu können, müssen also die Datenpunkte geordnet werden und Minimum, Maximum und Median der Daten bestimmt werden. Wenn dann noch die zwei kleinen Mediane bestimmt werden, sind alle Komponenten des beisammen.
Komponente | Beschreibung |
---|---|
Minimum | Das ist der kleinste bzw. unterste Wert des Datensatzes. |
linke/untere Antenne (Whisker) | Das ist der linke bzw. untere Bereich des Datensatzes. Er enthält das untere bzw. kleinere Viertel der Datenpunkte. |
erstes/unteres Quartil (kleiner Median) | Das ist die Grenze zwischen dem linken bzw. unteren Bereich und der Box. |
zweites Quartil (Median) | Das ist der Median des Datensatzes. |
drittes/oberes Quartil (kleiner Median) | Das ist die Grenze zwischen der Box und dem rechten bzw. oberen Bereich. |
Box | Das ist der Bereich zwischen dem ersten und dritten Quartil. Er enthält die Hälfte aller Datenpunkte. Da die Box durch die beiden Quartile links und rechts des Medians begrenzt wird, wird dieser Bereich auch Interquartilsabstand genannt. |
rechte/obere Antenne (Whisker) | Das ist der rechte bzw. obere Bereich des Datensatzes. Er enthält das obere bzw. größere Viertel der Datenpunkte. |
Maximum | Das ist der größte bzw. oberste Wert des Datensatzes. |
Sehen wir uns ein Beispiel eines Boxplots an:
Hier sehen wir einen Datensatz mit $19$ Datenpunkten, die verschiedene Werte zwischen $1$ und $100$ darstellen. Zwei Datenpunkte liegen genau auf den Grenzen der Box, also dem ersten und dritten Quartil. Der Median, also das zweite Quartil, liegt ebenfalls genau auf einem Datenpunkt – das muss nicht immer so sein, denn bei einer geraden Anzahl an Datenpunkten wäre der Median der Mittelwert der beiden mittleren Datenpunkte.
In der Box liegen genauso viele Datenpunkte wie innerhalb der beiden Antennen zusammen (Das stimmt nicht ganz, da die Anzahl der Datenpunkte ungerade ist.)
Aus der Größe und Lage der Box können wir auf die Verteilung der Datenpunkte schließen. Dazu kommen wir später noch im Detail.
Boxplot – Whiskers
Die Whiskers (Antennen) werden von den Enden der Box, also dem ersten bzw. dritten Quartil, bis zum Minimum bzw. Maximum gezeichnet. Ans Ende eines Whiskers wird ein vertikaler Strich gesetzt, um den jeweiligen Whisker klar abzugrenzen.
Boxplot – Ausreißer
Es gibt einen Sonderfall, in dem ein Whisker nicht genau bis zum Minimum bzw. Maximum verläuft: Wenn der Abstand eines Datenpunkts vom unteren oder oberen Quartil größer ist als das
Ausreißer sind Messwerte, die deutlich außerhalb der übrigen oder der erwarteten Ergebnisse liegen und mit hoher Wahrscheinlichkeit auf einen Messfehler oder eine außergewöhnliche Störung der Messung zurückzuführen sind. Solche Werte werden bei der Auswertung einer Statistik üblicherweise nicht berücksichtigt.
Ausreißer sind sowohl nach links/unten (jenseits des ersten Quartils) als auch nach rechts/oben (jenseits des dritten Quartils) möglich.
Gibt es einen oder mehrere Datenpunkte, die hinsichtlich des Interquartilsabstands einen Ausreißer darstellen, wird der entsprechende Whisker nur bis zu einer Länge des
Boxplot – Quartil
Der Median und die beiden kleinen Mediane werden als Quartile bezeichnet. Diese Bezeichnung bezieht sich darauf, dass die drei Quartile die Gesamtmenge aller Datenpunkte in vier Bereiche unterteilen.
Links bzw. unterhalb des ersten Quartils liegen die kleinsten bzw. untersten Werte des geordneten Datensatzes. Das sind die unteren $25\,\%$ aller Datenpunkte.
Rechts bzw. oberhalb des dritten Quartils liegen die größten bzw. obersten Werte des geordneten Datensatzes. Das sind die oberen $25\,\%$ aller Datenpunkte.
Die Box umschließt die mittleren $50\,\%$ des Datensatzes. Durch das zweite Quartil, also den Median, wird die Box in zwei Teile geteilt, in der wiederum jeweils $25\,\%$ aller Datenpunkte liegen.
Fehleralarm
Viele Schülerinnen und Schüler verwechseln den Median bei Boxplots mit dem Mittelwert. Der Median teilt die Stichprobe in zwei Hälften mit gleich vielen Datenpunkten, während der Mittelwert den Wert der Summe aller Datenpunkte geteilt durch ihre Anzahl darstellt.
Die Quartile teilen den Datensatz also in vier gleichgroße Bereiche hinsichtlich der Anzahl der Datenpunkte. Das bedeutet allerdings nicht, dass diese vier Bereiche auch die gleiche Länge haben. Denn je nachdem, wie die Daten verteilt sind, also wieviel Streuung es gibt, kann es sein, dass in einem Bereich viele Datenpunkte eng beieinander liegen oder die Datenpunkte über eine große Spanne von Werten gestreut sind. Liegen viele Datenpunkte eng beieinander, ist der entsprechende Bereich eher schmal, liegen die Datenpunkte hingegen weit auseinander, wird der Bereich entsprechend größer.
So dient ein Boxplot hauptsächlich dazu, auf den ersten Blick erfassen zu können, wie die Datenpunkte verteilt bzw. wie stark sie gestreut sind und in welchen Bereichen die Datenpunkte besonders konzentriert sind. Nur bei einer sehr gleichmäßigen Verteilung der Datenpunkte sind auch alle vier Bereiche nahezu gleich lang. Das heißt, die beiden Whiskers sind dann jeweils gleich lang und die Box bzw. der Interquartilsabstand ist so groß wie die beiden Whiskers zusammen.
Quartile sind Lagemaße, die einen Datensatz bzw. eine Verteilung in vier Bereiche teilen. Es sind auch andere Lagemaße denkbar, die einen Datensatz in fünf, zehn oder einhundert Bereiche teilen. Der Oberbegriff solcher Lagemaße lautet Quantile.
Quartile sind also auch Quantile: Das untere Quartil ist das
Boxplot – Beispiel
Beschäftigen wir uns im Folgenden noch etwas genauer mit dem Boxplot, indem wir ein konkretes Beispiel betrachten:
Die Schülerinnen und Schüler einer Kampfkunstschule müssen mit einem Handkantenschlag möglichst viele Holzbretter auf einmal durchschlagen. Natürlich kann man dabei auch einmal Glück haben und ein paar morsche Bretter erwischen. Damit wirklich die beste Schülerin bzw. der beste Schüler ermittelt werden kann, soll eine möglichst konsistente, also beständige, Leistung erbracht werden. Dazu werden mehrere Versuche ausgewertet. Das geht mit einem Boxplot.
Boxplot zeichnen
Um selbst einen Boxplot zu zeichnen, brauchen wir zuerst einen Datensatz. Dann können wir die einzelnen Schritte durchgehen. In unserem Beispiel der Kampfkunstschule beziehen sich die Daten auf die Anzahl durchgeschlagener Bretter einer einzelnen Schülerin bzw. eines einzelnen Schülers. Das könnte so aussehen:
Versuch Nr. | Anzahl der durchgeschlagenen Bretter |
---|---|
1. | 1 |
2. | 2 |
3. | 2 |
4. | 3 |
5. | 4 |
6. | 4 |
7. | 6 |
8. | 7 |
9. | 8 |
10. | 9 |
Wir haben hier die zehn Versuche der Schülerin bzw. des Schülers bereits nach der Anzahl der durchgeschlagenen Bretter sortiert und entsprechend durchnummeriert. Nur so können wir die Daten sinnvoll statistisch auswerten.
Schritt 1: Minimum und Maximum
Das Minimum ist $1$ und das Maximum ist $9$. Das bedeutet, es wurde pro Versuch mindestens $1$ Brett durchgeschlagen und maximal $9$. Damit haben wir bereits die beiden Endpunkte der Antennen (Whiskers).
Schritt 2: Quartile
Um den Boxplot erstellen zu können, müssen wir außerdem den Median und die kleinen Mediane bzw. die Quartile bestimmen. Diese Quartile nennen wir $Q1$, $Q2$ und $Q3$.
Der Median ist die Zahl in der Mitte des Datensatzes (bei einer ungeraden Anzahl) oder der Mittelwert der beiden Zahlen in der Mitte (bei einer geraden Anzahl).
In unserem Beispiel ist der Median $\left( Q2 \right)$ also $4$, denn das ist der Mittelwert des fünften und sechsten Datenpunktes.
Der Median der kleineren Hälfte der Daten, also das untere Quartil $Q1$, beträgt $2$, denn die Zahl $2$ liegt genau in der Mitte der unteren Hälfte des Datensatzes (also der unteren fünf Werte).
Das obere Quartil $Q3$ ist entsprechend $7$, denn dieser Wert liegt in der Mitte der oberen Hälfte des Datensatzes (also der oberen fünf Werte).
Schritt 3: Box und Antennen zeichnen
Jetzt können wir den Boxplot zeichnen. Über einem Zahlenstrahl, der alle auftretenden Werte einschließt, tragen wir zunächst das Minimum auf, also den kleinsten Wert $\left( 1 \right)$, und das Maximum, also den größten Wert $\left( 9 \right)$. Das sind die kurzen roten Linien in unserer Skizze:
Die namensgebende Box zeichnen wir zwischen den Quartilen $Q1$ und $Q3$ ein, deren Werte wir schon bestimmt haben.
In der Box sind die mittleren $50\,\%$ der Messwerte enthalten. Hier brauchen wir noch den Median. Dieser wird als vertikale Linie beim entsprechenden Wert $\left( 4 \right)$ eingezeichnet.
Anmerkung:
Es wäre genauso gut möglich, den Zahlenstrahl von unten nach oben aufzutragen, dann wären die Box und die Antennen entsprechen vertikal ausgerichtet und die Quartile würden wir als waagerechte Linien einzeichnen.
Schritt 4: Interquartilsabstand berechnen
Die Differenz zwischen dem oberen (rechten) und dem unteren (linken) Quartil ist der Interquartilsabstand $IQA$:
$IQA = Q3-Q1$
In unserem Beispiel beträgt der Interquartilsabstand $5$, denn es gilt:
$7-2=5$.
Boxplot interpretieren
Wir können den Boxplot nun nutzen, um einen Überblick über die Daten zu gewinnen. Die unterschiedlichen Komponenten und Bereiche der Kastengrafik ermöglichen dabei Aussagen zu verschiedenen Eigenschaften des Datensatzes.
- Die Länge der Box wird durch den Interquartilsabstand bestimmt, also die Differenz zwischen oberem und unterem Quartil. Sie liefert einen ersten Eindruck über die Streuung der Daten: Je schmaler die Box, desto weniger breit sind die Daten gestreut. In unserem Beispiel bedeutet das: Je schmaler die Box, desto konstanter ist die Leistung der Schülerin bzw. des Schülers.
- Der Median zeigt, ob die Daten symmetrisch streuen oder ob ihre Verteilung schief ist. Je weiter der Median von der Mitte der Box abweicht, desto schiefer ist die Verteilung. In unserem Beispiel gibt es eine leichte Tendenz zu weniger durchgeschlagenen Brettern, denn die Mitte der Box liegt bei $4{,}5$, der Median aber bei $4$.
-
Minimum und Maximum geben die maximale Spannweite der Daten an. Die außerhalb der Box liegenden Abschnitte (Antennen/Whiskers) haben je nach Boxplot eine unterschiedliche Definition. Manchmal umfassen sie nicht alle Daten, sondern sind so definiert, dass der Boxplot insgesamt nur $95\,\%$ der Daten enthält. Manchmal ist die Länge der Antennen auf das
$1{,}5$-fache des Interquartilsabstands begrenzt. So sind im Boxplot Ausreißer leichter erkennbar. In unserem Beispiel gibt es jedoch keine solchen Ausreißer. Antennen und Box zusammen enthalten den gesamten Datensatz.
Die Tatsache, dass die Box insgesamt länger ist als die beiden Antennen zusammen, zeigt, dass die Verteilung der Datenpunkte nicht gleichmäßig ist. Stattdessen streut die mittlere Hälfte der Datenpunkte (die Daten in der Box) über einen relativ großen Bereich und es besteht eine leichte Tendenz zu niedrigeren Werten. Die Leistung dieser Schülerin bzw. dieses Schülers ist also weder gleichmäßig verteilt, noch relativ konstant (bzw. eng) um einen bestimmten Wert gruppiert. Es gibt eine Tendenz zu eher weniger durchgeschlagenen Brettern.
Wie gut die Leistung der Schülerin bzw. des Schülers letztendlich ist, hängt von den Erwartungen und den Vergleichswerten ab. Um die Leistung mehrerer Schülerinnen und Schüler miteinander vergleichen zu können, müssen Boxplots zu allen Datensätzen erstellt und miteinander verglichen werden.
Bei einem Gruppenvergleich sind Boxplots besonders nützlich, weil damit die relevanten Vergleichswerte schnell überblickt werden können. In unserem Beispiel würden wir insbesondere auf die Interquartilsabstände (also die Längen der Boxen der verschiedenen Schülerinnen und Schüler) achten und wie weit rechts sich der Median darin jeweils befindet. Die beste Schülerin bzw. der beste Schüler ist die-/derjenige mit der geringsten Streuung um den höchsten Wert, also mit der schmalsten Box um den größten Median.
Boxplot – Aufgaben
Im Folgenden gehen wir drei Aufgaben zum Boxplot durch. Versuche erst selbst, die Aufgaben zu lösen und sieh dir dann die Lösungen an.
Die Abbildung zeigt einen Boxplot. Es ist dargestellt, wie viele Tore bei zehn Fußballspielen jeweils gefallen sind.
Das Minimum ist der kleinste Wert der Datenreihe. Das ist hier der Wert $1$. Das bedeutet, dass in keinem der zehn Spiele weniger als $1$ Tor gefallen ist.
Das Maximum ist der größte Wert der Datenreihe. Das ist hier der Wert $8$. Das bedeutet, dass in keinem der zehn Spiele mehr als $8$ Tore gefallen sind.
Der Median ist innerhalb der Box eingezeichnet. Er liegt hier beim Wert $5$. Das bedeutet, genau in der Mitte der Datenreihe liegt ein Spiel, bei dem $5$ Tore gefallen sind. Da es sich allerdings bei zehn Spielen um eine gerade Anzahl handelt, wurde hier offensichtlich ein Mittelwert aus den Spielen gebildet, die hinsichtlich der Anzahl der Tore an fünfter und sechster Stelle liegen – oder in beiden dieser Spiele sind jeweils genau $5$ Tore gefallen.
Das linke/untere Quartil ist das linke Ende der Box. Es liegt hier beim Wert $2$. Das bedeutet, dass in einem Viertel der Spiele entweder $1$ oder $2$ Tore gefallen sind, während in den restlichen drei Vierteln der Spiele $2$ oder mehr Tore gefallen sind.
Das rechte/obere Quartil ist das rechte Ende der Box. Es liegt hier beim Wert $6$. Das bedeutet, dass in einem Viertel der Spiele $6$, $7$ oder $8$ Tore gefallen sind, während in den restlichen drei Vierteln der Spiele $6$ oder weniger Tore gefallen sind.
Der Interquartilsabstand $\left( IQA \right)$ ist die Differenz aus oberem und unterem Quartil. Es gilt also:
$IQA = 6-2 = 4$
Der Interquartilsabstand entspricht der Länge der Box. Die Box ist damit etwas länger als die Summe der beiden Antennen. Das heißt, die mittleren $50\,\%$ der Datenpunkte sind etwas breiter gestreut als die $50\,\%$ an den Rändern der Verteilung.
Interessant ist außerdem, dass der Median $\left( =5 \right)$ etwas weiter rechts der Mitte der Verteilung liegt, aber der rechte Bereich der Box deutlich kleiner ist als der Bereich der Box links vom Median. Das bedeutet, dass in relativ vielen Spielen $5$ oder $6$ Tore gefallen sind, während die Spiele mit weniger Toren breiter gestreut sind.
Zuerst müssen die Daten in eine geordnete Reihenfolge gebracht werden, also nach der Anzahl gefallener Tore sortiert werden. Das sieht so aus:
1. | 2. | 3. | 4. | 5. | 6. | 7. | 8. | 9. | 10. |
---|---|---|---|---|---|---|---|---|---|
2 | 2 | 2 | 3 | 3 | 4 | 4 | 5 | 6 | 7 |
Um den Boxplot zu zeichnen benötigen wir fünf Komponenten:
Das Minimum liegt beim Wert $2$. Es sind also pro Spiel mindestens $2$ Tore gefallen.
Das Maximum liegt beim Wert $7$. Es sind also pro Spiel höchstens $7$ Tore gefallen.
Der Median muss aus den Werten der Spiele an fünfter und sechster Stelle berechnet werden, da es sich insgesamt um eine gerade Anzahl an Spielen handelt. Der Median liegt demnach bei:
$3 + 4 : 2 = 3{,}5$.
Das linke/untere Quartil ist der Median der unteren fünf Spiele. Das ist der Wert $2$, da im Spiel an dritter Stelle $2$ Tore gefallen sind.
Das rechte/obere Quartil ist der Median der oberen fünf Spiele. Das ist der Wert $5$, da im Spiel an achter Stelle $5$ Tore gefallen sind.
Mit diesen Punkten können wir den Boxplot zeichnen:
Der Interquartilsabstand beträgt $5 - 2 = 3$. Das heißt, die Box hat eine Länge von $3$. Die linke Antenne ist nicht zu sehen, da bei allen Spielen im unteren Viertel der Verteilung genau $2$ Tore gefallen sind. In diesem Bereich gibt es also keine Streuung.
Die rechte Antenne hat eine Länge von $2$. Auf der rechten Seite des Medians ist die Streuung also deutlich größer als links vom Median. In diesem Fall bedeutet das, dass in der Hälfte aller Spiele $2$ oder $3$ Tore gefallen sind, während die Ergebnisse der anderen Hälfte der Spiele breiter gestreut sind.
Das können wir natürlich auch direkt aus dem Datensatz ablesen. Insbesondere bei größeren Datenmengen ist der Boxplot allerdings deutlich übersichtlicher.
Ausblick – das lernst du nach Boxplots
Deine nächste Herausforderung ist die Durchführung von Hypothesentests. Lerne die Bedeutung des Signifikanzniveaus kennen und sieh dir an, wie man einen Signifikanztest durchführt. Erweitere dein Wissen in der Statistik!
Zusammenfassung – Boxplot
- Ein Boxplot ist eine bestimmte Darstellungsweise eines statistischen Datensatzes, der die Auswertung und Einordnung vorsortierter Datenpunkte vereinfacht.
- Durch fünf Komponenten wird ein Boxplot bestimmt: Minimum und Maximum, Median sowie zwei kleine Mediane, die sogenannten Quartile.
- Durch die fünf Komponenten wird der Datensatz in vier Bereiche geteilt, die jeweils $25\,\%$ der Datenpunkte enthalten.
- Die beiden mittleren Bereiche bilden die Box. Die beiden äußeren Bereiche werden durch die Antennen (Whiskers) gekennzeichnet.
Häufig gestellte Fragen zum Thema Boxplot
Ein Boxplot ist eine Darstellungsweise statistischer Daten. Ein Boxplot vereinfacht die Auswertung und Interpretation eines Datensatzes. So können unter anderem der Median, die Quartile, das Minimum und das Maximum der Datenpunkte abgelesen werden. Insbesondere die Streuung der Datenpunkte lässt sich anhand der Antennen (Whiskers) und des Interquartilsabstands relativ leicht einschätzen.
Das hängt natürlich von den Datenpunkten ab, die im Boxplot enthalten sind. Ein Boxplot kann verschiedene Formen annehmen. Allgemein gesehen kann ein Boxplot schnell einen Eindruck darüber vermitteln, in welchem Bereich die untersuchten Daten liegen und wie sie sich über diesen verteilen, also gestreut sind.
Um einen Boxplot zu zeichnen, müssen zunächst die Datenpunkte des Datensatzes geordnet, also in eine Rangfolge gebracht werden. Aus der Datenreihe sind dann fünf Komponenten herauszulesen bzw. zu berechnen: das Minimum, das Maximum, der Median und das linke/untere Quartil sowie das rechte/obere Quartil. Aus diesen Quartilen $Q1$ und $Q3$ kann dann der Interquartilsabstand $\left( IQA \right)$ berechnet werden:
$IQA = Q3 - Q1$
Der Interquartilsabstand beschreibt die Länge der Box. Die Antennen (Whiskers) reichen vom linken bzw. rechten Ende der Box bis zum Minimum bzw. Maximum.
Der Boxplot stellt die Lage und Streuung von Datenpunkten dar. Er macht auch die Schiefe und eventuelle Ausreißer sichtbar. Für Gruppenvergleiche ist der Boxplot besonders nützlich, denn entsprechende Unterschiede sind relativ leicht auf den ersten Blick zu erkennen und zu interpretieren.
Um ein Quartil zu bestimmen, müssen die Daten zunächst sortiert, also in eine Rangfolge gebracht werden. Üblicherweise vom kleinsten Wert links bzw. unten zum größten Wert rechts bzw. oben. Das 1. Quartil ist dann der Median der ersten Hälfte des Datensatzes, also der Datenpunkt, der in der Mitte der ersten Hälfte des Datensatzes liegt. Liegen zwei Werte in der Mitte (weil es eine gerade Anzahl an Datenpunkten gibt), muss der Mittelwert dieser zwei Werte berechnet werden, um den korrekten Median zu erhalten.
Durch den Median wird ein geordneter Datensatz in zwei gleich große Mengen von Datenpunkten geteilt. Diese beiden Mengen können nun ebenfalls durch weitere, sogenannte kleine Mediane in zwei Hälften geteilt werden.
Der kleine Median der ersten Hälfte des Datensatzes ist das 1. Quartil, auch unteres Quartil genannt.
Der kleine Median der zweiten Hälfte des Datensatzes ist das 3. Quartil, auch oberes Quartil genannt.
Das 2. Quartil ist der Median des gesamten Datensatzes. Durch die drei Quartile wird der gesamte Datensatz in vier Bereiche unterteilt. In den Bereichen befinden sich jeweils $25\,\%$ aller Datenpunkte, die vier Bereiche sind also gemessen an der Anzahl an Datenpunkten allesamt gleich groß. Sie können sich allerdings hinsichtlich der Streuung der Datenpunkte unterscheiden.
Im Boxplot werden die Bereiche unterhalb des unteren Quartils und oberhalb des oberen Quartils als Antennen (Whiskers) dargestellt. Die beiden mittleren Bereiche (links und rechts des Medians) bilden die Box.
Quantil ist der Oberbegriff für bestimmte Punkte (Lagemaße) einer Verteilung. Der Median und die Quartile sind allesamt Quantile. Die Quartile sind spezielle Quantile, die einen Datensatz in vier Bereiche teilen – daher kommt die Bezeichnung Quartil.
1.215.161 Schülerinnen und Schüler haben bereits unsere Übungen absolviert. Direktes Feedback, klare Fortschritte: Finde jetzt heraus, wo du stehst!
Jetzt registrieren und vollen Zugriff auf alle Funktionen erhalten!
30 Tage kostenlos testenTranskript Boxplots
Hoch im Gebirge am Faustfußpfad 5 liegt eine Kampfkunstschule, die sich auf das Zerschlagen von Holzbrettern spezialisiert hat. Alle Schüler müssen mit einem Hieb so viele Bretter wie möglich zerschlagen. Die Schüler notieren ihre Ergebnisse und zeigen sie am Ende der Woche ihrem Meister. Der Schüler mit den besten und beständigsten Leistungen muss eine Woche lang keinen Putzdienst verrichten. Aber wie kann der Meister bestimmen, wessen Leistungen am beständigsten waren? Natürlich indem er einen Box Plot verwendet. Um die Ergebnisse der Schüler in einen Box Plot eintragen zu können, müssen sie sortiert sein. Schüler Nummer 1 muss das noch erledigen. Nachdem wir die Ergebnisse geordnet haben, müssen wir 5 Kennwerte herausfinden: das Minimum, das 1. Quartil, auch Q1 genannt, den Median, das 3. Quartil, auch Q3 genannt, und das Maximum. Den Anweisungen seines Meisters folgend ordnet Schüler Nummer 1 seine Ergebnisse. Das Minimum, also die kleinste Zahl, für Schüler Nummer 1 ist die 1. Das Maximum, also die größte Zahl, ist die 9. Als Nächstes suchen wir den Median. Das ist die Zahl, die im Datensatz genau in der Mitte steht. Da wir eine gerade Anzahl an Datenpunkten haben, gibt es zwei mittlere Zahlen. In diesem Fall solltest du den Mittelwert dieser beiden Zahlen bilden. Für 4 und 4 beträgt er ebenfalls 4. Das Minimum ist also 1, der Median ist 4, das Maximum ist 9. Um die Quartile zu finden, müssen wir den Datensatz halbieren. Q1 ist der Median der ersten Hälfte des Datensatzes, also 1, 2, 2, 3, 4. Die Mitte dieses Abschnitts ist die 2. Das ist also Q1. Q3 ist der Median der zweiten Hälfte des Datensatzes, also 4, 6, 7, 8, 9. Die Mitte dieses Abschnitts ist 7. Das ist also Q3. Jetzt haben wir alle 5 Kennwerte und können den Box Plot auf unserem Zahlenstrahl eintragen. Zeichne stets das Minimum, Q1, den Median, Q3 und das Maximum ein. Die sogenannte Box im Box Plot wird gezeichnet, indem man vertikale Linien durch den Q1- und den Q3-Wert zieht und diese dann horizontal verbindet. In der Box markiert man dann mit einer vertikalen Linie den Median. Der sogenannte Interquartilsabstand, kurz IQA, wird berechnet, indem man Q1 von Q3 subtrahiert. Im Fall von Schüler Nummer 1 ist das 7 minus 2, also 5. Von der Box aus zeichnet man horizontale Linien, sogenannte Antennen, zum Minimum und zum Maximum. Werfen wir einen Blick auf Schüler Nummer 2. Sortieren wir zuerst die Zahlen. Nun suchen wir wieder die 5 Kennwerte. In diesem Fall liegt das Minimum bei 1 und das Maximum bei 8. Nun zum Median. Auch hier haben wir eine gerade Anzahl an Datenpunkten, also müssen wir die Werte wieder mitteln. Die beiden mittleren Zahlen sind 5 und 5, was einen Mittelwert von ebenfalls 5 ergibt. Nun halbieren wir den Datensatz, um Q1 und Q3 herauszufinden. Die erste Hälfte des Datensatzes lautet 1, 1, 2, 3, 5. Q1 ist also 2, da 2 der Median dieses Abschnittes ist. Die zweite Hälfte des Datensatzes lautet 5, 6, 6, 8, 8. 6 ist der Median dieses Abschnittes, das ist also unser Q3. Nun haben wir unsere 5 Kennwerte und können den Box Plot zeichnen. Wir zeichnen eine Box von Q1 nach Q3. Dann zeichnen wir die Antennen, indem wir Q1 beziehungsweise Q3 mit dem Minimum beziehungsweise dem Maximum verbinden. Um den Interquartilsabstand zu berechnen, müssen wir nur Q1 von Q3 abziehen: Der IQA ist 6 Minus 2, also 4. Sortieren wir den Datensatz von Schüler Nummer 3. Dieser emsige Schüler hat seinen Box Plot schon gezeichnet. Schauen wir mal, ob er vollständig ist. Das Minimum liegt bei 0, das Maximum bei 9. In diesem Fall sind die beiden Zahlen in der Mitte zwar unterschiedlich, aber wir nehmen trotzdem wieder den Mittelwert. Für 3 und 4 liegt der bei 3,5. Das ist also der Median. Q1 liegt bei 1 und Q3 bei 7 und der Interquartilsabstand liegt bei 6. Nun können wir die Grafiken vergleichen und schauen, welcher Schüler die beständigsten Leistungen gezeigt hat. Die drei Box Plots ähneln sich zwar sehr, es gibt aber einige Unterschiede. Die Box von Schüler Nummer 2 ist am kürzesten. Das bedeutet, die Datenpunkte dieses Schülers liegen eng beieinander. Man kann auch sagen: Der Schüler hat eine geringe Variation in seinen Werten. Du siehst bestimmt auch, dass sich einige der Kennwerte der drei Grafiken unterscheiden. Ein Kennwert mit besonders großen Unterschieden ist der Median. Der Median von Schüler Nummer 1 liegt bei 4, der von Schüler Nummer 2 bei 5 und der von Schüler Nummer 3 bei 3,5. Obwohl also die Schüler Nummer 1 und 3 die höheren Maxima von 9 haben, liegen ihre Mediane niedriger als die von Schüler Nummer 2. Schlussendlich wird der IQA dem Meister zeigen, welcher Schüler am beständigsten war. Schüler Nummer 1 hat einen IQA von 5, Nummer 2 einen von 4 und Nummer 3 einen von 6. Damit ist klar, dass Schüler Nummer 2 die beständigsten Leistungen erbracht hat. Der Meister will nun den beständigsten Schüler küren. Vorher soll er aber noch auf Bitten seiner Schützlinge zeigen, was er drauf hat. Ähm. Hoch im Gebirge am Faustfußpfad 'ein fünftel' liegt eine Kampfkunstschule, die sich auf das Zerschlagen von Holzbrettern, Straßen, Bäumen und Bergen …
Boxplots Übung
-
Gib Eigenschaften von Boxplots wieder.
TippsVergleiche mit dieser Abbildung eines Boxplots.
Der Median wird auch Zentralwert genannt und bezeichnet die Zahl, die sich „im Zentrum“ des Datensatzes befindet.
Lösung- Boxplots sind grafische Darstellungen von Häufigkeitsverteilungen. Sie zeigen dabei nicht nur einzelne Daten, sondern auch deren Streuung. Boxplots eignen sich vor allem für den Vergleich von zwei verschiedenen Datensätzen. Wegen ihrer Einfachheit und Vielseitigkeit haben sie auch ihren Weg in den Schulunterricht gefunden.
- Zuerst werden die Werte in aufsteigender Reihenfolge sortiert sowie Minimum und Maximum, also der kleinste und größte Wert des Datensatzes, bestimmt. Hier ist das Minimum $1$ und das Maximum $9$.
- Man braucht auch den Median. Dieser ist die Zahl, die im Datensatz genau in der Mitte steht. Setzt sich der Datensatz aus einer geraden Anzahl an Daten zusammen, stehen zwei Zahlen in der Mitte. In so einem Fall nimmt man den Mittelwert der mittleren beiden Zahlen. In diesem Fall ist der Median $4$.
- Außerdem benötigt man das erste Quartil $Q1$. Das ist der Median der ersten Hälfte des Datensatzes und bei diesem Boxplot die $2$.
- Man braucht auch das dritte Quartil $Q3$. Das ist der Median der zweiten Hälfte des Datensatzes, hier die $7$.
- Zum Schluss verbindet man $Q1$ und $Q3$ miteinander, diese bilden die Box. Und man zieht sogenannte Antennen zu dem Minimum und dem Maximum.
- Außerdem bildet man noch den Interquartilsabstand (IQA), indem man $Q1$ von $Q3$ subtrahiert. In diesem Fall sieht das so aus: $IQA=Q3-Q1=7-2=5$.
-
Nenne die passenden Aussagen zu den Boxplots der Schüler.
TippsJe weniger Variation es bei den Werten gibt, desto beständiger sind sie.
Die beständigsten Leistungen zeigt jemand, dessen IQA klein ist.
LösungDer Median ist der Wert, der in einem Datensatz genau in der Mitte steht. Bei einer geraden Anzahl an Daten ist der Median der Mittelwert der beiden Werte in der Mitte des Datensatzes. Das erste Quartil $Q1$ ist der Median der ersten Hälfte des Datensatzes und $Q3$ ist der Median der zweiten Hälfte des Datensatzes. Den Abstand von $Q1$ und $Q3$ nennt man Interquartilsabstand, abgekürzt: IQA. Je kleiner der IQA ist, desto beständiger sind die Werte. Außerdem beschreibt das Minimum den kleinsten Wert des Datensatzes und das Maximum den größten Wert.
Demnach sind folgende Aussagen über die abgebildeten Boxplots richtig:
- Schüler $2$ hat einen Median von $3,5$.
- Ein Grund dafür, dass Schüler $1$ der Beste ist, ist sein hoher Median von $5$. Er erbringt im Schnitt gute Leistungen.
- Schüler $1$ hat einen kleinen IQA von $4$ und damit eine geringe Variation in seinen Werten. Er zeigt also die beständigsten Leistungen.
Und diese Aussagen sind falsch:
- Schüler $2$ hat das höchste Maximum von $9$ und ist deshalb der Beste.
- Schüler $2$ hat das kleinste $Q1$ und ist deshalb der Schlechteste.
-
Ordne die Eigenschaften der passenden Stelle im Boxplot zu.
TippsVergleiche mit dieser Darstellung.
Die beständigsten Ergebnisse finden wir im Bereich von $Q1$ bis $Q3$.
Der Median ist derjenige Wert, der im Zentrum des Datensatzes liegt.
Das beste Ergebnis ist hier das Maximum.
LösungZunächst einmal „übersetzen“ wir die Fragen von Team und Trainer in die Sprache der Mathematik.
- Was war das beste und das schlechteste Ergebnis? $\Rightarrow$ Maximum und Minimum bestimmen
- Wie hoch ist der Zentralwert der gefallenen Tore aller Spiele? $\Rightarrow$ Median bestimmen
- In welchem Bereich gab es die beständigsten Ergebnisse? $\Rightarrow$ $Q1$ und $Q3$ bestimmen, sie umschließen den Bereich mit den beständigsten Ergebnissen
- Minimum $=3$
- Maximum $=10$
- Median $=7~\rightarrow$ der Mittelwert aus $6$ und $8$ ist $\frac{6+8}2=7$
- $Q1=4$
- $Q3=9$
-
Deute die Größe mithilfe des Boxplots.
TippsIm Bereich des IQA liegen die mittleren $50~\%$ der Werte des Datensatzes.
IQA ist die Abkürzung für Interquartilsabstand. Er liegt zwischen $Q1$ und $Q3$.
LösungAm Boxplot lässt sich ablesen, dass der Median der Größen der Schülerinnen und Schüler bei $155\ \text{cm}$ liegt. Im Bereich des IQA von $Q1$ bis $Q3$ liegen die mittleren $50~\%$ der Werte des Datensatzes. Weiterhin liegt das Minimum bei $135\ \text{cm}$ und das Maximum bei $170\ \text{cm}$.
Daraus lassen sich folgende Schlussfolgerungen ziehen:
Marc ist $166\ \text{cm}$ groß. Er hat eine seltene Größe. Das sieht man daran, dass seine Größe in den oberen $25~\%$ liegt. Somit ist er auch größer als die meisten.
Debbie ist $152\ \text{cm}$ groß. Sie hat eine häufige Größe. Das erkennt man daran, dass ihre Größe in der Box liegt. Außerdem findet man ihre Größe in den unteren $50~\%$, also ist mehr als die Hälfte der Mitschüler*innen größer als sie.
Karl ist $135\ \text{cm}$ groß. Er hat eine seltene Größe. Er ist nämlich die kleinste Person. Das erkennt man daran, dass seine Größe das Minimum ist.
-
Bestimme den Median.
TippsHat ein Datensatz eine gerade Anzahl Werte, wird der Median aus den zwei Werten gebildet, die genau in der Mitte des Datensatzes stehen.
Bei einem Datensatz mit $10$ Werten wird der Median aus dem $5.$ und $6.$ Wert gebildet.
Sieh dir an, welche Zahlen bei Schüler $2$ zur Errechnung des Medians verwendet wurden.
LösungWir betrachten den folgenden Datensatz:
$0;1;1;3;3;4;5;7;7;9$
Den Median ermitteln wir, indem wir den Wert betrachten, der genau in der Mitte des Datensatzes steht. Dazu muss der Datensatz nach aufsteigender Reihenfolge sortiert sein. Die Werte von Schüler $3$ sind bereits in aufsteigender Reihenfolge sortiert, daher kann nun sofort der Median errechnet werden.
Besteht der Datensatz aus einer geraden Anzahl an Werten, muss der Median aus den zwei Werten, die in der Mitte stehen, ermittelt werden. Dazu bildet man aus diesen beiden Werten den Mittelwert.Diese sind $3;4$.
Jetzt wird der Mittelwert dieser beiden Werte gebildet, indem sie addiert und anschließend durch $2$ dividiert werden:
$3+4=7$
$7:2=3,5$Schüler $3$ hat also einen Median von $3,5$.
-
Arbeite eine Interpretation für die Boxplots heraus.
TippsJe kleiner der Abstand zwischen dem ersten und dritten Quartil, desto beständiger sind die Werte.
Ist der IQA der Box klein und liegt diese in der zweiten Hälfte des Zahlenstrahls, kommt die Person oft viele Minuten zu spät.
LösungTom hat die unbeständigsten Ergebnisse, das zeigt sein IQA von $7$. Von allen drei Schülern ist er die meisten und die wenigsten Minuten zu spät gekommen, was man an seinem Minimum von $1$ und seinem Maximum von $10$ erkennt. Der Median für seine Verspätungen liegt bei $5{,}5$ Minuten, was relativ viel ist.
Max besitzt den größten Median mit $6{,}5$ Minuten. Außerdem sind seine Ergebnisse am beständigsten. Das sieht man an dem kleinen IQA von $1$, der in der zweiten Hälfte des Zahlenstrahls liegt.
Jonas hat den kleinsten Median mit $3{,}5$ Minuten. Zudem befindet sich sein IQA von $3$ in der ersten Hälfte des Datensatzes. Das heißt, er kam beständig wenig zu spät.
Jonas kommt also noch einmal ungeschoren davon. Ein Glück!
8.807
sofaheld-Level
6.601
vorgefertigte
Vokabeln
7.393
Lernvideos
36.239
Übungen
32.808
Arbeitsblätter
24h
Hilfe von Lehrkräften
Inhalte für alle Fächer und Schulstufen.
Von Expert*innen erstellt und angepasst an die Lehrpläne der Bundesländer.
Testphase jederzeit online beenden
Beliebteste Themen in Mathematik
- Römische Zahlen
- Prozentrechnung
- Primzahlen
- Geometrische Lagebeziehungen
- Was ist eine Ecke?
- Rechteck
- Was ist eine Gleichung?
- Pq-Formel
- Binomische Formeln
- Trapez
- Volumen Zylinder
- Umfang Kreis
- Quadrat
- Division
- Raute
- Parallelogramm
- Polynomdivision
- Was Ist Eine Viertelstunde
- Prisma
- Mitternachtsformel
- Äquivalenzumformung
- Grundrechenarten Begriffe
- Größer Kleiner Zeichen
- Dreiecksarten
- Aufbau von Dreiecken
- Quader
- Satz Des Pythagoras
- Dreieck Grundschule
- Erste Binomische Formel
- Kreis
- Trigonometrie
- Trigonometrische Funktionen
- Standardabweichung
- Flächeninhalt
- Volumen Kugel
- Zahlen In Worten Schreiben
- Meter
- Orthogonalität
- Schriftlich Multiplizieren
- Brüche gleichnamig machen
- Brüche Multiplizieren
- Potenzgesetze
- Distributivgesetz
- Flächeninhalt Dreieck
- Rationale Zahlen
- Volumen Berechnen
- Brüche Addieren
- Kongruenz
- Exponentialfunktion
- Exponentialfunktion Beispiel
War cool😎
in der schule hat meine lehrerin uns nur 2 quartile vorgestellt aber gibt es auch ein drittes quartil wie in diesem vidio\
ich habe es in der Schule nicht verstanden. Jetzt aber schon
Dass Ende kam unerwartet 😂
was ist ein boxplot?