30 Tage kostenlos testen:
Mehr Spaß am Lernen.

Überzeugen Sie sich von der Qualität unserer Inhalte.

Histogramme 04:06 min

Textversion des Videos

Transkript Histogramme

Jedes Jahr macht der Käsebauer Klaas Inventur. Er legt besonderen Wert darauf, das Alter des Käses festzuhalten. Um eine übersichtliche Darstellung dieser Daten zu haben, verwendet er Histogramme. Klaas hat die absoluten Häufigkeiten des Reifegrads des Käses in dieses Säulendiagramm eingetragen. Doch daran kann er garnichts erkennen, denn dies zeigt oft auch nur einzelne Werte an. Daher hat er sich überlegt, die Jahre in Gruppen einzuteilen. Ein Diagramm, in dem du solche Gruppen verwendest, nennen wir Histogramm. Jeder Säulen eines Histogramms repräsentiert also ein Intervall von Werten und nicht nur einen einzelnen Wert. Klaas hat den Reifegrad in verschiedene Gruppen eingeteilt: 0 bis 4 Jahre, 5 bis 9 Jahre, 10 bis 14 Jahre und 15 bis 19 Jahre. Die Gruppen haben also alle die gleiche Größe. Ein Histogramm stellt aber oft die absoluten Häufigkeiten im Verhältnis zur Gesamtmenge dar. Wie würde unser Histogramm dann aussehen? Die Höhe der Säulen können wir folgendermaßen berechnen. h_x steht dabei für die Säulenhöhe, n_x für die Anzahl der Nennungen in der Gruppe, N für die Gesamtzahl der Nennungen. Hätten wir unterschiedlich breite Gruppen gewählt, müssten wir deren Breite in der Berechnung der Höhe mitbeachten. Hier haben wir aber gleichbreite Gruppen von 5 Jahren gewählt.
Klaas hat insgesamt 20 verschiedene Käselaibe gezählt, N ist also 20. Um die Säulenhöhe zu berechnen, müssen wir nun also nur noch n_x für jede Gruppe einsetzen. Klaas hat 5 Käselaibe von einem Reifegrad zwischen 0 und 4 Jahren gezählt. Wir rechnen also: 5 geteilt durch 20... und erhalten eine Säulenhöhe von 0,25. In der Gruppe des Reifegrads von 5 bis 9 Jahren hat Klaas 3 Käselaibe gezählt; wir rechnen also 3 geteilt durch 20.. und erhalten 0,15. In der nächsten Gruppe gab es insgesamt 9 Käselaibe. Wir erhalten für die Säulenhöhe 0,35. Und in der letzten Gruppe waren es 3 Käselaibe. Wir rechnen also 3 geteilt durch 20. Nun können wir die Rechtecke mit den passenden Höhen in das Histogramm eintragen. Wir erkennen also die Verteilung der Gruppen auf die Gesamtzahl des Käses. Aber was passiert, wenn wir die Größe der Klassen ändern, zum Beispiel verdoppeln? Wir haben jetzt also nur noch zwei Klassen, die jedoch breiter sind. Beachte also beim Erstellen und Auswerten der Daten immer die Breite der Gruppen. Fassen wir das noch einmal zusammen. Ein Histogramm sieht aus wie ein Säulendiagramm, aber jede Säule repräsentiert ein Intervall von Werten und nicht nur einen einzelnen Wert. Die Säulenhöhe kann man mit h_x ist gleich n_x geteilt durch N berechnen sofern man gleichbreite Gruppen wählt. n_x ist dabei die Anzahl der Nennungen in der Gruppe und N die Gesamtzahl der Nennungen. Und Klaas möchte nun mit seinem ältesten Käse feiern und diesen genießen. Doch...irgendetwas ist nicht richtig. Da feiern wohl schon andere mit seinem Käse...

Histogramme Übung

Du möchtest dein gelerntes Wissen anwenden? Mit den Aufgaben zum Video Histogramme kannst du es wiederholen und üben.

  • Bestimme die relativen Höhen des Histogramms.

    Tipps

    Die Gesamtzahl $N=20$ ist die Summe der Anzahlen aller Werte.

    Die relative Häufigkeit $h_x$ der Werte einer Gruppe $x$ ist das Verhälntnis der Anzahl $n_x$ der Werte in der Gruppe $x$ zur Gesamtzahl $N$ aller Werte:

    $h_x = \dfrac{n_x}{N}$

    Liegen in einer Gruppe $y$ genau $17$ der insgesamt $85$ Werte, so ist $n_y = 17$ und $N=85$. Du kannst dann $h_y$ wie folgt ausrechnen:

    $h_y = \dfrac{n_y}{N} = \dfrac{17}{85} = 0,2$

    Lösung

    In der Wertetabelle stehen in der linken Spalte die Gruppen, in die Klaas die Reifegrade der Käse eingeteilt hat. Dies sind die Alter $0-4$ Jahre, $5-9$ Jahre, $10-14$ Jahre sowie $15-19$ Jahre. In der mittleren Spalte stehen die Anzahlen der Werte in diesen Gruppen. Diese Werte kann Klaas aus dem Säulendiagramm ablesen. $5$ Käse haben einen Reifegrad zwischen $0$ und $4$ Jahren, $3$ Käse dagegen einen Reifegrad zwischen $5$ und $9$ Jahren. Die meisten Käse liegen in dem Intervall von $10$ bis $14$ Jahren, nämlich $9$. Nur $3$ weitere Käse haben einen Reifegrad zwischen $15$ und $19$ Jahren.

    In die rechte Spalte der Tabelle trägt Klaas die relativen Häufigkeiten zu diesen Anzahlen ein. Die Gesamtzahl $N$ der Käselaibe beträgt $N = 5+3+9+3 = 20$. Die relative Häufigkeit zu einer Gruppe $x$ ist das Verhältnis $h_x$ aus der Anzahl $n_x$ der Käse in dieser Gruppe zu $N$, also:

    $h_x = \dfrac{n_x}{N}$

    Für $x$ setzt Klaas die Bezeichnung der Gruppen ein, also eines der gewählten Intervalle. Die Werte für $h_x$ in der rechten Spalte kann er dann direkt ausrechnen:

    $ \begin{array}{lllll} \\ h_{[0,4]} &=& \dfrac{5}{20} &=& 0,25 \\ \\ h_{[5,9]} &=& \dfrac{3}{20} &=& 0,15 \\ \\ h_{[10,14]} &=& \dfrac{9}{20} &=& 0,45 \\ \\ h_{[15,19]} &=& \dfrac{3}{20} &=& 0,15 \end{array} $

  • Beschrifte das Histogramm.

    Tipps

    $N$ ist die Gesamtzahl aller beobachteten Werte. Sie entspricht der Summe der Höhen aller Säulen.

    Für jede Säule $x$ bezeichnet die Anzahl $n_x$ die Höhe dieser Säule. $n_{[0-4]}$ ist also die Höhe der linken Säule.

    Die Höhe einer Säule kannst du auf der Skala der $y$-Achse ablesen.

    Lösung

    In dem Histrogramm hat Klaas die Ergebnisse seiner Inventur übersichtlich dargestellt. Die einzelnen Werte (das sind die Reifegrade der Käse) hat er zu Intervallen zusammengefasst. Die Intervalle hat er so gewählt, dass sie alle gleich groß sind und jeweils $5$ Jahre umfassen. Die Intervalle sind daher $[0,4]$ für die Käselaibe mit Reifegraden zwischen $0$ und $4$ Jahren, $[5,9]$ für die nächsten fünf Jahre Reifezeit, dann $[10,14]$ und schließlich ${[15,19]}$.

    Für jedes Intervall $x$ hat Klaas die Anzahl $n_x$ der Käse mit Reifegrad in diesem Intervall erfasst. Im Histogramm entspricht diese Anzahl der Höhe der Säule über dem jeweiligen Intervall. Du kannst die Höhe auf der Skala der $y$-Achse ablesen und über der jeweiligen Säule notieren.

    Fünf der Käselaibe in Klaas' Regal haben einen Reifegrad zwischen einem und vier Jahren. daher notiert er $n_{[0,4]} = 5$. Die meisten Käselaibe in seinem Regal haben einen Reifegrad zwischen $10$ und $14$ Jahren, nämlich $9$ Käselaibe. Daher notiert er $n_{[10,14]} = 9$.

  • Beschreibe die Verwendung von Histogrammen.

    Tipps

    Die relative Häufigkeit $h_x$ eines Merkmals ist die Anzahl seiner Vorkommnisse bezogen auf die Gesamtzahl aller beobachteten Vorkommnisse.

    Anders als in einem Säulendiagramm hat bei einem Histogramm auch die Breite der Säulen eine Bedeutung.

    Liegen $6$ (absolute Häufigkeit) der insgesamt $30$ beobachteten Werte in der durch $x$ bezeichneten Gruppe, so ist $h_x = \dfrac{6}{30} = \dfrac{1}{5} = 0,2$. Die relative Häufigkeit ist somit $h_x=0,2$.

    Lösung

    Zur Darstellung beobachteter Werte und ihrer Häufigkeiten eignen sich verschiedene Diagramme. In einer Liste kannst du alle Beobachtungen aufschreiben. Anschaulicher ist ein Diagramm. In einem Säulendiagramm stellst du für jeden beobachteten Wert die Anzahl der Beobachtungen dieses Wertes durch die Höhe einer Säule dar. Die Anzahl nennt man auch die absolute Häufigkeit, weil jede Anzahl für sich steht und nicht auf andere Anzahlen bezogen wird. Die Säulen eines Säulendiagramms haben alle dieselbe Breite.

    Oft wird die Darstellung der Ergebnisse übersichtlicher, wenn du verschiedene Werte zu Gruppen zusammenfasst. Eine solche Darstellung nennt man Histogramm. Ein Histogramm sieht auf den ersten Blick einem Säulendiagramm ähnlich. Anders als bei einem Säulendiagramm, stellt allerdings bei einem Histogramm die Breite der Säulen die Größe des Intervalls dar, aus dem die Werte dieser Säule stammen. Sind die Intervalle der Gruppierung alle gleich groß, so haben auch die Säulen des Histogramms alle dieselbe Breite. Die Höhe der Säulen eines Histogramms stellt die Anzahl der Werte in dem zugehörigen Intervall dar.

    An Stelle der Anzahl oder absoluten Häufigkeit der Werte einer Gruppe $x$ kannst du auch die relative Häufigkeit $h_x$ als Höhe der Säulen eines Histogramms verwenden. Dies ist die Anzahl $n_x$ der Werte in dem Intervall $x$ bezogen auf die Gesamtzahl $N$ aller Werte. Die relative Häufigkeit entspricht also dem Quotienten aus $n_x$ und $N$:

    $h_x =\frac{n_x}{N}$

    Die Zahl $h_x$ verwendest du dann als Höhe der Säule, die zu der Gruppe {$x$} gehört. Die Zahl $h_x$ wird in der Regel als Dezimalbruch dargestellt.

  • Analysiere das Histogramm.

    Tipps

    Fasse die gegebenen Intervalle zu größeren zusammen und erstelle die zugehörigen Histogramme.

    Beachte, dass in jedem einzelnen der betrachteten Histogramme die Säulen untereinander gleich breit sein sollen.

    Lösung

    Bei der Veränderung der Intervallgröße ändert sich auch die Höhe der Säulen in dem Histogramm. Da bei jedem Histogramm alle Säulen gleich breit sein sollen, ist jeweils die Säulenhöhe ein Maß für die absolute oder relative Häufigkeit der Nennungen in dem Intervall. Klaas kann die Breite der Intervalle verändern, indem er Intervalle zusammenfasst. Da in jedem Histogramm die Breite aller Säulen gleich sein sollen, kommen außer dem gegebenen nur noch das Histogramm mit den Intervallen $[1,6]$, $[7,12]$, $[13,18]$ und $[19,24]$, das Histogramm mit Intervallen $[1,12]$ und $[13,24]$ sowie das Histogramm mit dem Intervall $[1,24]$ in Betracht.

    Folgende Aussagen sind falsch:

    • „Verdoppelt Klaas die Intervallbreiten, so erhält er ein Histogramm, bei dem die Säulenhöhe von einem zum nächsten Intervall (von links nach rechts) stets kleiner wird.“ Bei der Verdoppelung der Intervallgröße werden jeweils zwei Intervalle zu einem zusammengefasst. Dabei addieren sich die relativen Häufigkeiten der beiden Intervalle. Klaas erhält also ein Histogramm mit Säulenhöhen (von links nach rechts) $0,32$ und $0,34$ und $0,15$ und $0,1$. Die Säulenhöhen nehmen also nicht stets ab.
    • „Mehr als die Hälfte aller Käselaibe haben einen Reifegrad von bis zu neun Jahren.“ Die drei Intervalle, die die Reifegrade bis neun Jahre beschreiben, haben die relativen Häufigkeiten $0,1$ und $0,22$ und $0,18$. Diese addieren sich zu $0,1 + 0,22 + 0,18 = 0,5$. Daher hat genau die Hälfte der Käselaibe einen Reifegrad bis zu neun Jahren.

    Folgende Aussagen sind richtig:

    • „In Klaas Käseregal gibt es mehr Käselaibe mit Reifegrad zwischen $4$ und $9$ Jahren als solche mit Reifegrad von mindestens $13$ Jahren.“ Die Käselaibe mit Reifegrad zwischen $4$ und $9$ Jahren gehören zu den Intervallen $[4,6]$ und $[7,9]$. Die relative Häufigkeit dieser Käselaibe beträgt $0,22 + 0,18 = 0,4$. Die Käselaibe mit Reifegrad von mindestens $13$ Jahren gehören zu den rechten vier Intervallen. Ihre relative Häufigkeit beträgt $0,14 + 0,1 + 0,08 + 0,02 = 0,34$. Die Aussage ist richtig, denn $0,4 > 0,34$ und die Anzahl der Käselaibe ist proportional zur relativen Häufigkeit.
    • „Fasst Klaas die Daten zu einem Histogramm mit nur zwei Säulen derselben Breite zusammen, so ist die linke Säule fast doppelt so hoch wie die rechte.“ Bei der Zusammenfassung werden die ersten vier Intervalle zu dem Intervall $[1,12]$, die letzten vier zu dem Intervall $[13,24]$ zusammengefasst. Die relativen Häufigkeiten addieren sich bei dieser Zusammenfassung. Sie betragen demnach $0,1 + 0,22 + 0,18 + 0,16 = 0,66$ und $0,14 + 0,1 + 0,08 + 0,02 = 0,34$. Die linke Säule ist also fast doppelt so hoch wie die rechte.
    • „Mehr als ein Drittel aller Käselaibe hat einen Reifegrad zwischen vier und neun Jahren.“ Dafür müssen wir nur die absoluten Häufigkeit zweier Säulen addieren. $0,22+0,18=0,4$ und somit ist dies Größer als ein Drittel, was $0,33$ wären.
  • Erschließe die Histogramme.

    Tipps

    Die Höhe einer Säule in einem Histogramm ist ein Maß für die Anzahl der Werte in der Gruppe, die durch die Säule repräsentiert wird, oder aber für die Anzahl bezogen auf die Gesamtzahl aller Werte.

    Fasse die in der Strichliste erfassten Anzahlen zu Intervallen $[1,2]$ und $[3,4]$ und $[5,6]$ zusammen.

    Statt der absoluten Anzahl von Werten in jedem Intervall kannst du für die Säulenhöhe auch den Quotienten aus dieser Anzahl und der Gesamtzahl aller Werte verwenden. Die Größenverhältnisse der Säulen ändern sich dabei nicht.

    Lösung

    Um die gewonnenen Daten der Inventuren übersichtlich darzustellen, verwendet Klaas Histogramme. Die Werte, die Klaas erfasst, sind jeweils die Reifegrade der Käselaibe in seinem Regal. Zu jeder Jahreszahl notiert er die Anzahl der Käselaibe dieses Reifegrades. Am einfachsten geht das mit einer Strichliste.

    Um zu jeder Strichliste das passende Histogramm zu finden, fasst Klaas die Jahrgänge zu Intervallen $[1,2]$ und $[3,4]$ und $[4,5]$ zusammen. Zu jedem Intervall bestimmt Klaas nun die Gesamtzahl der Käselaibe mit Reifegrad in diesem Intervall. Da die Intervalle alle gleich groß sind, haben die Säulen des Histogramms alle dieselbe Breite. In diesem Fall kann Klaas die Anzahl der Nennungen in einem Intervall als Säulenhöhe zu diesem Intervall verwenden.

    In seinen Diagrammen hat Klaas statt der absoluten aber die relativen Häufigkeiten dargestellt. Dazu hat er für jedes Intervall $x$ den Quotienten $h_x$ aus der Anzahl $n_x$ der Käselaibe in diesem Intervall und der Gesamtzahl $N$ aller Käselaibe berechnet. Dieser Quotient $h_x$ ist die Säulenhöhe zu dem Intervall $x$.

    Auf diese Weise findet Klaas folgende Zuordnung:

    • Zu der Strichliste mit den Strichzahlen $5$, $2$, $3$, $1$, $5$ und $4$ gehört das Histogramm mit den Säulenhöhen $0,35$ und $0,2$ und $0,45$ (von links nach rechts). Denn hier ist $n_{[1,2]} = 5+2 = 7$ und $n_{[3,4]} = 3+1 = 4$ und $n_{[5,6]} = 5+4 = 9$. Die Gesamtzahl ist $N = 5+2+3+1+5+4 = 20$. Damit ergeben sich folgende Werte für $h_x$:
    $\begin{array}{lllllll} && h_{[1,2]} &=& \frac{7}{20} &=& 0,35 \\ && h_{[3,4]} &=& \frac{4}{20} &=& 0,2 \\ && h_{[5,6]} &=& \frac{9}{20} &=& 0,45 \end{array}$

    • Die Strichliste mit den Strichzahlen $1$, $4$, $0$, $1$, $0$ und $4$ liefert Klaas ein Histogramm mit Säulenhöhen $0,5$ und $0,1$ und $0,4$.
    • Zu den Strichzahlen $1$, $2$, $2$, $1$, $2$ und $2$ in der Strichliste gehört das Histogramm mit den Säulenhöhen $0,3$ und $0,3$ und $0,4$.
    • Aus den Strichzahlen $2$, $1$, $3$, $3$, $1$ und $2$ erhält Klaas ein Histogramm mit den Säulenhöhen $0,25$ und $0,5$ und $0,25$.
    • Die Strichliste mit den Strichzahlen $5$, $3$, $7$, $5$, $2$ und $3$ gehört zu dem Histogramm mit Säulenhöhen $\frac{8}{25} = 0,32$ und $\frac{12}{25} = 0,48$ und $\frac{5}{25} = 0,2$.
    Die Säulenhöhen $0,3$ und $0,5$ und $0,3$ in dem verbleibenden Diagramm sind keine relativen Häufigkeiten zu einem Datensatz. Denn die Summe dieser Säulenhöhe ist $0,3 + 0,5 + 0,3 = 1,1 > 1$.

  • Charakterisiere die Balken im Histogramm.

    Tipps

    Die Höhe der Säule über dem Intervall $[a,b]$ bezeichnet die relative Häufigkeit der Käselaiber mit Reifegrad in diesem Intervall. Die Summe aller relativen Häufigkeiten ist $1$.

    Werden beispielsweise $20 \%$ aller Äpfel eines Sortiments nach $6-7$ Wochen schlecht, so hat die Säule im Intervall $[6,7]$ eine Höhe von $0,2$. Die anderen Apfelsorten verteilen sich auf andere Säulen. Würde man die Höhe aller Säulen addieren, so haben sie immer eine Höhe von $1$, da wir insgesamt immer von $100 \%$ ausgehen.

    Lösung

    Das Histogramm zeigt die relativen Häufigkeiten der verschiedenen Käsesorten in Klaas' Bestand. Die Summe aller relativen Häufigkeiten ist stets $1$.
    Die Säule über dem Intervall $[12,14]$ hat die Höhe $0,7$.
    Die relative Häufigkeit des Käses mit dem violett-roten Schimmel beträgt ein Zehntel, also $0,1$.
    Die des Grünschimmelkäses liegt bei einem Viertel, also $0,25$.
    Diese beiden Werte machen zusammen $0,35 =35\%$ des gesamten Bestandes aus. Mit diesem Wert ist die Säule der Höhe $0,7$ nicht kompatibel, da $0,7 + 0,35 = 1,05 > 1$.

    • Blauschimmelkäse hat eine Reifedauer von $3$ bis $5$ Jahren. Die Säule zu dem Intervall $[3,5]$ kannst du blau färben.
    • Der junge Hartkäse macht den größten Anteil aller Käse aus. Da wir die Säule mit der Höhe $0,7$ ausschließen konnten, ist die Säule über $[0,2]$ die mit der größten Höhe.
    • Der alte Hartkäse hat die längste Reifezeit aller Käse. Daher kannst du die Säule über dem Intervall $[15,17]$ gelb färben.
    • Der Käse mit rot-violettem Schimmel ist so stark nachgefragt, dass er nur noch ein Zehntel des Gesamtbestands ausmacht. Die einzige verbleibende Säule mit der Höhe $0,1$ **ist die über dem Intervall $[6,8]$: Färbe sie violett.
    • Für den **Grünschimmelkäse bleibt jetzt nur noch die Säule über dem Intervall $[9,11]$. Diese Säule hat die Höhe $0,25$, das entspricht genau dem** Viertel des Gesamtbestands**, das Klaas für diesen exquisiten Käse reserviert hat.