Pommes der Pinguin hält einen großen gelben Stern in den Händen
30 Tage kostenlos testen
Über 1,6 Millionen Schüler*innen nutzen sofatutor
Lernpakete anzeigen
Lernpakete anzeigen

Stichproben

Durch Stichproben kannst du mit Hilfe von arithmetischen Mittelwert, Median, Varianz und Standardabweichung Aussagen treffen, die eingeschränkt für die Allgemeinheit gültig sind.

Inhaltsverzeichnis zum Thema

Was ist eine Stichprobe?

In der beschreibende Statistik wird eine Teilmenge der untersuchten Grundmenge oder Gesamtheit als Stichprobe bezeichnet.

Wenn die Stichprobe genauso viele Elemente enthält wie die Grundmenge, spricht man von einer Totalerhebung.

Um aus einer Stichprobe verlässliche Schlüsse auf die Grundgesamtheit ziehen zu können, muss die Stichprobe repräsentativ sein.

Dies kann man zum Beispiel erreichen, indem

  • zum einen der Stichprobenumfang groß genug gewählt und
  • zum anderen die Elemente der Stichprobe rein zufällig ausgewählt werden. Dies wird als Zufallsstichprobe bezeichnet.

Beispiel

Du möchtest gerne wissen, wie viele Menschen voller Freude an ihren Mathematikunterricht zurückdenken. Nun wirst du sicher nicht alle möglichen Menschen befragen (können!), sondern suchst einige Menschen aus. Dies ist dann die Stichprobe.

Vor- und Nachteile von Stichproben

Im Rahmen einer statistischen Erhebung wird eine Stichprobe durchgeführt.

  • Da diese nur eine Teilmenge der Grundmenge ist, kann es zu Ungenauigkeiten kommen.
  • Dies lässt sich durch eine Totalerhebung vermeiden.
  • Ein Beispiel für eine solche Totalerhebung ist, im Idealfall, eine Volkszählung.
  • Stichproben sind allerdings weniger aufwändig und damit auch kostengünstiger als eine Totalerhebung.
  • Stichproben können durchaus auch zu genaueren Ergebnissen führen, da zum Beispiel eine Befragung mit mehr Zeit durchgeführt werden kann.

Beispiel

Es soll ermittelt werden, wie viel Zeit ein Schüler des Abiturjahrgangs pro Woche mit Lernen verbringt. Hierfür wird ein Fragebogen erstellt und an eine Stichprobe von $30$ Schülern geschickt. Die Schüler sollen volle Stunden angeben. Dabei kommt es zu den folgenden Ergebnissen:

  • zehn Schüler geben an, eine Stunde pro Woche zu lernen,
  • vier Schüler sagen, dass sie zwei Stunden pro Woche lernen,
  • ein Schüler lernt drei Stunden,
  • fünf Schüler lernen jeweils vier Stunden,
  • sieben Schüler fünf Stunden und
  • drei Schüler sechs Stunden.

Diese Daten aus der Stichprobe können als geordneter Datensatz dargestellt werden. Zusätzlich sind hier noch die entsprechenden absoluten und relativen Häufigkeiten angeben.

3069_Stichproben.jpg

Es gibt verschiedene statistische Kennwerte zur Erklärung oder Beschreibung von diesen Daten:

  • Lageparameter, ein Kennwert dafür, in welchem Bereich sich die Daten befinden, und
  • Streuungsparameter, mittels welcher man prüfen kann, wie weit die tatsächlichen Datenwerte um den Mittelwert streuen.

Lageparameter

  • Das Minimum des obigen Datensatzes ist der kleinste Wert, also $1$ Stunde.
  • Das Maximum dieses Datensatzes ist der größte Wert, also $6$ Stunden.
  • Die Spannweite dieses Datensatzes ist Maximum minus Minimum, hier also $6-1=5$.

Den arithmetischen Mittelwert ($\bar x$) dieses Datensatzes erhältst du, indem du alle Datenwerte addierst und die so erhaltene Summe durch die Anzahl der Daten dividierst:

$\quad~~\bar x=\frac{10\cdot 1+4\cdot 2+1\cdot3+5\cdot 4+7\cdot 5+3\cdot 6}{30}=\frac{106}{30}=3,1\bar 3$.

Das bedeutet, dass die Schüler des Abiturjahrganges im Schnitt etwas mehr als $3$ Stunden pro Woche lernen.

Der Median oder Zentralwert ($\tilde{x}$) ist der mittlere Datenwert des geordneten Datensatzes. Da die Anzahl in diesem Beispiel $30$, also gerade, ist, liegen zwei Datenwerte in der Mitte: $3$ und $4$. Daher bestimmst du den arithmetischen Mittelwert dieser beiden Datenwerte:

$\quad~~\tilde{x}=\frac{3+4}2=\frac{7}2=3,5$.

Mittelwert, Median und Boxplot

Streuungsparameter

Die Varianz $\sigma^2$ ist ein Maß für die Abweichung der Daten von einem Mittelwert, üblicherweise vom arithmetischen Mittel. Du kannst diese wie folgt berechnen:

  • Du multiplizierst jeweils die quadrierte Differenz der Stundenzahl und des Mittelwerts mit der zugehörigen relativen Häufigkeit.
  • Dann addierst du alle Produkte.

Dies siehst du hier am Beispiel des arithmetischen Mittelwerts.

$\begin{array}{rcl} \sigma^2&=&(1-3,1\bar 3)^2\cdot\frac{10}{30}+(2-3,1\bar 3)^2\cdot\frac{4}{30}+(3-3,1\bar 3)^2\cdot\frac{1}{30}\\ &&+(4-3,1\bar 3)^2\cdot\frac{5}{30}+(5-3,1\bar 3)^2\cdot\frac{7}{30}+(6-3,1\bar 3)^2\cdot\frac{3}{30}\\ &=&3,44\bar8 \end{array}$

Die Standardabweichung $\sigma$ ist die Wurzel aus der Varianz

$\sigma=\pm\sqrt{3,44\bar8}\approx 1,857$.

Das bedeutet, dass die tatsächlich mit Lernen verbrachte Zeit um knapp zwei Stunden von dem arithmetischen Mittelwert abweicht.

Man würde angeben:

$\bar{x}\pm \sigma=3,1\bar 3\pm 1,857$.

Damit sollte sich die tatsächlich durchschnittlich mit Lernen verbrachte Zeit in dem Fenster von $1,3$ bis $5$ Stunden bewegen.

Alle Lerntexte zum Thema

Lerntexte zum Thema

Stichproben (1 Lerntext)

Alle Arbeitsblätter zum Thema

Arbeitsblätter zum Thema

Stichproben (1 Arbeitsblatt)