Standardabweichung

Standardabweichung Definition

Die Standardabweichung ist die Quadratwurzel aus der Varianz (Formel: Standardabweichung = √ Varianz).

Die Standardabweichung ist ein Streuungsparameter, der anzeigt, inwieweit die Werte um den arithmetischen Mittelwert streuen; je größer die Standardabweichung (in Relation zum Mittelwert), desto größer die Streuung (und desto schlechter spiegelt der Mittelwert die Daten wider).

Die Standardabweichung wird oft mit dem griechischen Buchstaben σ (Sigma) abgekürzt; sie hat dieselbe Einheit, wie die zugrundeliegenden Daten (im Beispiel unten: Jahre).

Alternative Begriffe: Mittlere quadratische Abweichung, Standard Deviation (kurz: SD).

Beispiel

Beispiel: Standardabweichung berechnen und interpretieren

Wir greifen die Beispieldaten zur Varianz auf:

Eine Familie hat 5 Kinder im Alter von 1, 3, 5, 9 und 12 Jahren.

Der arithmetische Mittelwert, der in einem ersten Schritt berechnet werden muss, ist (1 + 3 + 5 + 9 + 12)/5 = 6 (Jahre).

Die Varianz ist: σ2 = ((1-6)2 + (3-6)2 + (5-6)2 + (9-6)2 + (12-6)2)/5 = (25 + 9 + 1 + 9 + 36) / 5 = 80/5 = 16.

Es wurden hier die Abweichungen aller Werte (hier: Alter) vom arithmetischen Mittelwert (hier: durchschnittliches Alter) quadriert, aufsummiert und anschließend durch die Anzahl der Merkmalsträger (hier: Anzahl der Kinder) geteilt.

Die Varianz als allgemeine Formel: ∑ [xi - ∅]2 / n mit xi für die Messwerte von i = 1 bis n und n = Anzahl der Merkmalsträger / Messwerte.

Standardabweichung berechnen

Die Standardabweichung σ ist dann 4 (Quadratwurzel aus 16).

Standardabweichung interpretieren

Das heißt, im Mittel streuen die Werte (die Alter der Kinder) um 4 Jahre in Bezug auf den arithmetischen Durchschnitt (6 Jahre).

Das ist eine relativ große Standardabweichung (4 Jahre bei 6 Jahren Durchschnittsalter), die Alter der Kinder liegen ja auch ziemlich auseinander — und das spiegelt die Standardabweichung eben wider.

Wären die 5 Kinder Fünflinge und alle 6 Jahre alt, wäre der Durchschnitt natürlich auch 6 Jahre und die Varianz und Standardabweichung wären 0 (es gibt keine Streuung, alle Daten bzw. Alter sind gleich).

Standardabweichung vs. empirische Standardabweichung

In dem obigen Beispiel sind wir von einer Vollerhebung ausgegangen (alle Kinder der Familie wurden erfasst). Handelt es sich hingegen um eine Stichprobe, wird (wie bei der Varianz) nicht durch die Anzahl der Erfassten (im obigen Beispiel: 5), sondern durch die Stichprobenanzahl minus 1 geteilt.

Diese sogenannte empirische Stichprobenvarianz wird zur Abgrenzung von der obigen Standardabweichung der Grundgesamtheit mit s abgekürzt; die Varianz wäre dann in dem obigen Beispiel 20 gewesen (siehe das Varianz-Beispiel) und die empirische Standardabweichung wäre entsprechend die Wurzel aus 20 = 4,47.

Standardabweichungen vergleichen

Der Vergleich von Standardabweichungen verschiedener Datenreihen ist nur sinnvoll, wenn die Maßstäbe einheitlich sind.

Beispiel: Standardabweichungen vergleichen

Angenommen, in einem anderen Land würde man das Alter nicht in Jahren, sondern in Halbjahren messen. Dann hätte die obige 5-köpfige Familie die Alter 2, 6, 10, 18 und 24 Halbjahre.

Der Durchschnitt wäre dann 12, die Varianz 64 und die Standardabweichung 8.

Die Standardabweichung ist doppelt so hoch wie im Ausgangsbeispiel, obwohl es sich um dieselbe Familie mit derselben Streuung der Alter, nur anders gemessen, handelt.

Ein vernünftiger Vergleich von Standardabweichungen setzt die Messung in gleichen Maßstäben voraus; das gilt zum Beispiel auch, wenn Standardabweichungen für Datenreihen in unterschiedlichen Währungen berechnet werden.

Der Variationskoeffizient hingegen wäre unabhängig von der Messung (in Jahren oder in Halbjahren) identisch.