Vorzeichentest

Vorzeichentest Definition

Der Vorzeichentest als einer der nichtparametrischen Tests kann angewendet werden, wenn

  • die Daten einer (kleinen) Stichprobe untersucht werden sollen,
  • der Median der Daten mit einem hypothetischen bzw. Vorgabe-Median verglichen werden soll (z. B. mit der Alternativhypothese: der Median der monatlichen Einkommen liegt über 3.000 €) und
  • die Daten nicht symmetrisch verteilt (und somit auch nicht normalverteilt) sind, d. h., die Daten sind links- oder rechtsschief (sind die Daten symmetrisch, kann der Wilcoxon-Vorzeichen-Rang-Test angewandt werden).

Alternative Begriffe: Median-Test, Vorzeichen-Test.

Beispiel

Beispiel: Vorzeichentest

Ein Personalberatungsunternehmen behauptet: "Der Median des monatlichen Einstiegsgehalts eines Betriebswirts ist 3.000 €."

Einige Studenten sagen: "Das muss doch mehr sein!".

Das soll statistisch mit dem Vorzeichentest untersucht werden.

Dazu wird eine Zufallsstichprobe von 10 Berufsanfängern gezogen: Die Monatsgehälter sind 4.000, 3.500, 2.500, 5.000, 3.100, 2.900, 2.400, 3.200, 3.400, 3.800 €.

Hypothesen aufstellen

Nullhypothese H0: Median = 3.000 € (die Behauptung der Personalberater stimmt)

Alternativhypothese H1: Median > 3.000 € (Hoffnung der Studenten)

Signifikanzniveau festlegen

Das Signifikanzniveau α sei 0,05.

Teststatistik berechnen

Für die Gehälter der Stichprobe, die über dem Median liegen, wird ein "+" (Plus) vergeben, für die, die darunter liegen, ein "-" (Minus).

Die Teststatistik ist die Summe der "+", für die obigen Daten sind das 7 "+".

Die zugrunde liegende Idee ist, dass 5 Plus-Zeichen zu erwarten wären, wenn die Nullhypothese stimmt (da der Median die Menge in darunter und darüber liegende Teilmengen teilt).

Annahme- und Ablehnungsbereich festlegen

Für kleine Stichproben wie hier (bis zu einem Stichprobenumfang von 25) basieren die kritischen Werte des Ablehnungsbereichs i. d. R. auf der Binomialverteilung.

Die Idee dahinter: stimmt die Nullhypothese (der Median ist 3.000 €), ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person darüber liegt, 50 % (dass sie unter dem Median liegt, ebenfalls 50 %).

Die Anzahl der "+" in der 10-köpfigen Stichprobe folgt also einer Binomialverteilung B(10, 0,5).

Binomialverteilung B(10, 0,5)
Wahrscheinlichkeit kumulierte Wahrscheinlichkeit
0 mal über Median 0,0009765625 0,0009765625
1 mal über Median 0,009765625 0,0107421875
2 mal über Median 0,0439453125 0,0546875
3 mal über Median 0,1171875 0,171875
4 mal über Median 0,205078125 0,376953125
5 mal über Median 0,24609375 0,623046875
6 mal über Median 0,205078125 0,828125
7 mal über Median 0,1171875 0,9453125
8 mal über Median 0,0439453125 0,9892578125
9 mal über Median 0,009765625 0,9990234375
10 mal über Median 0,0009765625 1

Wenn der Median tatsächlich bei 3.000 € liegen würde, wäre es mit 0,0009765625 sehr unwahrscheinlich, 10 Stichprobenwerte über dem Median zu haben. Es wäre mit einer Wahrscheinlichkeit von 0,009765625 auch sehr unwahrscheinlich, 9 mal über dem Median zu liegen (zusammen: 0,0009765625 + 0,009765625 = 0,010742187 (ca. 1 %)).

Es wäre mit einer Wahrscheinlichkeit von 0,0439453125 (ca. 4,4 %) aber schon gar nicht mehr so ganz unwahrscheinlich, 8 mal über dem Median zu liegen.

Die Wahrscheinlichkeit, dass 8 oder mehr Stichprobenwerte "über Median" dabei sind, ist 0,0009765625 + 0,009765625 + 0,0439453125 = 0,054687499 (ca. 5,5 %). Der Wert liegt über dem gewählten Signifikanzniveau von 0,05, d. h. der Ablehnungsbereich umfasst nur 9 und 10 mal "über dem Median".

Der Ablehnungsbereich besteht hier aus den Teststatistik-Werten 9 und 10, der Annahmebereich geht entsprechend von 0 bis 8.

Testentscheidung treffen

Da die Teststatistik mit 7 im Annahmebereich liegt, kann die Nullhypothese (der Median liegt bei 3.000 €) nicht verworfen werden.

Alternative: p-Wert berechnen

Alternativ kann die Fragestellung auch über den p-Wert beantwortet werden:

Die Wahrscheinlichkeit, dass 7 mal oder öfters Stichprobenwerte über dem Median liegen, wenn die Nullhypothese stimmt, ist 0,0009765625 + 0,009765625 + 0,0439453125 + 0,1171875 = 0,171875. Der p-Wert (Überschreitungswahrscheinlichkeit) ist gerundet 0,17 bzw. 17 %.

Das ist (weit) über dem Signifikanzniveau von 0,05, deshalb wird die Nullhypothese nicht abgelehnt.