Vorzeichentest
Vorzeichentest Definition
Der Vorzeichentest als einer der nichtparametrischen Tests kann angewendet werden, wenn
- die Daten einer (kleinen) Stichprobe untersucht werden sollen,
- der Median der Daten mit einem hypothetischen bzw. Vorgabe-Median verglichen werden soll (z. B. mit der Alternativhypothese: der Median der monatlichen Einkommen liegt über 3.000 €) und
- die Daten nicht symmetrisch verteilt (und somit auch nicht normalverteilt) sind, d. h., die Daten sind links- oder rechtsschief (sind die Daten symmetrisch, kann der Wilcoxon-Vorzeichen-Rang-Test angewandt werden).
Alternative Begriffe: Median-Test, Vorzeichen-Test.
Beispiel
Beispiel: Vorzeichentest
Ein Personalberatungsunternehmen behauptet: "Der Median des monatlichen Einstiegsgehalts eines Betriebswirts ist 3.000 €."
Einige Studenten sagen: "Das muss doch mehr sein!".
Das soll statistisch mit dem Vorzeichentest untersucht werden.
Dazu wird eine Zufallsstichprobe von 10 Berufsanfängern gezogen: Die Monatsgehälter sind 4.000, 3.500, 2.500, 5.000, 3.100, 2.900, 2.400, 3.200, 3.400, 3.800 €.
Hypothesen aufstellen
Nullhypothese H0: Median = 3.000 € (die Behauptung der Personalberater stimmt)
Alternativhypothese H1: Median > 3.000 € (Hoffnung der Studenten)
Signifikanzniveau festlegen
Das Signifikanzniveau α sei 0,05.
Teststatistik berechnen
Für die Gehälter der Stichprobe, die über dem Median liegen, wird ein "+" (Plus) vergeben, für die, die darunter liegen, ein "-" (Minus).
Die Teststatistik ist die Summe der "+", für die obigen Daten sind das 7 "+".
Die zugrunde liegende Idee ist, dass 5 Plus-Zeichen zu erwarten wären, wenn die Nullhypothese stimmt (da der Median die Menge in darunter und darüber liegende Teilmengen teilt).
Annahme- und Ablehnungsbereich festlegen
Für kleine Stichproben wie hier (bis zu einem Stichprobenumfang von 25) basieren die kritischen Werte des Ablehnungsbereichs i. d. R. auf der Binomialverteilung.
Die Idee dahinter: stimmt die Nullhypothese (der Median ist 3.000 €), ist die Wahrscheinlichkeit, dass eine zufällig ausgewählte Person darüber liegt, 50 % (dass sie unter dem Median liegt, ebenfalls 50 %).
Die Anzahl der "+" in der 10-köpfigen Stichprobe folgt also einer Binomialverteilung B(10, 0,5).
Wahrscheinlichkeit | kumulierte Wahrscheinlichkeit | |
---|---|---|
0 mal über Median | 0,0009765625 | 0,0009765625 |
1 mal über Median | 0,009765625 | 0,0107421875 |
2 mal über Median | 0,0439453125 | 0,0546875 |
3 mal über Median | 0,1171875 | 0,171875 |
4 mal über Median | 0,205078125 | 0,376953125 |
5 mal über Median | 0,24609375 | 0,623046875 |
6 mal über Median | 0,205078125 | 0,828125 |
7 mal über Median | 0,1171875 | 0,9453125 | 8 mal über Median | 0,0439453125 | 0,9892578125 |
9 mal über Median | 0,009765625 | 0,9990234375 |
10 mal über Median | 0,0009765625 | 1 |
Wenn der Median tatsächlich bei 3.000 € liegen würde, wäre es mit 0,0009765625 sehr unwahrscheinlich, 10 Stichprobenwerte über dem Median zu haben. Es wäre mit einer Wahrscheinlichkeit von 0,009765625 auch sehr unwahrscheinlich, 9 mal über dem Median zu liegen (zusammen: 0,0009765625 + 0,009765625 = 0,010742187 (ca. 1 %)).
Es wäre mit einer Wahrscheinlichkeit von 0,0439453125 (ca. 4,4 %) aber schon gar nicht mehr so ganz unwahrscheinlich, 8 mal über dem Median zu liegen.
Die Wahrscheinlichkeit, dass 8 oder mehr Stichprobenwerte "über Median" dabei sind, ist 0,0009765625 + 0,009765625 + 0,0439453125 = 0,054687499 (ca. 5,5 %). Der Wert liegt über dem gewählten Signifikanzniveau von 0,05, d. h. der Ablehnungsbereich umfasst nur 9 und 10 mal "über dem Median".
Der Ablehnungsbereich besteht hier aus den Teststatistik-Werten 9 und 10, der Annahmebereich geht entsprechend von 0 bis 8.
Testentscheidung treffen
Da die Teststatistik mit 7 im Annahmebereich liegt, kann die Nullhypothese (der Median liegt bei 3.000 €) nicht verworfen werden.
Alternative: p-Wert berechnen
Alternativ kann die Fragestellung auch über den p-Wert beantwortet werden:
Die Wahrscheinlichkeit, dass 7 mal oder öfters Stichprobenwerte über dem Median liegen, wenn die Nullhypothese stimmt, ist 0,0009765625 + 0,009765625 + 0,0439453125 + 0,1171875 = 0,171875. Der p-Wert (Überschreitungswahrscheinlichkeit) ist gerundet 0,17 bzw. 17 %.
Das ist (weit) über dem Signifikanzniveau von 0,05, deshalb wird die Nullhypothese nicht abgelehnt.