Wilcoxon-Vorzeichen-Rang-Test

Wilcoxon-Vorzeichen-Rang-Test Definition

Mit dem Wilcoxon-Vorzeichen-Rang-Test kann überprüft werden, ob eine Stichprobe von einem erwarteten Wert bzw. einer vorgegebenen Konstanten abweicht oder ob sich die Werte zweier gepaarter Stichproben unterscheiden. Dabei werden Hypothesen bzw. Vergleiche bzgl. des Medians angestellt.

Der Wilcoxon-Vorzeichen-Rang-Test als einer der nichtparametrischen Tests wird u. a. verwendet, wenn

  • nur eine Stichprobe oder 2 gepaarte Stichproben untersucht werden sollen (bei 2 unabhängigen Stichproben kann der Wilcoxon-Rangsummentest angewandt werden),
  • die Daten der Stichprobe nicht normalverteilt, aber symmetrisch um den Mittelwert oder Median verteilt sind (sonst kann der Vorzeichentest angewandt werden),
  • die Daten intervallskaliert (metrisch) sind (Alternative sonst wiederum der Vorzeichentest) und
  • nur eine kleine Stichprobe (geringer Stichprobenumfang) vorliegt.

Das parametrische Gegenstück ist der Einstichproben-t-Test bzw. der gepaarte Zweistichproben-t-Test.

Beispiel

Beispiel: Wilcoxon-Vorzeichen-Rang-Test für eine Stichprobe

Bei Anwendung auf nur eine Stichprobe testet der Wilcoxon-Vorzeichen-Rang-Test, ob die Stichprobe aus einer Grundgesamtheit stammen kann, die einen vermuteten / behaupteten Median hat.

Ein Professor behauptet, dass seine Vorlesung so spannend ist, dass der Puls der Studenten während der Vorlesung im Median bei über 70 liegt.

Um das zu testen, wird im Verlauf einer Vorlesung bei einer Stichprobe von 4 Studenten der Puls gemessen (die Stichprobe ist eigentlich zu klein, das vereinfacht aber hier die Berechnungen).

Die gemessenen Pulswerte für die Studenten Bernd, Lisa, Paul und Sophie sind: 72, 60, 85, 78.

Das Signifikanzniveau sei wie üblich 0,05.

Die Hypothesen lauten entsprechend (bei Durchführung als einseitiger, rechtsseitiger Test):

Nullhypothese H0: M <= 70 (Puls liegt im Median bei höchstens 70)

Alternativhypothese H1: M > 70 (Puls liegt im Median bei mehr als 70)

In der Tabelle werden die notwendigen Rechenschritte durchgeführt:

Daten für Wilcoxon-Vorzeichen-Rang-Test
Student Puls Puls - Median Absolute Differenz Rang
Bernd 72 2 2 1
Lisa 60 -10 10 3
Paul 85 15 15 4
Sophie 78 8 8 2

Erläuterung:

  • in der 3. Spalte werden die Differenzen zwischen dem Messwert und dem behaupteten Median von 70 berechnet;
  • Spalte 4 gibt dazu die Absolutbeträge an;
  • in Spalte 5 werden Ränge vergeben: der kleinste Absolutwert von 2 erhält den Rang 1, der zweitkleinste Absolutwert von 8 den Rang 2, der drittkleinste Absolutwert von 10 erhält Rang 3 und der größte Wert 15 erhält Rang 4.

Nun werden die Ränge aufsummiert, bei denen die Differenz (Spalte 3) positiv war: 1 + 4 + 2 = 7.

Dieser Wert 7 ist die Teststatistik des Wilcoxon-Vorzeichen-Rang-Tests.

Die Teststatistik kann Werte annehmen zwischen 0 und – mit n gleich dem Stichprobenumfang (allerdings würden hier etwaige Stichproben mit Null-Differenzen, die im Beispiel oben bei einem Messwert von 70 auftreten würden und die wir hier nicht haben, nicht mit einbezogen) – n × (n + 1)/ 2, d. h. zwischen 0 und 4 × (4 + 1) / 2 = 10 (wenn alle 4 Differenzen positiv wären, müsste man 1 + 2 + 3 + 4 = 10 aufaddieren).

Man kann sich nun überlegen, wie wahrscheinlich es ist, einen Wert von 7 oder mehr (d. h. 7, 8, 9 oder 10) zu erhalten:

  • den Wert 7 erhält man als Summe der Ränge 3 und 4 oder als Summe der Ränge 1, 2 und 4 (das sind 2 Möglichkeiten);
  • den Wert 8 erhält man als Summe der Ränge 1, 3 und 4 (das ist eine einzige Möglichkeit);
  • den Wert 9 erhält man als Summe der Ränge 2, 3 und 4 (das ist eine einzige Möglichkeit);
  • den Wert 10 erhält man als Summe der Ränge 1, 2, 3 und 4 (das ist eine einzige Möglichkeit).

Es gibt insgesamt 24 = 16 Möglichkeiten, aus den Rängen 1, 2, 3 und 4 eine Teilmenge zu bilden.

Somit hat der Wert 7 eine Wahrscheinlichkeit von 2/16, und die Werte 8, 9 und 10 haben jeweils eine Wahrscheinlichkeit von 1/16; in Summe sind das 5/16 = 0,3125. Es ist also mit 31,25 % gar nicht so unwahrscheinlich, eine Teststatistik von 7 oder sogar mehr zu erhalten.

Da dieser p-Wert mit 0,3125 über dem Signifikanzniveau von 0,05 liegt, kann die Nullhypothese nicht abgelehnt werden; die Behauptung des Professors konnte mit der Stichprobe nicht hinreichend sicher untermauert werden.