Ungepaarter-t-Test

Ungepaarter-t-Test Definition

Der ungepaarte t-Test ist ein t-Test für 2 Stichproben bzw. Gruppen, die voneinander unabhängig sind.

Beispiel

Es wird für eine zufällig ausgewählte Patientengruppe, die das Medikament A bekommt (Stichprobe 1) und für eine davon unabhängige zufällig ausgewählte andere Patientengruppe, die das Medikament B bekommt (Stichprobe 2), getestet, ob der Mittelwert eines Messwerts (z.B. systolischer Blutdruck) sich für beide Gruppen unterscheidet.

Voraussetzung für die Anwendung des ungepaarten t-Tests ist, dass

  • die Daten normalverteilt sind (das kann vorab mit einem Test auf Normalverteilung geprüft werden) und
  • dass die Varianzen bzw. Standardabweichungen der beiden Stichproben ungefähr gleich sind (sog. Varianzhomogenität; ansonsten kommt der Welch-Test in Frage).

Für abhängige Stichproben gibt es den gepaarten t-Test.

Alternative Begriffe: t-Test für unabhängige Stichproben, Zweistichproben-t-Test für unverbundene Stichproben.

Beispiel

Beispiel: t-Test für unverbundene Stichproben

Ein Medizinstudent hört in einer Vorlesung: der Puls von Erwachsenen (18 - 65 Jahre) sei niedriger als der von Senioren (über 65 Jahre). Das soll anhand einer Stichprobe geprüft werden. Die o.g. Voraussetzungen (Normalverteilung, gleiche Varianzen) seien gegeben.

Es werden jeweils für eine Zufallsstichprobe vom Umfang 3 (eigentlich zu wenig, aber rechentechnisch einfacher) aus den beiden Gruppen Erwachsene und Senioren die Pulswerte gemessen:

  • Erwachsene: 70, 76, 82;
  • Senioren: 72, 78, 90.

Es seien

  • μA: Durchschnittspuls von Erwachsenen (Gruppe A);
  • μB: Durchschnittspuls von Senioren (Gruppe B).

δ (Delta) bezeichne die Differenz zwischen den Mittelwerten: δ = μA - μB

Hypothesen aufstellen

Nullhypothese H0: δ >= 0 (Puls von Erwachsenen ist mindestens so hoch wie der von Senioren).

Alternativhypothese H1: δ < 0 (Puls der Senioren ist höher, die Differenz ist negativ).

Signifikanzniveau festlegen

Das Signifikanzniveau α sei 0,05.

Teststatistik berechnen

Die Teststatistik lautet:

$$T = \sqrt{\frac{m \cdot n}{m + n}} \cdot \frac{(\bar X_A - \bar X_B)}{\bar s}$$

Dabei sind

  • m und n die Stichprobenumfänge der beiden Gruppen (hier jeweils 3)
  • $\bar X_A$ und $\bar X_B$ die Durchschnittswerte der beiden Stichproben:
    • (70 + 76 + 82) / 3 = 228 / 3 = 76 für Gruppe A
    • (72 + 78 + 90) / 3 = 240 / 3 = 80 für Gruppe B.
  • $\bar s$ ist die durchschnittliche Standardabweichung
    • die Stichprobenvarianz von Gruppe A ist: [(70 - 76)2 + (76 - 76)2 + (82 - 76)2] / (3 - 1) = (36 + 0 + 36)/2 = 72/2 = 36;
    • die Stichprobenvarianz von Gruppe B ist: [(72 - 80)2 + (78 - 80)2 + (90 - 80)2] / (3 - 1) = (64 + 4 + 100)/2 = 168/2 = 84;
    • die durchschnittliche Varianz ist dann (36 + 84) /2 = 120/2 = 60; daraus ergibt sich die durchschnittliche Standardabweichung als √60 = 7,74597.

[Hinweis: an dieser Stelle sieht man, dass die Varianzen – entgegen der oben vorausgesetzten Varianzhomogenität – nicht gleich sind; insofern wäre hier der Welch-Test angebracht gewesen.]

Wir ignorieren das an dieser Stelle und führen den ungepaarten t-Test fort.

$$T = \sqrt{\frac{3 \cdot 3}{3 + 3}} \cdot \frac{(76 - 80)}{7,74597} = -0,63246.$$

Annahme- und Ablehnungsbereich festlegen

Aus der t-Tabelle kann man für α = 0,95 und 4 Freiheitsgrade den Wert 2,1318 ablesen. Liegt die Teststatistik unter -t0,95; 4, d.h. unter -2,1318, wird die Nullhypothese verworfen.

Die 4 Freiheitsgrade ergeben sich aus: Stichprobenumfang A + Stichprobenumfang B - 2 = 3 + 3 - 2 = 4.

Testentscheidung treffen

Der Wert der Teststatistik -0,63246 liegt nicht unterhalb von -2,1318, deshalb wird die Nullhypothese nicht verworfen. Dass Senioren einen höheren Puls haben, konnte hier nicht statistisch untermauert werden.