Chi-Quadrat-Unabhängigkeitstest
Chi-Quadrat-Unabhängigkeitstest Definition
Ein Chi-Quadrat-Unabhängigkeitstest kann angewandt werden, wenn man zwei nominalskalierte Variablen hat und prüfen möchte, ob die zwei Variablen unabhängig sind oder ob ein Zusammenhang besteht.
Beispiel
Eine beispielhafte Fragestellung lautet: besteht zwischen dem Geschlecht des Autohalters (nominalskalierte Variable 1) und der Farbe des Autos (nominalskalierte Variable 2) ein Zusammenhang oder sind diese beiden Variablen unabhängig voneinander?
Der Chi-Quadrat-Unabhängigkeitstest basiert auf der Chi-Quadrat-Verteilung, die durch die Anzahl der Freiheitsgrade bestimmt wird.
Beispiel
Die Vorgehensweise des Chi-Quadrat-Unabhängigkeitstests ähnelt der beim Chi-Quadrat-Anpassungstest.
Beispiel: Chi-Quadrat-Unabhängigkeitstest
Der Chi-Quadrat-Unabhängigkeitstest soll auf Basis der Daten zum Korrelationskoeffizienten Chi-Quadrat durchgeführt werden.
Die Daten für die Schüler einer Klasse waren:
Mädchen | Jungen | Gesamt | |
---|---|---|---|
im Sportverein | 9 | 9 | 18 |
nicht im Sportverein | 9 | 3 | 12 |
Gesamt | 18 | 12 | 30 |
Schritt 1: Aufstellen der Hypothesen
Nullhypothese H0: die Merkmale "Geschlecht" und "Mitgliedschaft in einem Sportverein" sind unabhängig voneinander.
Alternativhypothese H1: die Merkmale "Geschlecht" und "Mitgliedschaft in einem Sportverein" sind voneinander abhängig.
Das Signifikanzniveau sei 0,05 bzw. 5 %.
Schritt 2: Ablehnungsbereich für die Chi-Quadrat-Verteilung bestimmen
Zunächst muss die Anzahl der Freiheitsgrade berechnet werden: (Anzahl der Zeilen - 1) × (Anzahl der Spalten - 1), für die Vierfeldertafel im Beispiel mit 2 Zeilen und 2 Spalten: (2 - 1) × (2 - 1) = 1 × 1 = 1. Die Anzahl der Freiheitsgrade ist also 1.
Der kritische Wert für χ2 (Chi-Quadrat), ab dem der Ablehnungsbereich der Chi-Quadrat-Verteilung beginnt, kann aus der Chi-Quadrat-Tabelle in der Spalte für 0,05 (Signifikanzniveau) und in der Zeile für 1 Freiheitsgrad abgelesen werden: χ21; 0,05 = 3,841.
D.h., ist die im folgenden berechnete Teststatistik größer als 3,841, wird die Nullhypothese abgelehnt.
Schritt 3: Teststatistik berechnen
Die Teststatistik war im Chi-Quadrat-Beispiel bereits mit 1,875 berechnet worden.
Schritt 4: Testentscheidung treffen
Der Wert der Chi-Quadrat-Teststatistik ist mit 1,875 nicht höher als der kritische Chi-Quadrat-Wert von 3,841. Deshalb wird die Nullhypothese nicht abgelehnt.
Bereits der auf Chi-Quadrat basierende Cramers V - Koeffizient hatte festgestellt, dass zwischen den beiden Merkmalen nur ein geringer statistischer Zusammenhang besteht.