Chi-Quadrat-Unabhängigkeitstest

Chi-Quadrat-Unabhängigkeitstest Definition

Ein Chi-Quadrat-Unabhängigkeitstest kann angewandt werden, wenn man zwei nominalskalierte Variablen hat und prüfen möchte, ob die zwei Variablen unabhängig sind oder ob ein Zusammenhang besteht.

Beispiel

Eine beispielhafte Fragestellung lautet: besteht zwischen dem Geschlecht des Autohalters (nominalskalierte Variable 1) und der Farbe des Autos (nominalskalierte Variable 2) ein Zusammenhang oder sind diese beiden Variablen unabhängig voneinander?

Der Chi-Quadrat-Unabhängigkeitstest basiert auf der Chi-Quadrat-Verteilung, die durch die Anzahl der Freiheitsgrade bestimmt wird.

Beispiel

Die Vorgehensweise des Chi-Quadrat-Unabhängigkeitstests ähnelt der beim Chi-Quadrat-Anpassungstest.

Beispiel: Chi-Quadrat-Unabhängigkeitstest

Der Chi-Quadrat-Unabhängigkeitstest soll auf Basis der Daten zum Korrelationskoeffizienten Chi-Quadrat durchgeführt werden.

Die Daten für die Schüler einer Klasse waren:

Vierfeldertafel mit absoluten Häufigkeiten
Mädchen Jungen Gesamt
im Sportverein 9 9 18
nicht im Sportverein 9 3 12
Gesamt 18 12 30

Schritt 1: Aufstellen der Hypothesen

Nullhypothese H0: die Merkmale "Geschlecht" und "Mitgliedschaft in einem Sportverein" sind unabhängig voneinander.

Alternativhypothese H1: die Merkmale "Geschlecht" und "Mitgliedschaft in einem Sportverein" sind voneinander abhängig.

Das Signifikanzniveau sei 0,05 bzw. 5 %.

Schritt 2: Ablehnungsbereich für die Chi-Quadrat-Verteilung bestimmen

Zunächst muss die Anzahl der Freiheitsgrade berechnet werden: (Anzahl der Zeilen - 1) × (Anzahl der Spalten - 1), für die Vierfeldertafel im Beispiel mit 2 Zeilen und 2 Spalten: (2 - 1) × (2 - 1) = 1 × 1 = 1. Die Anzahl der Freiheitsgrade ist also 1.

Der kritische Wert für χ2 (Chi-Quadrat), ab dem der Ablehnungsbereich der Chi-Quadrat-Verteilung beginnt, kann aus der Chi-Quadrat-Tabelle in der Spalte für 0,05 (Signifikanzniveau) und in der Zeile für 1 Freiheitsgrad abgelesen werden: 3,841.

D.h., ist die im folgenden berechnete Teststatistik größer als 3,841, wird die Nullhypothese abgelehnt.

Schritt 3: Teststatistik berechnen

Die Teststatistik war im Chi-Quadrat-Beispiel bereits mit 1,875 berechnet worden.

Schritt 4: Testentscheidung treffen

Der Wert der Chi-Quadrat-Teststatistik ist mit 1,875 nicht höher als der kritische Chi-Quadrat-Wert von 3,841. Deshalb wird die Nullhypothese nicht abgelehnt.

Bereits der auf Chi-Quadrat basierende Cramers V - Koeffizient hatte festgestellt, dass zwischen den beiden Merkmalen nur ein geringer statistischer Zusammenhang besteht.