Chi-Quadrat-Anpassungstest

Chi-Quadrat-Anpassungstest Definition

Der Chi-Quadrat-Anpassungstest prüft die Frage: sind die vorliegenden Daten auf eine bestimmte, vom "Tester" angenommene Art verteilt?

Die Annahme kann z.B. sein, dass die Daten

  • normalverteilt sind,
  • exponentialverteilt sind,
  • poissonverteilt sind,
  • gleichverteilt sind (z.B.: ist die Anzahl der Kunden eines Geschäfts an jedem geöffneten Wochentag identisch?),
  • so verteilt sind, wie sie es in der Vergangenheit einmal waren (z.B. die Verteilung der Antworten bei einer vor Jahren durchgeführten Meinungsumfrage) oder wie man es vermutet.

Der Chi-Quadrat-Anpassungstest basiert auf der Chi-Quadrat-Verteilung, die durch die Anzahl der Freiheitsgrade bestimmt wird.

Beispiel

Die Vorgehensweise lässt sich am besten an einem Beispiel zeigen.

Beispiel: Chi-Quadrat-Anpassungstest

Ein Fitnessstudio bietet einen bestimmten Kurs 3 mal wöchentlich zur selben Uhrzeit an: montags, mittwochs und freitags.

Der Geschäftsführer möchte wissen, ob die Teilnehmerzahl sich auf die 3 Wochentage gleichmäßig verteilt oder ob sie sich signifikant unterscheidet. Dafür erfasst er in einer zufällig ausgewählten Woche die Teilnehmerzahl an den 3 Tagen: 18, 26 und 22.

Schritt 1: Aufstellen der Hypothesen

Nullhypothese H0: die Teilnehmerzahl ist gleichverteilt (d.h. identisch an allen 3 Tagen).

An dieser Stelle stutzt man eventuell: man sieht ja an den Daten, dass die Teilnehmerzahl nicht identisch ist — das kann aber zufällig sein. Der Test prüft, ob man die Fragestellung auch mit hinreichender Sicherheit beantworten kann.

Alternativhypothese H1: die Teilnehmerzahl ist nicht gleichverteilt.

Das Signifikanzniveau sei 0,05 bzw. 5 %.

Schritt 2: Annahme- bzw. Ablehnungsbereich für die Chi-Quadrat-Verteilung bestimmen

Die Anzahl der Freiheitsgrade ist: Anzahl der Kategorien - 1. Die Kategorien sind hier die 3 Wochentage Montag, Mittwoch und Freitag, d.h., die Anzahl der Freiheitsgrade ist 3 - 1 = 2.

Der kritische Wert für χ2 (Chi-Quadrat), ab dem der Ablehnungsbereich der Chi-Quadrat-Verteilung beginnt, kann aus der Chi-Quadrat-Tabelle in der Spalte für 0,05 (Signifikanzniveau) und in der Zeile für 2 Freiheitsgrade abgelesen werden: 5,991.

D.h., ist die im folgenden berechnete Teststatistik größer als 5,991, wird die Nullhypothese abgelehnt.

Schritt 3: Teststatistik berechnen

Die Berechnung der Chi-Quadrat-Teststatistik wird in folgender Tabelle vorgenommen:

Berechnung der Chi-Quadrat-Teststatistik
Wochentag tatsächliche Teilnehmer erwartete Teilnehmer Differenz quadrierte Differenz quadrierte Differenz / erwartete Teilnehmerzahl
Montag 18 22 -4 16 0,7273
Dienstag 26 22 4 16 0,7273
Mittwoch 22 22 0 0 0
Summe 1,4546

Erläuterung:

  • in der 3. Spalte werden die erwarteten Werte berechnet unter der Annahme, dass die Nullhypothese zutrifft. Es waren in der Woche 18 + 26 + 22 = 66 Teilnehmer in dem Kurs, bei einer Gleichverteilung wären 22 je Tag zu erwarten gewesen;
  • in der 4. Spalte werden die Differenzen zwischen den tatsächlich erfassten Werten und den zu erwartenden Werten berechnet;
  • in der 5. Spalte werden die Differenzen quadriert (wie auch z.B. bei der Varianz üblich);
  • in der 6. Spalte werden die quadrierten Differenzen durch die erwarteten Werte geteilt (damit werden die Differenzen gewichtet bzw. in Relation gesetzt);
  • die Summe der 6. Spalte ist der Wert der Chi-Quadrat-Teststatistik: 1,4546.

Schritt 4: Testentscheidung treffen

Der Wert der Chi-Quadrat-Teststatistik ist mit 1,4546 nicht höher als der kritische Chi-Quadrat-Wert von 5,991. Deshalb wird die Nullhypothese nicht abgelehnt (mit anderen Worten: die Abweichungen der erfassten Teilnehmerzahlen von gleichverteilten Teilnehmerzahlen können dem Zufall geschuldet sein).