Chi-Quadrat-Anpassungstest
Chi-Quadrat-Anpassungstest Definition
Der Chi-Quadrat-Anpassungstest prüft die Frage: sind die vorliegenden Daten auf eine bestimmte, vom "Tester" angenommene Art verteilt?
Die Annahme kann zum Beispiel sein, dass die Daten
- normalverteilt sind,
- exponentialverteilt sind,
- poissonverteilt sind,
- gleichverteilt sind (zum Beispiel: ist die Anzahl der Kunden eines Geschäfts an jedem geöffneten Wochentag identisch?),
- so verteilt sind, wie sie es in der Vergangenheit einmal waren (zum Beispiel die Verteilung der Antworten bei einer vor Jahren durchgeführten Meinungsumfrage) oder wie man es vermutet.
Der Chi-Quadrat-Anpassungstest basiert auf der Chi-Quadrat-Verteilung, die durch die Anzahl der Freiheitsgrade bestimmt wird.
Beispiel
Die Vorgehensweise lässt sich am besten an einem Beispiel zeigen.
Beispiel: Chi-Quadrat-Anpassungstest
Ein Fitnessstudio bietet einen bestimmten Kurs 3 mal wöchentlich zur selben Uhrzeit an: montags, mittwochs und freitags.
Der Geschäftsführer möchte wissen, ob die Teilnehmerzahl sich auf die 3 Wochentage gleichmäßig verteilt oder ob sie sich signifikant unterscheidet. Dafür erfasst er in einer zufällig ausgewählten Woche die Teilnehmerzahl an den 3 Tagen: 18, 26 und 22.
Schritt 1: Aufstellen der Hypothesen
Nullhypothese H0: die Teilnehmerzahl ist gleichverteilt (das heißt identisch an allen 3 Tagen).
An dieser Stelle stutzt man eventuell: man sieht ja an den Daten, dass die Teilnehmerzahl nicht identisch ist — das kann aber zufällig sein. Der Test prüft, ob man die Fragestellung auch mit hinreichender Sicherheit beantworten kann.
Alternativhypothese H1: die Teilnehmerzahl ist nicht gleichverteilt.
Das Signifikanzniveau sei 0,05 bzw. 5 %.
Schritt 2: Annahme- bzw. Ablehnungsbereich für die Chi-Quadrat-Verteilung bestimmen
Die Anzahl der Freiheitsgrade ist: Anzahl der Kategorien - 1. Die Kategorien sind hier die 3 Wochentage Montag, Mittwoch und Freitag, das heißt die Anzahl der Freiheitsgrade ist 3 - 1 = 2.
Der kritische Wert für χ2 (Chi-Quadrat), ab dem der Ablehnungsbereich der Chi-Quadrat-Verteilung beginnt, kann aus der Chi-Quadrat-Tabelle in der Spalte für 0,05 (Signifikanzniveau) und in der Zeile für 2 Freiheitsgrade abgelesen werden: 5,991.
Das heißt, ist die im folgenden berechnete Teststatistik größer als 5,991, wird die Nullhypothese abgelehnt.
Schritt 3: Teststatistik berechnen
Die Berechnung der Chi-Quadrat-Teststatistik wird in folgender Tabelle vorgenommen:
Wochentag | tatsächliche Teilnehmer | erwartete Teilnehmer | Differenz | quadrierte Differenz | quadrierte Differenz / erwartete Teilnehmerzahl |
---|---|---|---|---|---|
Montag | 18 | 22 | -4 | 16 | 0,7273 |
Dienstag | 26 | 22 | 4 | 16 | 0,7273 |
Mittwoch | 22 | 22 | 0 | 0 | 0 |
Summe | 1,4546 |
Erläuterung:
- in der 3. Spalte werden die erwarteten Werte berechnet unter der Annahme, dass die Nullhypothese zutrifft. Es waren in der Woche 18 + 26 + 22 = 66 Teilnehmer in dem Kurs, bei einer Gleichverteilung wären 22 je Tag zu erwarten gewesen;
- in der 4. Spalte werden die Differenzen zwischen den tatsächlich erfassten Werten und den zu erwartenden Werten berechnet;
- in der 5. Spalte werden die Differenzen quadriert (wie auch zum Beispiel bei der Varianz üblich);
- in der 6. Spalte werden die quadrierten Differenzen durch die erwarteten Werte geteilt (damit werden die Differenzen gewichtet bzw. in Relation gesetzt);
- die Summe der 6. Spalte ist der Wert der Chi-Quadrat-Teststatistik: 1,4546.
Schritt 4: Testentscheidung treffen
Der Wert der Chi-Quadrat-Teststatistik ist mit 1,4546 nicht höher als der kritische Chi-Quadrat-Wert von 5,991. Deshalb wird die Nullhypothese nicht abgelehnt (mit anderen Worten: die Abweichungen der erfassten Teilnehmerzahlen von gleichverteilten Teilnehmerzahlen können dem Zufall geschuldet sein).