Cramers V
Cramers V Definition
Cramers V misst die Stärke des Zusammenhangs zwischen nominalskalierten Merkmalen.
Cramers V wird dabei aus Chi-Quadrat abgeleitet: Chi-Quadrat wird durch das Produkt aus der Anzahl der Merkmalsträger / Messwerte und dem Minimum der Zeilen- und Spaltenzahl der Kreuztabelle abzüglich 1 dividiert, anschließend wird die Quadratwurzel gezogen.
Beispiel
Beispiel: Cramers V berechnen
Bezug nehmend auf das Chi-Quadrat-Beispiel und in Fortführung des Beispiels zur Vierfeldertafel, bei der die Häufigkeiten für 2 nominalskalierte Merkmale – Geschlecht (Merkmal 1) und Mitgliedschaft in einem Sportverein (Merkmal 2) – für die Schüler einer Klasse dargestellt wurden.
Inwiefern besteht nun zwischen Geschlecht und Mitgliedschaft in einem Sportverein ein Zusammenhang?
Die Vierfeldertafel war:
Mädchen | Jungen | Gesamt | |
---|---|---|---|
im Sportverein | 9 | 9 | 18 |
nicht im Sportverein | 9 | 3 | 12 |
Gesamt | 18 | 12 | 30 |
Schritt 1: relative Häufigkeiten berechnen
Mädchen | Jungen | Gesamt | |
---|---|---|---|
im Sportverein | 0,3 | 0,3 | 0,6 |
nicht im Sportverein | 0,3 | 0,1 | 0,4 |
Gesamt | 0,6 | 0,4 | 1,0 |
Z. B. ergibt sich der Wert von 0,3 in der Tabellenzelle Mädchen/im Sportverein daraus, dass 9 von 30 Schülern Mädchen und in einem Sportverein sind, also 9/30 = 0,3; unter "Gesamt" sind jeweils die sog. Randhäufigkeiten eingetragen, die in Summe immer 1 bzw. 100 % ergeben.
Schritt 2: Vierfeldertafel bei Unabhängigkeit berechnen
Anschließend berechnet man, wie die Verteilung sein müsste, wenn es keinen Zusammenhang zwischen den Merkmalen Geschlecht und Mitgliedschaft in einem Sportverein gibt:
Mädchen | Jungen | Gesamt | |
---|---|---|---|
im Sportverein | 0,36 | 0,24 | 0,6 |
nicht im Sportverein | 0,24 | 0,16 | 0,4 |
Gesamt | 0,6 | 0,4 | 1,0 |
Der Wert von 0,36 in der Tabellenzelle Mädchen/im Sportverein ergibt sich z. B. daraus, dass die beiden Randhäufigkeiten für die Tabellenzelle multipliziert wurden: 0,6 × 0,6 = 0,36.
Schritt 3: Chi-Quadrat berechnen
Nun werden die Differenzen zwischen den tatsächlichen und den "theoretischen" (d. h. bei Unabhängigkeit gegebenen) relativen Häufigkeiten gebildet, diese Differenzen quadriert und durch die theoretischen Häufigkeiten geteilt, diese Ergebnisse aufsummiert und mit der Anzahl der Merkmalsträger (hier: 30 Schüler) multipliziert.
Chi-Quadrat χ2 = 30 × { [ (0,3 - 0,36) 2 / 0,36 ] + [ (0,3 - 0,24) 2 / 0,24 ] + [ (0,3 - 0,24) 2 / 0,24 ] + [ (0,1 - 0,16) 2 / 0,16 ] }
= 30 × { [ 0,01 ] + [ 0,015 ] + [ 0,015 ] + [ 0,0225 ] }
= 30 × 0,0625 = 1,875.
Schritt 4: Cramers V berechnen
Cramers V = Quadratwurzel aus { 1,875 / [ 30 × (2 - 1) ] } = Quadratwurzel aus 0,0625 = 0,25.
Dabei ist 1,875 Chi-Quadrat, 30 die Anzahl der Merkmalsträger (30 Schüler) und 2 ist die Anzahl der Spalten bzw. Zeilen der Kreuztabelle.
Cramers V liegt immer in der Bandbreite 0 (kein Zusammenhang) bis 1 (maximaler Zusammenhang), der berechnete Wert von 0,25 bedeutet, dass zwischen den beiden Merkmalen nur ein geringer statistischer Zusammenhang besteht.
Ein maximaler Zusammenhang mit Cramers V = 1 würde z. B. bestehen, wenn alle Jungen im Sportverein wären und alle Mädchen nicht.
Anmerkung
I. d. R. wird Cramers V angewandt, wenn eines der Merkmale mehr als 2 Ausprägungen hat und somit eine größere als 2 × 2 - Kreuztabelle besteht (da für 2 × 2 - Tabellen eigene, spezielle Zusammenhangsmaße zur Verfügung stehen, namentlich der Phi-Koeffizient).