Cramers V

Cramers V Definition

Cramers V misst die Stärke des Zusammenhangs zwischen nominalskalierten Merkmalen.

Cramers V wird dabei aus Chi-Quadrat abgeleitet: Chi-Quadrat wird durch das Produkt aus der Anzahl der Merkmalsträger / Messwerte und dem Minimum der Zeilen- und Spaltenzahl der Kreuztabelle abzüglich 1 dividiert, anschließend wird die Quadratwurzel gezogen.

Beispiel

Beispiel: Cramers V berechnen

Bezug nehmend auf das Chi-Quadrat-Beispiel und in Fortführung des Beispiels zur Vierfeldertafel, bei der die Häufigkeiten für 2 nominalskalierte Merkmale – Geschlecht (Merkmal 1) und Mitgliedschaft in einem Sportverein (Merkmal 2) – für die Schüler einer Klasse dargestellt wurden.

Inwiefern besteht nun zwischen Geschlecht und Mitgliedschaft in einem Sportverein ein Zusammenhang?

Die Vierfeldertafel war:

Vierfeldertafel mit absoluten Häufigkeiten
Mädchen Jungen Gesamt
im Sportverein 9 9 18
nicht im Sportverein 9 3 12
Gesamt 18 12 30

Schritt 1: relative Häufigkeiten berechnen

Vierfeldertafel mit relativen Häufigkeiten
Mädchen Jungen Gesamt
im Sportverein 0,3 0,3 0,6
nicht im Sportverein 0,3 0,1 0,4
Gesamt 0,6 0,4 1,0

Z. B. ergibt sich der Wert von 0,3 in der Tabellenzelle Mädchen/im Sportverein daraus, dass 9 von 30 Schülern Mädchen und in einem Sportverein sind, also 9/30 = 0,3; unter "Gesamt" sind jeweils die sog. Randhäufigkeiten eingetragen, die in Summe immer 1 bzw. 100 % ergeben.

Schritt 2: Vierfeldertafel bei Unabhängigkeit berechnen

Anschließend berechnet man, wie die Verteilung sein müsste, wenn es keinen Zusammenhang zwischen den Merkmalen Geschlecht und Mitgliedschaft in einem Sportverein gibt:

Vierfeldertafel für den Fall, dass kein Zusammenhang besteht (Indifferenztabelle)
Mädchen Jungen Gesamt
im Sportverein 0,36 0,24 0,6
nicht im Sportverein 0,24 0,16 0,4
Gesamt 0,6 0,4 1,0

Der Wert von 0,36 in der Tabellenzelle Mädchen/im Sportverein ergibt sich z. B. daraus, dass die beiden Randhäufigkeiten für die Tabellenzelle multipliziert wurden: 0,6 × 0,6 = 0,36.

Schritt 3: Chi-Quadrat berechnen

Nun werden die Differenzen zwischen den tatsächlichen und den "theoretischen" (d. h. bei Unabhängigkeit gegebenen) relativen Häufigkeiten gebildet, diese Differenzen quadriert und durch die theoretischen Häufigkeiten geteilt, diese Ergebnisse aufsummiert und mit der Anzahl der Merkmalsträger (hier: 30 Schüler) multipliziert.

Chi-Quadrat χ2 = 30 × { [ (0,3 - 0,36) 2 / 0,36 ] + [ (0,3 - 0,24) 2 / 0,24 ] + [ (0,3 - 0,24) 2 / 0,24 ] + [ (0,1 - 0,16) 2 / 0,16 ] }

= 30 × { [ 0,01 ] + [ 0,015 ] + [ 0,015 ] + [ 0,0225 ] }

= 30 × 0,0625 = 1,875.

Schritt 4: Cramers V berechnen

Cramers V = Quadratwurzel aus { 1,875 / [ 30 × (2 - 1) ] } = Quadratwurzel aus 0,0625 = 0,25.

Dabei ist 1,875 Chi-Quadrat, 30 die Anzahl der Merkmalsträger (30 Schüler) und 2 ist die Anzahl der Spalten bzw. Zeilen der Kreuztabelle.

Cramers V liegt immer in der Bandbreite 0 (kein Zusammenhang) bis 1 (maximaler Zusammenhang), der berechnete Wert von 0,25 bedeutet, dass zwischen den beiden Merkmalen nur ein geringer statistischer Zusammenhang besteht.

Ein maximaler Zusammenhang mit Cramers V = 1 würde z. B. bestehen, wenn alle Jungen im Sportverein wären und alle Mädchen nicht.

Anmerkung

I. d. R. wird Cramers V angewandt, wenn eines der Merkmale mehr als 2 Ausprägungen hat und somit eine größere als 2 × 2 - Kreuztabelle besteht (da für 2 × 2 - Tabellen eigene, spezielle Zusammenhangsmaße zur Verfügung stehen, namentlich der Phi-Koeffizient).