Vierfeldertafel

Vierfeldertafel Definition

Die Vierfeldertafel als vereinfachte Kontingenztafel bzw. Kreuztabelle stellt in der Statistik Zusammenhänge zwischen zwei Variablen / Merkmalen mit jeweils 2 Ausprägungen (sog. binäre bzw. dichotome Merkmale) dar und kann dazu benutzt werden, bedingte Wahrscheinlichkeiten darzustellen und zu berechnen.

Alternative Begriffe: 4-Felder-Tafel, Vier-Felder-Tafel.

Beispiel

Vierfeldertafel Beispiel

In einer Grundschulklasse mit 30 Schülern sind 18 Mädchen und 12 Jungen. Von den Mädchen sind 9 in einem Sportverein (und die anderen 9 nicht), von den Jungen sind ebenfalls 9 in einem Sportverein (und die anderen 3 nicht).

Dies lässt sich in einer Vierfeldertafel so darstellen:

Vierfeldertafel
Mädchen Jungen Gesamt
im Sportverein 9 9 18
nicht im Sportverein 9 3 12
Gesamt 18 12 30

Mit der Vierfeldertafel lassen sich jetzt einfache Wahrscheinlichkeiten (1. Beispiel) bzw. bedingte Wahrscheinlichkeiten (2. Beispiel) berechnen:

Beispiel 1 (einfache Wahrscheinlichkeit)

Wie hoch ist die Wahrscheinlichkeit, dass ein beliebig ausgewählter Schüler (z.B. durch Ziehen eines Namens aus einer Lostrommel mit den 30 Schülernamen) ein Mädchen ist? Die Wahrscheinlichkeit ist Anzahl der Mädchen / Anzahl der Schüler = 18/30 = 3/5 = 60 %.

Beispiel 2 (bedingte Wahrscheinlichkeit)

Wie hoch ist die Wahrscheinlichkeit, dass ein beliebig ausgewählter Schüler, der in einem Sportverein ist, ein Junge ist? Die Wahrscheinlichkeit ist Anzahl der Jungen in einem Sportverein / Anzahl der Schüler in einem Sportverein = 9/18 = 1 /2 = 50 %.

Würde man dieselbe Fragestellung auch noch für Mädchen beantworten (das wären ebenfalls 9/18 = 50 %), dann würden die beiden Wahrscheinlichkeiten die sog. bedingte Verteilung des Geschlechts unter der Bedingung, dass der Schüler im Sportverein ist, darstellen.

Test auf statistische Unabhängigkeit

Mit der Vierfeldertafel lässt sich untersuchen, ob die beiden Merkmale – Geschlecht und Sportvereinsmitgliedschaft – statistisch unabhängig sind.

Im Falle statistischer Unabhängigkeit müsste z.B. die Wahrscheinlichkeit für Junge (12/30) multipliziert mit der Wahrscheinlichkeit für Sportvereinsmitgliedschaft (18/30) gleich der Wahrscheinlichkeit für einen Jungen im Sportverein (9/30) sein; 12/30 × 18/30 ist jedoch 216/30 = 7,2 und dies entspricht nicht 9/30 bzw. 0,3 — d.h., die beiden Merkmale sind nicht statistisch unabhängig oder anders ausgedrückt: die Wahrscheinlichkeit bzw. Häufigkeit für eine Mitgliedschaft in einem Sportverein ist (in diesem Beispiel) vom Geschlecht abhängig.