Kreuztabelle

Kreuztabelle Definition

In einer Kreuztabelle bzw. Kontingenztabelle können statistische Merkmale bzw. Variablen (i.d.R. nominal- oder ordinalskalierte Merkmale, da man üblicherweise bei metrischen Merkmalen zu viele Ausprägungen hat) mit ihren jeweiligen absoluten Häufigkeiten dargestellt werden. Hiermit lassen sich die gemeinsame Verteilung bzw. die gemeinsamen Häufigkeiten, die Randverteilungen bzw. Randhäufigkeiten und bedingte Verteilungen darstellen und auswerten.

In der Kreuztabelle können die Merkmale jeweils mehrere Merkmalsausprägungen haben (z.B. das Merkmal Farbe mit den 4 Merkmalsausprägungen rot / grün / blau / gelb und Gewicht mit den 3 Merkmalsausprägungen leicht / mittel / schwer); liegen nur 2 Merkmale mit jeweils nur 2 Merkmalsausprägungen vor, handelt es sich um eine sog. Vierfeldertafel (bzw. 2 × 2 - Kontingenztafel).

Alternative Begriffe: bivariate Häufigkeitsverteilung, Kontingenztabelle, Kontingenztafel.

Beispiel

Kontingenztafel Beispiel

Eine Universität erfasst ein Jahr nach dem Abschluss eines BWL-Jahrgangs mittels einer Umfrage unter den 100 Absolventinnen und Absolventen das Geschlecht und in welchen Bereichen sie arbeiten (der Einfachheit halber soll es nur die 3 Bereiche Controlling, Personal und Marketing geben).

Es werden also 2 nominalskalierte Merkmale erfasst: Geschlecht und Fachbereich.

Die gemeinsame Verteilung der beiden Merkmale mit ihren absoluten Häufigkeiten sei in folgender Kreuztabelle zusammengefasst:

Kontingenztafel
Controlling Personal Marketing Gesamt
weiblich 10 30 20 60
männlich 20 10 10 40
Gesamt 30 40 30 100

Die jeweils in der "Gesamt"-Zeile und -Spalte angegebenen Summen sind die sog. Randhäufigkeiten.

Alternativ oder zusätzlich kann auch die gemeinsame Verteilung der beiden Merkmale mit ihren relativen Häufigkeiten dargestellt werden:

Kontingenztafel
Controlling Personal Marketing Gesamt
weiblich 0,10 0,30 0,20 0,60
männlich 0,20 0,10 0,10 0,40
Gesamt 0,30 0,40 0,30 1,00

Bedingte Verteilung

Anhand der Kreuztabelle können sog. bedingte Verteilungen ermittelt werden. Hier wird eine Merkmalsausprägung vorgegeben (z.B. der Fachbereich) und es wird die Verteilung des zweiten Merkmals (weiblich oder männlich) untersucht und dargestellt.

So ist z.B. die bedingte Verteilung für das vorgegebene Merkmal Fachbereich mit der Ausprägung "Controlling": 10 weiblich und 20 männlich bzw. ca. 33 % weiblich (10 von 30 Controllern) und ca. 67 % männlich (20 von 30); es werden also die Werte durch die Randhäufigkeiten geteilt.

Bedingte Verteilung
weiblich männlich Gesamt
Controlling 0,33 0,67 1,00

Es lassen sich somit erste Zusammenhänge erkennen.