Kreuztabelle
Kreuztabelle Definition
In einer Kreuztabelle bzw. Kontingenztabelle können statistische Merkmale bzw. Variablen (in der Regel nominal- oder ordinalskalierte Merkmale, da man üblicherweise bei metrischen Merkmalen zu viele Ausprägungen hat) mit ihren jeweiligen absoluten Häufigkeiten dargestellt werden.
Hiermit lassen sich die gemeinsame Verteilung bzw. die gemeinsamen Häufigkeiten, die Randverteilungen bzw. Randhäufigkeiten und bedingte Verteilungen darstellen und auswerten.
In der Kreuztabelle können die Merkmale jeweils mehrere Merkmalsausprägungen haben (zum Beispiel das Merkmal Farbe mit den 4 Merkmalsausprägungen rot / grün / blau / gelb und Gewicht mit den 3 Merkmalsausprägungen leicht / mittel / schwer); liegen nur 2 Merkmale mit jeweils nur 2 Merkmalsausprägungen vor, handelt es sich um eine Vierfeldertafel (bzw. 2 × 2 - Kontingenztafel).
Alternative Begriffe: Bivariate Häufigkeitsverteilung, Kontingenztabelle, Kontingenztafel, Mehrfeldertafel.
Beispiel
Kontingenztafel Beispiel
Eine Universität erfasst ein Jahr nach dem Abschluss eines BWL-Jahrgangs mittels einer Umfrage unter den 100 Absolventinnen und Absolventen das Geschlecht und in welchen Bereichen sie arbeiten (der Einfachheit halber soll es nur die 3 Bereiche Controlling, Personal und Marketing geben).
Es werden also 2 nominalskalierte Merkmale erfasst: Geschlecht und Fachbereich.
Gemeinsame Verteilung
Die gemeinsame Verteilung der beiden Merkmale mit ihren absoluten Häufigkeiten sei in folgender Kreuztabelle zusammengefasst:
Controlling | Personal | Marketing | Gesamt | |
---|---|---|---|---|
weiblich | 10 | 30 | 20 | 60 |
männlich | 20 | 10 | 10 | 40 |
Gesamt | 30 | 40 | 30 | 100 |
Die jeweils in der "Gesamt"-Zeile und -Spalte angegebenen Summen sind die sogenannten Randhäufigkeiten.
Alternativ oder zusätzlich kann auch die gemeinsame Verteilung der beiden Merkmale mit ihren relativen Häufigkeiten dargestellt werden:
Controlling | Personal | Marketing | Gesamt | |
---|---|---|---|---|
weiblich | 0,10 | 0,30 | 0,20 | 0,60 |
männlich | 0,20 | 0,10 | 0,10 | 0,40 |
Gesamt | 0,30 | 0,40 | 0,30 | 1,00 |
Bedingte Verteilung
Anhand der Kreuztabelle können bedingte Verteilungen ermittelt werden.
Hier wird eine Merkmalsausprägung vorgegeben (zum Beispiel der Fachbereich) und es wird die Verteilung des zweiten Merkmals (weiblich oder männlich) untersucht und dargestellt.
So ist beispielsweise die bedingte Verteilung für das vorgegebene Merkmal Fachbereich mit der Ausprägung "Controlling": 10 weiblich und 20 männlich bzw. ca. 33 % weiblich (10 von 30 Controllern) und ca. 67 % männlich (20 von 30); es werden also die Werte durch die Randhäufigkeiten geteilt.
weiblich | männlich | Gesamt | |
---|---|---|---|
Controlling | 0,33 | 0,67 | 1,00 |
Es lassen sich somit erste Zusammenhänge erkennen.