Multinomialverteilung

Multinomialverteilung Definition

Während bei der Binomialverteilung bzw. Bernoulli-Kette das Zufallsexperiment lediglich 2 mögliche Ergebnisse hatte (z.B. Kopf oder Zahl bei einem Münzwurf), hat die Multinomialverteilung mehrere mögliche Ausgänge, deren Anzahl mit k bezeichnet werden kann (z.B. ein Würfel mit k = 6 möglichen Augenzahlen; die Ergebnisse müssen aber nicht gleichwahrscheinlich sein).

Insofern ist die Binomialverteilung ein Spezialfall der Multinomialverteilung mit k = 2.

Alternative Begriffe: multinomial distribution.

Beispiel

Beispiel Multinomialverteilung

Angenommen, 70 % der Bevölkerung hat dunkle Haare (braun oder schwarz), 20 % blonde Haare und 10 % rote Haare. Das Merkmal Haarfarbe hat also 3 mögliche Ausprägungen, die Binomialverteilung ist deshalb nicht mehr geeignet, es kann aber die Multinomialverteilung verwendet werden.

Wie hoch ist die Wahrscheinlichkeit, dass in einer Zufallsstichprobe von 10 Menschen 7 dunkle Haare, 2 blonde Haare und ein Mensch rote Haare hat (was ja der Verteilung in der Bevölkerung entsprechen würde)?

P (X1 = 7, X2 = 2, X3 = 1) = [10! / (7! × 2! × 1!)] × 0,77 × 0,22 × 0,11 = 360 × 0,000329417 = 0,11859 = ca. 11,86 %.

Dabei steht P für Wahrscheinlichkeit (Probability), X1 = 7 bedeutet: die Zufallsvariable nimmt 7 mal die Ausprägung "dunkle Haare" an, 10! steht für 10 Fakultät; der erste Teil der Formel – 10! / (7! × 2! × 1!) – ist der sog. Multinomialkoeffizient, der die Anzahl der Möglichkeiten angibt, wie die Menschen mit ihren Haarfarben "angeordnet" sein können (z.B. kann der rothaarige Mensch der 1. Mensch in der Zufallsstichprobe sein, aber auch der 2., der 3. u.s.w.).

Das Ergebnis von 11,86 % überrascht: die Wahrscheinlichkeit, dass die Stichprobe genau die Verteilung der Haarfarbe in der Grundgesamtheit widerspiegelt, ist hier ziemlich gering.

Noch geringer sind aber Wahrscheinlichkeiten für andere Konstellationen:

Wie hoch ist die Wahrscheinlichkeit, dass in einer Zufallsstichprobe von 10 Menschen 5 dunkle Haare und 5 blonde Haare haben (und niemand rote Haare)?

P (X1 = 5, X2 = 5, X3 = 0) = [10! / (5! × 5! × 0!)] × 0,75 × 0,25 × 0,10 = 252 × 0,000053782 = 0,013553 = ca. 1,35 %.

Es gibt einfach sehr viele Möglichkeiten, welche Häufigkeiten der jeweiligen Haarfarbe in der Stichprobe enthalten sein können; deshalb sind die Wahrscheinlichkeiten für einzelne bestimmte Konstellationen eher gering.