Konfidenzintervall
Konfidenzintervall Definition
Ein Konfidenzintervall ist ein Intervall / Bereich von Werten, das den gesuchten Parameter einer Grundgesamtheit mit einer vorgegebenen Wahrscheinlichkeit (sog. Konfidenzniveau bzw. Vertrauenswahrscheinlichkeit) enthält.
Eine beispielhafte Aussage (für eine Stichprobe der Wahlforschung) dazu lautet:
Mit einer (Vertrauens-)Wahrscheinlichkeit von 95 % liegt die Wahlbeteiligung (der gesuchte Parameter der Grundgesamtheit der Wahlberechtigten) im Bereich 56 bis 60 % (Konfidenzintervall).
Aus den 95 % ergibt sich im Umkehrschluss eine Irrtumswahrscheinlichkeit von 5 %.
Je höher die Vertrauenswahrscheinlichkeit sein soll (die "Garantie", dass die Werte in dem Bereich liegen), desto länger ist das Vertrauensintervall.
Extrembeispiel: mit 100 % Wahrscheinlichkeit liegt die Wahlbeteiligung zwischen 0 und 100 %.
Die Angabe eines Konfidenzintervalls umfasst also immer 2 Angaben: eine Bandbreite und eine Wahrscheinlichkeit; 95 % als Konfidenzniveau werden oft verwendet, teilweise aber auch 99 %.
Die Berechnung des Konfidenzintervalls hängt dann davon ab, welche Verteilung zugrunde gelegt werden kann (z.B. Normalverteilung, t-Verteilung oder Binomialverteilung).
Alternative Begriffe: confidence interval (englisch; kurz: CI), Vertrauensbereich, Vertrauensintervall.
Hintergrund
Man kann nicht sicher aus einer Stichprobe auf die Grundgesamtheit schließen. Befragt man z.B. in einer Stichprobe 100 Wahlberechtigte, ob sie wählen werden oder nicht, bejahen vielleicht 60 die Frage (60 %); befragt man nun in einer zweiten Stichprobe weitere 100 Personen, bejahen die Frage vielleicht nur 54 Personen (54 %); in einer dritten Stichprobe könnte es wieder anders aussehen.
Ein genaue Prognose des Parameters (hier: der Wahlbeteiligung) in Form einer Punktschätzung (z.B. 58 %) stimmt mit hoher Wahrscheinlichkeit nicht mit dem echten Parameter überein. Durch statistische Analysen kann aber ein Konfidenzintervall berechnet und damit auf Kosten der Genauigkeit die Prognosesicherheit erhöht werden.
Beispiel
Beispiel: Konfidenzintervall für Normalverteilung berechnen
Für eine Stichprobe von 10 Männern wurde die Körpergröße gemessen; der arithmetische Mittelwert der Stichprobe sei 1,80 m; die Standardabweichung sei 0,1 m.
Konfidenzintervall berechnen
Das 95 % - Konfidenzintervall KI berechnet sich wie folgt:
$$KI = 1,80 \, m + 1,96 \cdot \frac{0,1 \, m}{\sqrt 10}$$
$$= 1,80 \, m + 1,96 \cdot 0,03162 \, m$$
$$= 1,80 \, m + 0,062 \, m$$
Dabei ist 0,062 die sog. Fehlermarge (margin of error).
Das Konfidenzintervall reicht von 1,738 m bis 1,862 m.
Dabei ist 1,96 der z-Wert in der Tabelle der Standardnormalverteilung, der die Werte bis 0,975002 enthält; d.h. nur 0,025 bzw. 2,5 % der Werte liegen rechts davon und da die Normalverteilung symmetrisch ist, gilt das auch für linke Seite.
Die entsprechenden Werte für das 90 % Konfidenzniveau sind 1,645 und für das 99 % Konfidenzniveau 2,576.
Konfidenzintervall und Stichprobenumfang
Man kann an der Formel leicht erkennen, wie die Fehlermarge reduziert und damit das Konfidenzintervall enger gestaltet werden kann; die Fehlermarge hängt ab
- von der Variabilität der Daten (gegeben, nicht beeinflussbar);
- vom Stichprobenumfang: wird der Stichprobenumfang vervierfacht (z.B. von 10 auf 40), reduziert sich die Fehlermarge auf die Hälfte (im Beispiel auf 1,96 × 0,1/√40 = 0,031);
- von dem Sicherheitsniveau; wählt mann 99 % statt 95 %, wird mit 2,576 (z-Wert für 0,995) statt 1,96 multipliziert; die Fehlermarge erhöht sich dadurch, das Konfidenzintervall verbreitert sich.