Gauß-Test
Einstichproben-Gauß-Test Definition
Der Einstichproben-Gauß-Test basiert auf der Normalverteilung und hat folgende Voraussetzungen:
- es liegt nur eine Stichprobe vor;
- es liegt eine normalverteilte Zufallsvariable vor; falls es sich nicht um eine normalverteilte Zufallsvariable handelt (oder dies nicht bekannt ist), kann der Gauß-Test bei Stichprobenumfängen von mindestens 30 trotzdem angewandt werden, da dann der zentrale Grenzwertsatz wirkt;
- der Mittelwert bzw. Erwartungswert μ der Grundgesamtheit ist unbekannt;
- die Varianz σ2 (bzw. die Standardabweichung σ) der Grundgesamtheit ist bekannt (man kennt also den Mittelwert der Grundgesamtheit nicht, aber die Varianz schon — das ist etwas unrealistisch); sind sie nicht bekannt, kann der t-Test angewandt werden.
Mit dem Gauß-Test kann dann getestet werden, ob ein vorgegebener Erwartungswert μ0 (z.B. 1,00 Liter Füllmenge) "passt" bzw. eingehalten wird.
Der Test kann einseitig (z.B. mindestens ein Liter Bier in der Maß) oder zweiseitig (weder zu viel noch zu wenig Bier in der Maß) gestaltet werden.
Die Teststatistik des Gauß-Tests ist
$$z = \frac{(\bar x - \mu_0)}{\sigma_\bar x}$$
Dabei ist
- $\bar x$ das arithmetische Mittel der Stichprobe
- $\mu_0$ der Erwartungswert bzw. das arithmetische Mittel der Grundgesamtheit
- $\sigma_\bar x$ der Standardfehler (Standardabweichung geteilt durch die Wurzel des Stichprobenumfangs).
Alternative Begriffe: z-Test.
Beispiel
Beispiel: Gauß-Test für eine Stichprobe
In einer Fabrik werden auf einer Maschine Schrauben mit einer Länge von 10 cm produziert; die Schrauben sollten weder zu kurz noch zu lang sein, sondern möglichst genau passen (zweiseitiges Testproblem).
Man weiß aus Erfahrung, dass die Länge der Schrauben auf dieser Maschine normalverteilt ist, mit einer Varianz von 0,25 cm2 bzw. einer Standardabweichung von 0,5 cm (√0,25 cm2).
Aus der Tagesproduktion wird eine Stichprobe von 36 Schrauben gezogen und gemessen, als arithmetischer Mittelwert der Länge ergibt sich aus dieser Stichprobe ein Wert von 9,7 cm.
Handelt es sich um eine zufällige Abweichung oder stimmt etwas mit der Maschine nicht (und diese muss neu eingestellt werden)?
Hypothesen formulieren
Nullhypothese H0: μ = 10 cm (Mittelwert ist 10 cm)
Alternativhypothese H1: μ ≠ 10 cm.
Signifikanzniveau festlegen
Als Signifikanzniveau α werden 0,05 festgelegt.
Teststatistik berechnen
Die Teststatistik ist:
$$z = \frac{(9,7 - 10,0)}{\frac{0,5}{\sqrt 36}} = \frac{-0,3}{\frac{0,5}{6}} = -3,6.$$
Annahme- und Ablehnungsbereich bestimmen
Der kritische Bereich, bei dem die Nullhypothese abgelehnt wird, ist dann bei dem gewählten Signifikanzniveau von 0,05 bei einem zweiseitigen Test (z für die Werte der Standardnormalverteilung, die aus der Tabelle der Standardnormalverteilung abgelesen werden können):
(-∞, -z1-α/2) und (z1-α/2, ∞) = (-∞, -z0,975) und (z0,975, ∞), das entspricht (-∞, -1,96) und (1,96, ∞).
Der Annahmebereich ist dann zwischen -1,96 und +1,96.
Testentscheidung treffen
Der Wert der Teststatistik -3,6 liegt im linken Ablehnungsbereich (kleiner als -1,96), die Nullhypothese wird deshalb verworfen (die Maschine sollte neu eingestellt werden).
p-Wert berechnen
Alternativ oder zusätzlich kann auch der p-Wert berechnet werden:
Der Wert für -3,6 kann aufgrund der Symmetrie der Normalverteilung aus dem Wert für 3,6 in der Standardnormalverteilungstabelle abgeleitet werden: 1- 0,999841 = 0,000159.
Der p-Wert ist dann 0,000159 × 2 = 0,000318.
Der Multiplikation mit 2 erfolgt hier, weil ein zweiseitiger Test vorliegt und somit der linke und rechte kritische Bereich berücksichtigt werden muss.
Da der p-Wert mit 0,000318 (weit) unter dem Signifikanzniveau von 0,05 liegt, wird die Nullhypothese auch nach der "p-Wert-Methode" abgelehnt.