Ausreißer

Ausreißer Definition

Ausreißer sind Daten, die weit jenseits der anderen Datenwerte liegen.

Ursachen

Für Ausreißer gibt es mehrere Ursachen:

  • es handelt sich um Extremwerte (Beispiel: Jogger werden nach ihrer wöchentlichen Laufleistung in km gefragt: fast alle liegen im Bereich 5 bis 20 km, nur ein Extremsportler gibt 200 km an);
  • es handelt sich um Messfehler (Beispiel: bei einem Schulwettkampf wird für einen Schüler eine Zeit von 9,4 Sekunden beim 100-Meter-Lauf gemessen).

Konsequenzen

Zum einen ist es wichtig, Ausreißer in einem Datensatz zu entdecken; zum anderen stellt sich die Frage, welche statistischen Kennzahlen durch Ausreißer beeinflusst werden und wie mit ihnen umzugehen ist.

Ausreißer beeinflussen etwa die Varianz, Standardabweichung, Spannweite und den arithmetischen Mittelwert einer Datenreihe.

Nicht von Ausreißern beeinflusst hingegen werden Median und Interquartilsabstand.

Abhilfe

So kann man zum Beispiel bei Vorliegen von Ausreißern

  • ein getrimmtes Mittel an Stelle des (durch Ausreißer verzerrten) arithmetischen Mittels verwenden (beim getrimmten Mittel werden beispielsweise 5 % oder 10 % der niedrigsten und der höchsten Werte außer acht gelassen); oder
  • einen modifizierten Boxplot erstellen (Ausreißer werden nicht in den Boxplot einbezogen, jedoch separat gekennzeichnet).

Hinweis für Leser

Die Leser einer Studie oder Ähnlichem sollte man darauf hinweisen, ob es Ausreißer gab bzw. wie man mit ihnen umgegangen ist; die Daten schweigend unter den Tisch fallen zu lassen („Stören meine Auswertung, lasse ich einfach weg …“) ist keine Option.

Alternative Begriffe: Statistische Ausreißer.