Ausreißer

Ausreißer Definition

Ausreißer sind Daten, die weit jenseits der anderen Datenwerte liegen.

Für Ausreißer gibt es mehrere Ursachen:

  • es handelt sich um Extremwerte (Beispiel: Jogger werden nach ihrer wöchentlichen Laufleistung in km gefragt: fast alle liegen im Bereich 5 bis 20 km, nur ein Extremsportler gibt 200 km an);
  • es handelt sich um Messfehler (Beispiel: bei einem Schulwettkampf wird für einen Schüler eine Zeit von 9,4 Sekunden beim 100-Meter-Lauf gemessen).

Zum einen ist es wichtig, Ausreißer in einem Datensatz zu entdecken, zum anderen stellt sich die Frage, wie mit ihnen umzugehen ist. So kann man z.B. ein getrimmtes Mittel an Stelle des (durch Ausreißer verzerrten) arithmetischen Mittels verwenden oder einen modifizierten Boxplot erstellen.