Dezil

Dezil Definition

In der beschreibenden Statistik wird eine sortierte Liste bzw. Verteilung teils in Dezile (Zehntel) eingeteilt.

Jedes Dezil enthält dieselbe Anzahl von Daten (z. B. Messwerten); bei einer Liste mit 100 Daten enthält jedes Dezil somit 10 Daten.

Beispiel

In einem Land gibt es nur 100 Menschen. Der erste Mensch hat ein Vermögen von 1 €, der zweite Mensch hat ein Vermögen von 2 €, ..., der hundertste Mensch hat ein Vermögen von 100 €.

Dann könnte man sagen:

Das unterste Dezil – die 10 Ärmsten im Land – haben ein Vermögen von 55 € (1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 € = 55 €) und damit einen Anteil am Gesamtvermögen von ...

Und der Wert des Vermögens in Höhe von 10 € trennt das untere Dezil von den anderen Dezilen. Ein Zehntel der Menschen hat nur ein Vermögen von maximal 10 €.

Das oberste Dezil – die 10 Reichsten im Land – haben ein Vermögen von 955 € (91 + 92 + 93 + 94 + 95 + 96 + 97 + 98 + 99 + 100 € = 955 €) und damit einen Anteil am Gesamtvermögen von ...

Oft werden Dezile verwendet, um derartige Ungleichgewichte in der Verteilung zwischen den jeweils "Untersten" und "Obersten" (auch z. B. beim Einkommen) deutlich zu machen.

Das unterste Dezil wird auch 1. Dezil, das oberste Dezil auch 10. Dezil genannt.

Will man sich entsprechend auf die untersten 30 % beziehen, würde man vom dritten Dezil oder den unteren drei Dezilen sprechen.

Dezile sind spezielle Formen der Quantile, welche die Daten in gleich große Teilmengen unterteilen; neben den Dezilen (Zehntel) gibt es den Median (dieser teilt die Daten hälftig), Quartile (Viertel), Quintile (Fünftel), Terzile (Drittel) und Perzentile (Hundertstel).

Quantil ist also der Oberbegriff, deshalb wird in manchen statistischen Studien das 1. Dezil z. B. auch als 0,1-Quantil bezeichnet oder das 3. Dezil als 0,3-Quantil.

Der Interdezilbereich ist eine Variante der Spannweite bzw. Range (ein Streuungsparameter).

Während die Spannweite die Differenz zwischen der kleinsten und der größten Merkmalsausprägung ist (im Beispiel oben also zwischen 1 € und 100 €) und damit den gesamten Streubereich aller Daten erfasst, berechnet der Interdezilbereich eine modifizierte Spannweite, ohne die Werte des unteren und oberen Dezils zu berücksichtigen. Im Beispiel wäre das der Bereich von 11 € bis einschließlich 90 € mit einer Bandbreite von 80 (das untere Dezil mit den Daten 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 € und das obere Dezil mit den Daten 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 € werden abgeschnitten). In dem Bereich streuen 80 % der Daten.

Den Interdezilbereich verwendet man v. a. bei Datenreihen, die extreme Werte bzw. Ausreißer haben (das ist im obigen Beispiel nicht der Fall), dann spiegelt dieser ggf. besser die Spannweite bzw. Range der Daten wieder als die "ungekürzte" Spannweite.