Klassierung
Klassierung Definition
Hat man viele Daten (z.B. die in einem größeren Unternehmen gezahlten jeweiligen Gehälter der Mitarbeiter oder die Tagestemperaturen eines Jahres), teilt man diese oft der Übersichtlichkeit halber in Klassen bzw. Intervalle ein (analog funktioniert der Notenschlüssel, der angibt, für welche Bereiche von Punkten man eine Note 1, 2, ..., oder 6 erhält).
Die Klasseneinteilung wird dabei oft so geschrieben, um die Grenzen des Intervalls anzugeben: Klasse 3 = [20.000, 30.000); das ist ein sog. rechtsoffenes Intervall, d.h., die 20.000 € sind in das Intervall eingeschlossen, die 30.000 € nicht (mehr), sondern fallen in die nächste Klasse.
Für die klassierten Daten wird dann häufig ein Histogramm erstellt.
Alternative Begriffe: Klasseneinteilung, klassierte Daten.
Beispiel
Beispiel: Daten klassieren
Die Jahresgehälter der 10 Mitarbeiter eines Unternehmens sind (in €): 9.000, 18.000, 21.000, 23.000, 34.000, 36.000, 37.000, 38.000, 40.000, 41.000.
Die Jahresgehälter der Mitarbeiter sollen nun für eine Übersicht in den folgenden 5 Klassen dargestellt werden:
Klasse | Anzahl |
---|---|
Klasse 1: [0; 10.000) | 1 |
Klasse 2: [10.000; 20.000) | 1 |
Klasse 3: [20.000; 30.000) | 2 |
Klasse 4: [30.000; 40.000) | 4 |
Klasse 5: [40.000; 50.000] | 2 |
Die schließende eckige Klammer bei der Klasse 5 bedeutet, dass 50.000 € noch in die Klasse fallen würden.
Die in der 2. Spalte angegebene Anzahl bzw. absolute Häufigkeit wird auch als Klassenhäufigkeit oder Klassenbesetzung bezeichnet.
Die Klassenbreite der Klassen (die Länge der Intervalle) beträgt jeweils 10.000,00 € und die Klassenmitte liegt z.B. für die Klasse 3 bei 25.000 €.
Durch die Klassierung gehen Informationen unter, die Informationsqualität ist geringer (zugunsten der Übersichtlichkeit); so sind zwar 2 Mitarbeiter in der Klasse 5 im Intervall 40.000 bis 50.000 €, aber eben nur knapp.
Auch der Durchschnitt lässt sich nicht mehr exakt berechnen:
Das durchschnittliche Gehalt auf Basis der Einzeldaten ist in T€: (9 + 18 + 21 + 23 + 34 + 36 + 37 + 38 + 40 + 41) / 10 = 29,7 T€ = 29.700 €.
Hat man nur die klassierten Daten zur Verfügung, kann man den Durchschnitt über die jeweiligen Klassenmitten berechnen: (1 × 5.000 € + 1 × 15.000 € + 2 × 25.000 € + 4 × 35.000 € + 2 × 45.000 €) / 10 = 300.000 / 10 = 30.000 € (in dem Fall liegen die Werte noch ganz gut beieinander, die Abweichung ist nur ca. 1 %).