Histogramm

Histogramm Definition

Ein Histogramm wird zur Darstellung der (empirischen) Häufigkeitsverteilung insbesondere von klassierten Daten (Intervallen) verwendet.

Auf der horizontalen x-Achse werden die Merkmalsausprägungen bzw. Klassen gezeigt, auf der vertikalen y-Achse die Häufigkeiten (als absolute Häufigkeiten bzw. Anzahl wie im Beispiel unten oder als relative Häufigkeit in Prozent).

Unterschied zum Säulendiagramm

Im Gegensatz zu einem Säulendiagramm, bei der nur die Säulenhöhe bedeutsam ist, hat im Falle klassierter Daten auch die Breite der Säulen / Rechtecke eine Bedeutung: sie gibt die Klassenbreite an; dadurch spiegelt die Fläche den Anteil der jeweiligen Merkmalsausprägung / Klasse wider.

Die Rechtecke grenzen ohne einen Leerraum aneinander an.

Das Histogramm wird i.d.R. für stetige, metrische Daten verwendet, während das Säulendiagramm für diskrete und ggfs. nur nominale oder ordinale Daten verwendet wird.

Beispiel

Beispiel: Histogramm erstellen

Das folgende Diagramm ist das Histogramm für die Beispieldaten (Jahresgehälter) zur Klassierung; die Intervalle sind hier in T€ angegeben, [20; 30) ist z.B. das rechtsoffene Intervall für Jahresgehälter von 20.000 bis 30.000 €, wobei die 30.000 € nicht mehr eingeschlossen sind (also geht das Intervall bis 29.999,99 €):

Histogramm für Gehaltsklassen

Das Histogramm verschafft so einen guten ersten Überblick über die Verteilung des Merkmals "Jahresgehalt".

So kann man leicht ablesen, dass die meisten Mitarbeiter (4 von insgesamt 10) Jahresgehälter zwischen 30.000 € und 40.000 € beziehen.

Aus dem Histogramm lässt sich auch die Schiefe der Verteilung (hier: eine linksschiefe bzw. rechtssteile Verteilung) ablesen.