Spearman-Korrelation
Spearman-Korrelation Definition
Der Spearman-Korrelationskoeffizient findet Anwendung,
- wenn zumindest eines der zwei Merkmale nur ordinalskaliert (und nicht intervallskaliert) ist oder
- bei metrischen Merkmalen, wenn kein linearer Zusammenhang vermutet wird (bei einem linearen Zusammenhang ist der Pearson-Korrelationskoeffizient geeignet).
Die Werte des Spearman-Koeffizienten liegen innerhalb der Bandbreite -1 bis +1. Ein Koeffizient von -1 (genauer: -1,00) bedeutet eine vollständige, perfekte negative Korrelation. Eine Koeffizient von +1 (genauer: + 1,00) bedeutet eine vollständige, perfekte positive Korrelation.
Alternative Begriffe: Rangkorrelation, Rangkorrelationskoeffizient, Spearman's Rho, Spearman-Rangkorrelation.
Beispiel
Beispiel: Spearman-Korrelation berechnen
Angenommen, man möchte für 3 Unternehmen A, B, und C einer Branche untersuchen, ob zwischen Rentabilität (z.B. anhand der Gesamtkapitalrendite gemessen) und der Mitarbeiterzufriedenheit (z.B. mit Schulnoten in einer Mitarbeiterumfrage erhoben), ein Zusammenhang besteht.
In der folgenden Übersicht sind Rentabilitäten in % sowie die (Mitarbeiterzufriedenheits-) Noten der Unternehmen A, B und C angegeben.
A: 5 % / Note 4
B: 7 %/ Note 1
C: 10 % / Note 2
Nun werden in einem ersten Schritt nicht mehr die Werte, sondern die Ränge für Rentabilität und Note angegeben (die höchste Rentabilität erhält Rang 1, die höchste Note erhält ebenfalls Rang 1), zudem werden die Rangdifferenzen sowie die quadrierten Rangdifferenzen berechnet:
Rang bzgl. Rentabilität | Rang bzgl. Note | Rang-differenz | Quadrierte Rangdifferenz | |
---|---|---|---|---|
Unternehmen A | 3 | 3 | 0 | 0 |
Unternehmen B | 2 | 1 | 1 | 1 |
Unternehmen C | 1 | 2 | -1 | 1 |
Summe der quadrierten Rangdifferenzen | 2 |
Korrelationskoeffizient berechnen
Der Korrelationskoeffizient nach Spearman berechnet sich mit folgender Formel:
1 - (6 × ∑ Quadrierte Rangdifferenzen) / [n × (n2 - 1)].
mit n als Anzahl der Merkmalsträger, die 6 ist fester Bestandteil der Formel.
1 - (6 × 2) / [3 × (32 - 1)] = 1 - [12 / (3 × 8)] = 1 - 12/24 = 1 - 0,5 = 0,5.
Dabei ist 3 die Anzahl der Unternehmen (allgemein: der untersuchten Objekte) und 2 ist die Summe der quadrierten Rangdifferenzen.
Der Zusammenhang mit dem Korrelationskoeffizienten nach Spearman gemessen liegt mit 0,5 relativ im Mittelfeld. Dieses Gefühl hat man auch, wenn man die Tabelle betrachtet: das rentabelste Unternehmen (C mit 10 %) hat "nur" die Note 2, während das mittelmäßig rentable Unternehmen B die Note 1 hat. Unternehmen A hat schlechte Noten und ist am wenigsten rentabel; insofern besteht ein Zusammenhang, der aber nicht stark ausgeprägt ist.