Korrelation

Korrelation Definition

Korrelation in der Statistik ist der Zusammenhang zweier (bivariate Korrelation) oder mehrerer (multiple Korrelation) statistischer Merkmale bzw. Variablen.

2 Fragen

Dieser Zusammenhang wird im Rahmen der Korrelationsanalyse bzw. Korrelationsrechnung mit 2 Fragen untersucht:

  • Gibt es einen Zusammenhang – und welche Richtung hat dieser Zusammenhang?: positiv (z. B. mehr Einkommen – mehr Konsum) oder negativ (z. B. mehr Sport – weniger Körpergewicht), wobei "negativ" keine Wertung ist, sondern bedeutet, dass die beiden Variablen in entgegengesetzte Richtungen laufen. Dies kann man ggfs. bereits in einem Streudiagramm erkennen.
  • Wie stark ist dieser Zusammenhang? Das misst man mit Korrelationskoeffizienten.

Verschiedene Korrelationskoeffizienten je nach Skalenniveau

Je nachdem, ob man ordinalskalierte (also Rangreihen wie 1. 2. oder 3. Platz beim Eiskunstlauf) oder metrische Merkmale (wie Kilogramm oder Meter) vorliegen hat, verwendet man unterschiedliche Korrelationskoeffizienten, um die Stärke eines Zusammenhangs zu messen.

Für nominale Daten wie "Ja" / "Nein" bei Umfragen oder Autofarben (silber, schwarz, rot ...), mit denen man "nicht rechnen kann", gibt es eigene Maße, sogenannte Kontingenz- bzw. Assoziationsmaße.

Gibt es einen Zusammenhang zwischen Merkmalen, sagt man, die Merkmale korrelieren bzw. sind korreliert; die berechneten Korrelationswerte bringt man häufig auf den Punkt, indem man sagt "korrelieren stark" oder "korrelieren schwach" oder "weisen eine mittlere Korrelation auf".

Korrelation vs. Kausalität

Liegt eine Korrelation vor, bedeutet dies jedoch nicht zwingend, dass auch ein kausaler Zusammenhang vorliegt (d. h., dass ein Merkmal die Ursache für das andere Merkmal ist), es kann sich auch um eine Scheinkorrelation handeln.

Beispiel

Zwischen Prüfungsergebnissen und Lernzeit kann man i. d. R. einen Zusammenhang bzw. eine Korrelation feststellen. Die Anzahl der Lernstunden korreliert positiv mit den Prüfungsergebnissen (je mehr bzw. länger gelernt wird, desto besser sind die Ergebnisse). Der Nachweis / Beweis, dass die Anzahl der Lernstunden ursächlich für den Erfolg ist, ist aber schwierig (da sich viele andere Faktoren auswirken können: wie man lernt, wann man lernt, welches Vorwissen man hat etc.).

Bei anderen Korrelationen – z. B. zwischen der Geschwindigkeit eines PKW und seinem Benzinverbrauch – lässt sich auch ein kausaler (physikalischer) Zusammenhang ermitteln und nachweisen. Die Feststellung einer Korrelation ist der erste Schritt, eine etwaige Beweisführung dann der zweite.