Manhattan-Metrik

Manhattan-Metrik Definition

Die Manhattan-Metrik ist ein Proximitätsmaß, das heißt, ein Maß für die Nähe bzw. Distanz / Entfernung für metrische Variablen wie etwa die Körpergröße, das Alter oder das Gewicht.

Die Manhattan-Metrik misst Distanzen als rechtwinklige Entfernungen; wie wenn man ein Straßensystem abläuft oder als Taxi abfährt (deshalb auch City-Block-Metrik genannt).

Im Gegensatz dazu misst die euklidische Distanz die direkte, kürzeste, diagonale Distanz ("Luftlinie" per Flugzeug, Hubschrauber).

Anwendung

Es geht dabei in der Regel nicht darum, echte Distanzen oder Wege zu messen, sondern Abstände von Variablen, zum Beispiel in Stichproben oder der Clusteranalyse.

Alternative Begriffe: City-Block-Distanz, Manhattan-Abstand, Manhattan-Distanz.

Beispiel

Beispiel: Manhattan-Distanz berechnen

Wir greifen das Beispiel aus der euklidischen Distanz auf.

Die Manhattan-Distanz d zwischen 2 Vektoren a und b ist:

$$d(a, b) = \sum_{i = 1}^n \vert a_i - b_i \vert$$

Die beiden Vektoren a und b seien:

$$a = \begin{pmatrix} 3 \\ 4 \end{pmatrix}, b = \begin{pmatrix} 0 \\ 6 \end{pmatrix}$$

Dabei bilden die Vektoren a und b Datenpaare ab, beispielsweise für zwei Haushalte die Anzahl der Autos und die Anzahl der Menschen im Haushalt.

Haushalt a hat 3 Autos und 4 Haushaltsangehörige und Haushalt b hat 0 Autos und 6 Haushaltsangehörige.

Die Manhattan-Distanz wird als Abstands- bzw. Ähnlichkeitsmaß verwendet, um zum messen, wie ähnlich oder unähnlich diese Datenpunkte – bzw. hier Haushalte – sind.

Berechnung

$$d(a, b) = \vert (3 - 0) \vert + \vert (4 - 6) \vert = 3 + 2 = 5$$

Der Abstand zwischen den Vektoren / Datenpaaren a und b ist also nach der Manhattan-Metrik 5 (nach der euklidischen Distanz war er 3,6).

Interpretation

Der Manhattan-Abstand ist im Verhältnis zu den Zahlen, um die es geht, groß. Die Unterschiede bei den Haushalten sind aber auch groß: sowohl bei den Autos als auch bei den Haushaltsmitgliedern liegen sie um einiges auseinander.