Euklidische Distanz
Euklidische Distanz Definition
Die euklidische Distanz zwischen zwei Vektoren a und b erhält man, indem man die Differenz zwischen den beiden Vektoren bildet und anschließend deren Länge bzw. euklidische Norm berechnet.
Alternative Begriffe: Abstand zwischen zwei Punkten, Abstand zwischen zwei Vektoren, Euklidischer Abstand.
Beispiel
Beispiel: Euklidische Distanz berechnen
Die Euklidische Distanz d zwischen 2 Vektoren a und b ist:
$$d(a, b) = \vert a - b \vert$$
Mit ein paar Zahlen: die beiden Vektoren a und b seien:
$$a = \begin{pmatrix} 3 \\ 4 \end{pmatrix}, b = \begin{pmatrix} 0 \\ 6 \end{pmatrix}$$
Die Differenz der Vektoren:
$$a - b = \begin{pmatrix} 3 \\ 4 \end{pmatrix} - \begin{pmatrix} 0 \\ 6 \end{pmatrix} = \begin{pmatrix} 3 \\ -2 \end{pmatrix}$$
Der Betrag / die Länge / die euklidische Norm der Differenz der Vektoren a und b:
$$\vert a - b \vert = \sqrt{3^2 + (-2)^2}$$
$$= \sqrt{9 + 4} = \sqrt{13} = 3,61$$
Die Euklidische Distanz ist 3,61.
Die Euklidische Distanz wird aber nicht nur für Vektoren berechnet, sondern auch zum Beispiel für den Abstand zweier Punkte (Geometrie).
Wenn man die obigen Vektoren a und b als Punkte (3, 4) und (0, 6) in ein Koordinatensystem (mit cm als Einheiten) einträgt, ist der Abstand zwischen den beiden Punkten 3,61 cm. Das ist einfach die direkte, kürzeste Distanz zwischen den Punkten ("Luftlinie" per Flugzeug, Hubschrauber im größeren Maßstab).
Euklidische Abstände als Abstands- bzw. Ähnlichkeitsmaße
Euklidische Abstände werden unter anderem als Abstands- bzw. Ähnlichkeitsmaße verwendet, um zum messen, wie ähnlich oder unähnlich Datenpunkte sind.
Das entspricht der Vorgehensweise, wie man bei einfachen Daten wie beispielsweise nur dem Alter vorgeht. Hier bildet man natürlich einfach die Differenz, zum Beispiel bei einem Ehepaar: 57 Jahre - 45 Jahre = 12 Jahre und kann daraus ablesen, welchen Abstand die Alter haben bzw. wie ähnlich sich die Alter sind.
Wenn man mehrere Daten wie zum Beispiel das Alter und die Körpergröße hat, ist das eben komplexer und der euklidische Abstand ist eine Möglichkeit, den Abstand bzw. die Ähnlichkeit zu messen (es gibt auch andere). Man misst dann in gewisser Weise, wie weit Ehepaare bzgl. Alter und Körpergröße auseinanderliegen. Identische Datenpaare für Alter und Körpergröße hätten natürlich eine euklidische Distanz von 0.
Datenpunkte mit geringem Abstand kann man in Clustern zusammenfassen und damit klassifizieren und diese Cluster von anderen Clustern abgrenzen (für das Beispiel mit Alter und Körpergröße macht das aber wohl keinen Sinn; eher für Datenpaare wie Einkommen und Größe der Wohnfläche oder Alter und Schlafdauer).