Distancias (II): las distancias no son distancias
Una distancia, Wikipedia dixit, sobre un conjunto $latex X$ es una función $latex d$ definida sobre $latex X \times X$ que toma valores en los reales $latex \ge 0$ y que cumple:
- $d(a,b) = 0 \iff a = b$
- $d(a,b) = d(b,a)$
- $d(a,c) \le d(a, b) + d(b, c)$
En la práctica, sin embargo, he encontrado violaciones tanto de (1) como de (2). ¿A alguien se le ocurren ejemplos?
Sin embargo, (3) se mantiene. Sin (3) todo se volvería una locura. De hecho, obtener resultados razonable usando distancias significa particularmente que esas distancias cumplen (3).
[Si alguien no está convencido de que (3) es garantía de cordura, que trate de construir clústers (de puntos en dos dimensiones, sin ir más lejos) usando una métrica $L_p$ con $0 < p < 1$.]