Valor atípico local

En la detección de anomalías, el valor atípico local (en inglés, local outlier factor, LOF) es un algoritmo propuesto por Markus M. Breunig, Hans-Peter Kriegel, Raymond T. Ng y Jörg Sander en 2000 para encontrar puntos de datos anómalos midiendo la desviación local de un punto de datos dado con respecto a sus vecinos.

Denotamos el conjunto de k vecinos más próximos como Nk(A).

Con puntos duplicados, este valor puede llegar a ser infinito.

LOF(k) ~ 1 significa densidad similar a la de los vecinos, LOF(k) < 1 significa Mayor densidad que los vecinos (valor típico), LOF(k) > 1 significa menor densidad que los vecinos (valor atípico).

Por ejemplo, un punto a una distancia "pequeña" de un conglomerado muy denso es un valor atípico, mientras que un punto dentro de un conglomerado disperso podría mostrar distancias similares a sus vecinos.

[4]​ Los valores resultantes son cocientes y difíciles de interpretar.

Idea básica del LOF: comparar la densidad local de un punto con las densidades de sus vecinos. A tiene una densidad mucho menor que sus vecinos.
Ilustración de la distancia de alcanzabilidad. Los objetos B y C tienen la misma distancia de alcanzabilidad ( k=3 ), mientras que D no es un vecino más cercano k
Puntuaciones LOF visualizadas por ELKI . Aunque el clúster superior derecho tiene una densidad comparable a la de los valores atípicos cercanos al clúster inferior izquierdo, éstos se detectan correctamente.