Mean shift

Se da la siguiente función kernel

Normalmente se utiliza un kernel gaussiano sobre la distancia a la estimación actual,

La media ponderada de la densidad en la ventana determinada por

se denomina mean shift en Fukunaga y Hostetler.

[3]​ El algoritmo de mean shift establece ahora

y repite la estimación hasta que

Aunque el algoritmo de desplazamiento de la media se ha utilizado ampliamente en muchas aplicaciones, todavía no se conoce una prueba rígida de la convergencia del algoritmo utilizando un núcleo general en un espacio de alta dimensión.

[6]​ Sin embargo, el caso unidimensional tiene aplicaciones limitadas en el mundo real.

También se ha demostrado la convergencia del algoritmo en dimensiones superiores con un número finito de puntos estacionarios (o aislados),[5]​[7]​ pero no se han proporcionado las condiciones suficientes para que una función de núcleo general tenga puntos estacionarios (o aislados) finitos.

El mean shift gaussiano es un algoritmo esperanza-maximización.

incrustado en el espacio euclidiano de dimensión

un núcleo plano que es la función característica de la bola 𝜆 en

Uno de los enfoques más sencillos consiste en suavizar los datos, por ejemplo, convolviéndolos con un núcleo fijo de anchura

son las muestras de entrada y

es la función kernel (o ventana de Parzen).

es el único parámetro del algoritmo y se denomina ancho de banda.

de la ecuación anterior, podemos encontrar sus máximos locales utilizando el ascenso gradiente o alguna otra técnica de optimización.

Empezando con una estimación de un máximo local,

y da un paso cuesta arriba en esa dirección.

[9]​ La definición de kernel dice: Dejar que

se dice que es un núcleo si existe un perfil,

[10]​ Consideremos un conjunto de puntos en un espacio bidimensional.

El desplazamiento medio es un algoritmo de escalada que consiste en desplazar este núcleo de forma iterativa a una región de mayor densidad hasta la convergencia.

El vector de desplazamiento medio siempre apunta hacia la dirección del aumento máximo de la densidad.

En cada iteración, el núcleo se desplaza hacia el centroide o la media de los puntos que lo componen.

En este caso, si se elige un núcleo gaussiano en lugar de un núcleo plano, se asignará primero a cada punto un peso que decaerá exponencialmente a medida que aumente la distancia al centro del núcleo.

En el momento de la convergencia, no habrá ninguna dirección en la que un desplazamiento pueda acomodar más puntos dentro del núcleo.

El algoritmo de desplazamiento medio puede utilizarse para el seguimiento visual.

Algunos algoritmos, como el seguimiento de objetos basado en kernel,[11]​ el seguimiento de conjuntos,[12]​CAMshift[13]​[14]​ amplían esta idea.

Para cada píxel, Se pueden encontrar variantes del algoritmo en paquetes de aprendizaje automático y procesamiento de imágenes: