En matemáticas, el descenso de espejo es un algoritmo de optimización iterativo para encontrar un mínimo local de una función diferenciable .
Generaliza algoritmos como el descenso de gradiente y los pesos multiplicativos .
Historia
El descenso por espejo fue propuesto originalmente por Nemirovski y Yudin en 1983. [1]
Motivación
En el descenso de gradiente con la secuencia de tasas de aprendizaje aplicadas a una función diferenciable , se comienza con una estimación de un mínimo local de y se considera la secuencia tal que
Esto se puede reformular señalando que
En otras palabras, minimiza la aproximación de primer orden a at con el término de proximidad agregado .
Este término de distancia euclidiana al cuadrado es un ejemplo particular de una distancia de Bregman . El uso de otras distancias de Bregman dará como resultado otros algoritmos como Hedge , que pueden ser más adecuados para la optimización en geometrías particulares. [2] [3]
Formulación
Se nos da una función convexa para optimizar sobre un conjunto convexo , y se nos da una norma en .
También se nos da una función convexa diferenciable , fuertemente convexa con respecto a la norma dada. Esta se llama función generadora de distancia y su gradiente se conoce como mapa especular .
A partir del valor inicial , en cada iteración de Mirror Descent:
- Mapa del espacio dual:
- Actualización en el espacio dual mediante un paso de gradiente:
- Regrese al espacio primordial:
- Proyecto de regreso a la región factible : , donde es la divergencia de Bregman .
Extensiones
El descenso de espejo en el entorno de optimización en línea se conoce como Descenso de Espejo en Línea (OMD). [4]
Véase también
Referencias
- ^ Arkadi Nemirovsky y David Yudin. Complejidad de problemas y eficiencia de métodos en optimización. John Wiley & Sons, 1983
- ^ Nemirovski, Arkadi (2012) Tutorial: algoritmos de descenso de espejo para optimización convexa determinista y estocástica a gran escala. https://www2.isye.gatech.edu/~nemirovs/COLT2012Tut.pdf
- ^ "Algoritmo de descenso de espejo". tlienart.github.io . Consultado el 10 de julio de 2022 .
- ^ Fang, Huang; Harvey, Nicholas JA; Portella, Victor S.; Friedlander, Michael P. (3 de septiembre de 2021). "Descenso de espejo en línea y promedio dual: manteniendo el ritmo en el caso dinámico". arXiv : 2006.02585 [cs.LG].