stringtranslate.com

Descenso del espejo

En matemáticas, el descenso de espejo es un algoritmo de optimización iterativo para encontrar un mínimo local de una función diferenciable .

Generaliza algoritmos como el descenso de gradiente y los pesos multiplicativos .

Historia

El descenso por espejo fue propuesto originalmente por Nemirovski y Yudin en 1983. [1]

Motivación

En el descenso de gradiente con la secuencia de tasas de aprendizaje aplicadas a una función diferenciable , se comienza con una estimación de un mínimo local de y se considera la secuencia tal que

Esto se puede reformular señalando que

En otras palabras, minimiza la aproximación de primer orden a at con el término de proximidad agregado .

Este término de distancia euclidiana al cuadrado es un ejemplo particular de una distancia de Bregman . El uso de otras distancias de Bregman dará como resultado otros algoritmos como Hedge , que pueden ser más adecuados para la optimización en geometrías particulares. [2] [3]

Formulación

Se nos da una función convexa para optimizar sobre un conjunto convexo , y se nos da una norma en .

También se nos da una función convexa diferenciable , fuertemente convexa con respecto a la norma dada. Esta se llama función generadora de distancia y su gradiente se conoce como mapa especular .

A partir del valor inicial , en cada iteración de Mirror Descent:

Extensiones

El descenso de espejo en el entorno de optimización en línea se conoce como Descenso de Espejo en Línea (OMD). [4]

Véase también

Referencias

  1. ^ Arkadi Nemirovsky y David Yudin. Complejidad de problemas y eficiencia de métodos en optimización. John Wiley & Sons, 1983
  2. ^ Nemirovski, Arkadi (2012) Tutorial: algoritmos de descenso de espejo para optimización convexa determinista y estocástica a gran escala. https://www2.isye.gatech.edu/~nemirovs/COLT2012Tut.pdf
  3. ^ "Algoritmo de descenso de espejo". tlienart.github.io . Consultado el 10 de julio de 2022 .
  4. ^ Fang, Huang; Harvey, Nicholas JA; Portella, Victor S.; Friedlander, Michael P. (3 de septiembre de 2021). "Descenso de espejo en línea y promedio dual: manteniendo el ritmo en el caso dinámico". arXiv : 2006.02585 [cs.LG].