stringtranslate.com

Método del gradiente proximal

Los métodos de gradiente proximal son una forma generalizada de proyección utilizada para resolver problemas de optimización convexa no diferenciables .

Una comparación entre las iteraciones del método de gradiente proyectado (en rojo) y el método de Frank-Wolfe (en verde).

Muchos problemas interesantes pueden formularse como problemas de optimización convexa de la forma

donde son posibles funciones convexas no diferenciables . La falta de diferenciabilidad descarta las técnicas de optimización suave convencionales como el método de descenso más pronunciado y el método de gradiente conjugado , pero se pueden utilizar en su lugar métodos de gradiente proximal.

Los métodos de gradiente proximal comienzan con un paso de división, en el que las funciones se utilizan individualmente para producir un algoritmo fácilmente implementable. Se denominan proximales porque cada función no diferenciable entre ellas está involucrada a través de su operador de proximidad . Algoritmo de umbralización de contracción iterativa, [1] Landweber proyectado , gradiente proyectado, proyecciones alternadas , método de multiplicadores de dirección alternada , Bregman de división alternada son instancias especiales de algoritmos proximales. [2]

Para conocer la teoría de los métodos de gradiente proximal desde la perspectiva de la teoría del aprendizaje estadístico y con aplicaciones en ella , consulte métodos de gradiente proximal para el aprendizaje .

Proyección sobre conjuntos convexos (POCS)

Uno de los algoritmos de optimización convexa más utilizados es el de proyecciones sobre conjuntos convexos (POCS). Este algoritmo se emplea para recuperar/sintetizar una señal que satisface simultáneamente varias restricciones convexas. Sea la función indicadora de un conjunto convexo cerrado no vacío que modela una restricción. Esto se reduce al problema de viabilidad convexa, que requiere que encontremos una solución que se encuentre en la intersección de todos los conjuntos convexos . En el método POCS, cada conjunto se incorpora mediante su operador de proyección . Por lo tanto, en cada iteración se actualiza como

Sin embargo, más allá de estos problemas, los operadores de proyección no son apropiados y se requieren operadores más generales para abordarlos. Entre las diversas generalizaciones de la noción de operador de proyección convexo que existen, los operadores proximales son los más adecuados para otros fines.

Ejemplos

Ejemplos especiales de métodos de gradiente proximal son

Véase también

Notas

  1. ^ Daubechies, I; Defrise, M; De Mol, C (2004). "Un algoritmo de umbralización iterativo para problemas inversos lineales con una restricción de escasez". Communications on Pure and Applied Mathematics . 57 (11): 1413–1457. arXiv : math/0307152 . Bibcode :2003math......7152D. doi :10.1002/cpa.20042.
  2. ^ Los métodos proximales se analizan en detalle en Combettes, Patrick L.; Pesquet, Jean-Christophe (2009). "Métodos de división proximal en el procesamiento de señales". arXiv : 0912.3522 [math.OC].

Referencias

Enlaces externos