Los métodos de gradiente proximal son una forma generalizada de proyección utilizada para resolver problemas de optimización convexa no diferenciables .
Muchos problemas interesantes pueden formularse como problemas de optimización convexa de la forma
donde son posibles funciones convexas no diferenciables . La falta de diferenciabilidad descarta las técnicas de optimización suave convencionales como el método de descenso más pronunciado y el método de gradiente conjugado , pero se pueden utilizar en su lugar métodos de gradiente proximal.
Los métodos de gradiente proximal comienzan con un paso de división, en el que las funciones se utilizan individualmente para producir un algoritmo fácilmente implementable. Se denominan proximales porque cada función no diferenciable entre ellas está involucrada a través de su operador de proximidad . Algoritmo de umbralización de contracción iterativa, [1] Landweber proyectado , gradiente proyectado, proyecciones alternadas , método de multiplicadores de dirección alternada , Bregman de división alternada son instancias especiales de algoritmos proximales. [2]
Para conocer la teoría de los métodos de gradiente proximal desde la perspectiva de la teoría del aprendizaje estadístico y con aplicaciones en ella , consulte métodos de gradiente proximal para el aprendizaje .
Uno de los algoritmos de optimización convexa más utilizados es el de proyecciones sobre conjuntos convexos (POCS). Este algoritmo se emplea para recuperar/sintetizar una señal que satisface simultáneamente varias restricciones convexas. Sea la función indicadora de un conjunto convexo cerrado no vacío que modela una restricción. Esto se reduce al problema de viabilidad convexa, que requiere que encontremos una solución que se encuentre en la intersección de todos los conjuntos convexos . En el método POCS, cada conjunto se incorpora mediante su operador de proyección . Por lo tanto, en cada iteración se actualiza como
Sin embargo, más allá de estos problemas, los operadores de proyección no son apropiados y se requieren operadores más generales para abordarlos. Entre las diversas generalizaciones de la noción de operador de proyección convexo que existen, los operadores proximales son los más adecuados para otros fines.
Ejemplos especiales de métodos de gradiente proximal son