Los métodos de gradiente proximal son una forma generalizada de proyección que se utiliza para resolver problemas de optimización convexa no diferenciables .
Muchos problemas interesantes pueden formularse como problemas de optimización convexa de la forma
donde posiblemente haya funciones convexas no diferenciables . La falta de diferenciabilidad descarta las técnicas de optimización suave convencionales como el método de descenso más pronunciado y el método de gradiente conjugado , pero en su lugar se pueden utilizar métodos de gradiente proximal.
Los métodos de gradiente proximal comienzan con un paso de división, en el que las funciones se utilizan individualmente para producir un algoritmo fácilmente implementable. Se llaman proximales porque cada función no diferenciable entre está involucrada a través de su operador de proximidad . El algoritmo iterativo de umbral de contracción, [1] Landweber proyectado , el gradiente proyectado, las proyecciones alternas , el método de multiplicadores de dirección alterna y la división alterna de Bregman son ejemplos especiales de algoritmos proximales. [2]
Para conocer la teoría de los métodos de gradiente proximal desde la perspectiva y con aplicaciones a la teoría del aprendizaje estadístico , consulte métodos de gradiente proximal para el aprendizaje .
Uno de los algoritmos de optimización convexa más utilizados son las proyecciones sobre conjuntos convexos (POCS). Este algoritmo se emplea para recuperar/sintetizar una señal que satisface simultáneamente varias restricciones convexas. Sea la función indicadora de un conjunto convexo cerrado no vacío que modela una restricción. Esto se reduce al problema de viabilidad convexo, que requiere que encontremos una solución tal que se encuentre en la intersección de todos los conjuntos convexos . En el método POCS cada conjunto es incorporado por su operador de proyección . Entonces en cada iteración se actualiza como
Sin embargo, más allá de estos problemas, los operadores de proyección no son apropiados y se requieren operadores más generales para abordarlos. Entre las diversas generalizaciones que existen de la noción de operador de proyección convexa, los operadores proximales son los más adecuados para otros fines.
Ejemplos especiales de métodos de gradiente proximal son