stringtranslate.com

Máximo suave

En matemáticas , un máximo suave de una familia indexada x 1 , ...,  x n de números es una aproximación suave a la función máxima , es decir, una familia paramétrica de funciones tales que para cada α , la función es suave y la familia converge a la función máxima como . El concepto de mínimo suave se define de manera similar. En muchos casos, una sola familia se aproxima a ambos: máximo cuando el parámetro tiende a infinito positivo, mínimo cuando el parámetro tiende a infinito negativo; en símbolos, como y como . El término también se puede usar de manera vaga para una función suave específica que se comporta de manera similar a un máximo, sin ser necesariamente parte de una familia parametrizada.

Ejemplos

Operador de Boltzmann

Máxima suavidad de (−x, x) en función de x para distintos valores de parámetros. Muy suave para =0,5 y más nítida para =8.

Para valores positivos grandes del parámetro , la siguiente formulación es una aproximación suave y diferenciable de la función máxima. Para valores negativos del parámetro que son grandes en valor absoluto, se aproxima al mínimo.

tiene las siguientes propiedades:

  1. como
  2. es la media aritmética de sus entradas
  3. como

El gradiente de está estrechamente relacionado con softmax y está dado por

Esto hace que la función softmax sea útil para las técnicas de optimización que utilizan descenso de gradiente .

Este operador a veces se denomina operador de Boltzmann, [1] en honor a la distribución de Boltzmann .

suma logarítmica de la expresión

Otro máximo suave es LogSumExp :

Esto también se puede normalizar si todos son no negativos, lo que produce una función con dominio y rango :

El término corrige el hecho de que al cancelar todos menos uno, el exponencial es cero, y si todos son cero.

Máximo suave

El operador mellowmax [1] se define de la siguiente manera:

Es un operador no expansivo . Como , actúa como un máximo. Como , actúa como una media aritmética. Como , actúa como un mínimo. Este operador puede verse como una instancia particular de la media cuasi-aritmética . También puede derivarse de los principios teóricos de la información como una forma de regularizar políticas con una función de costo definida por la divergencia KL. El operador se ha utilizado previamente en otras áreas, como la ingeniería energética. [2]

p-Norma

Otro máximo suave es la p-norma :

que converge a como .

Una ventaja de la p-norma es que es una norma . Como tal, es invariante en escala ( homogénea ): , y satisface la desigualdad triangular .

Unidad máxima lisa

El siguiente operador binario se denomina Unidad Máxima Suavizada (SMU): [3]

donde es un parámetro. Como , y por lo tanto .

Véase también

Referencias

  1. ^ ab Asadi, Kavosh; Littman, Michael L. (2017). "Un operador Softmax alternativo para el aprendizaje por refuerzo". PMLR . 70 : 243–252. arXiv : 1612.05628 . Consultado el 6 de enero de 2023 .
  2. ^ Safak, Aysel (febrero de 1993). "Análisis estadístico de la suma de potencias de múltiples componentes log-normales correlacionados". IEEE Transactions on Vehicular Technology . 42 (1): {58–61. doi :10.1109/25.192387 . Consultado el 6 de enero de 2023 .
  3. ^ Biswas, Koushik; Kumar, Sandeep; Banerjee, Shilpak; Ashish Kumar Pandey (2021). "SMU: Función de activación suave para redes profundas utilizando la técnica de suavizado máximo". arXiv : 2111.04682 [cs.LG].

https://www.johndcook.com/soft_maximum.pdf

M. Lange, D. Zühlke, O. Holz y T. Villmann, "Aplicaciones de las normas lp y sus aproximaciones suaves para la cuantificación vectorial basada en el aprendizaje de gradientes", en Proc. ESANN , abril de 2014, págs. 271-276. (https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2014-153.pdf)