Función matemática que tiene una curva característica en forma de S o curva sigmoidea
Una función sigmoidea se refiere específicamente a una función cuyo gráfico sigue la función logística . Se define mediante la fórmula:
En muchos campos, especialmente en el contexto de las redes neuronales artificiales , el término "función sigmoidea" se reconoce correctamente como sinónimo de la función logística. Si bien otras curvas en forma de S, como la curva de Gompertz o la curva ogee , pueden parecerse a las funciones sigmoideas, son funciones matemáticas distintas con diferentes propiedades y aplicaciones.
Las funciones sigmoideas, en particular la función logística, tienen un dominio de todos los números reales y normalmente producen valores de salida en el rango de 0 a 1, aunque algunas variaciones, como la tangente hiperbólica , producen valores de salida entre −1 y 1. Estas funciones se utilizan comúnmente como funciones de activación en neuronas artificiales y como funciones de distribución acumulativa en estadística . La función sigmoidea logística también es invertible, siendo su inversa la función logit .
Definición
Una función sigmoidea es una función real , acotada y diferenciable que está definida para todos los valores de entrada reales y tiene una derivada no negativa en cada punto [1] [2] y exactamente un punto de inflexión .
Una función sigmoidea es convexa para valores menores que un punto particular, y es cóncava para valores mayores que ese punto: en muchos de los ejemplos aquí, ese punto es 0.
Hasta los cambios y la escala, muchos sigmoides son casos especiales de donde es la inversa de la transformación negativa de Box-Cox , y y son parámetros de forma. [4]
utilizando la tangente hiperbólica mencionada anteriormente. Aquí, es un parámetro libre que codifica la pendiente en , que debe ser mayor o igual a porque cualquier valor menor dará como resultado una función con múltiples puntos de inflexión, que por lo tanto no es una sigmoidea verdadera. Esta función es inusual porque en realidad alcanza los valores límite de -1 y 1 dentro de un rango finito, lo que significa que su valor es constante en -1 para todos y en 1 para todos . No obstante, es suave (infinitamente diferenciable, ) en todas partes , incluso en .
Aplicaciones
Muchos procesos naturales, como los de las curvas de aprendizaje de sistemas complejos , presentan una progresión que comienza con un comienzo pequeño y se acelera hasta alcanzar un clímax con el tiempo. Cuando no se dispone de un modelo matemático específico, se suele utilizar una función sigmoidea. [6]
En gráficos de computadora y renderizado en tiempo real, algunas de las funciones sigmoideas se utilizan para mezclar colores o geometría entre dos valores, de manera suave y sin costuras ni discontinuidades visibles.
^ Han, Jun; Morag, Claudio (1995). "La influencia de los parámetros de la función sigmoidea en la velocidad del aprendizaje por retropropagación". En Mira, José; Sandoval, Francisco (eds.). De la computación neuronal natural a la artificial . Lecture Notes in Computer Science. Vol. 930. págs. 195–201. doi :10.1007/3-540-59497-3_175. ISBN 978-3-540-59497-0.
^ Ling, Yibei; He, Bin (diciembre de 1993). "Análisis entrópico de modelos de crecimiento biológico". IEEE Transactions on Biomedical Engineering . 40 (12): 1193–2000. doi :10.1109/10.250574. PMID 8125495.
^ Dunning, Andrew J.; Kensler, Jennifer; Coudeville, Laurent; Bailleux, Fabrice (28 de diciembre de 2015). "Algunas extensiones en métodos continuos para correlatos inmunológicos de protección". BMC Medical Research Methodology . 15 (107): 107. doi : 10.1186/s12874-015-0096-9 . PMC 4692073 . PMID 26707389.
^ "grex --- Explorador de curvas de crecimiento". GitHub . 2022-07-09. Archivado desde el original el 2022-08-25 . Consultado el 2022-08-25 .
^ EpsilonDelta (16 de agosto de 2022). "Función de transición suave en una dimensión | Serie de funciones de transición suave, parte 1". 13:29/14:04 – vía www.youtube.com.
^ Gibbs, Mark N.; Mackay, D. (noviembre de 2000). "Clasificadores de procesos gaussianos variacionales". IEEE Transactions on Neural Networks . 11 (6): 1458–1464. doi :10.1109/72.883477. PMID 18249869. S2CID 14456885.
^ Smith, Julius O. (2010). Procesamiento físico de señales de audio (edición de 2010). W3K Publishing. ISBN978-0-9745607-2-4Archivado desde el original el 14 de julio de 2022. Consultado el 28 de marzo de 2020 .
^ Gustafson, John L. ; Yonemoto, Isaac (12 de junio de 2017). "Vencer al punto flotante en su propio juego: aritmética de posiciones" (PDF) . Archivado (PDF) desde el original el 14 de julio de 2022 . Consultado el 28 de diciembre de 2019 .
Lectura adicional
Mitchell, Tom M. (1997). Aprendizaje automático . WCB McGraw–Hill . ISBN.978-0-07-042807-2.. (NB: En particular, véase el "Capítulo 4: Redes neuronales artificiales" (en particular, págs. 96-97) donde Mitchell utiliza las palabras "función logística" y "función sigmoidea" como sinónimos –a esta función también la llama "función de aplastamiento"– y la función sigmoidea (también conocida como logística) se utiliza para comprimir las salidas de las "neuronas" en redes neuronales multicapa).
Humphrys, Mark. "Salida continua, la función sigmoidea". Archivado desde el original el 14 de julio de 2022. Consultado el 14 de julio de 2022 .(NB. Propiedades de la sigmoide, incluyendo cómo puede desplazarse a lo largo de los ejes y cómo puede transformarse su dominio.)
Enlaces externos
"Ajuste de curvas logísticas S (sigmoides) a datos utilizando SegRegA". Archivado desde el original el 14 de julio de 2022.