stringtranslate.com

Distribución gaussiana exponencialmente modificada

En teoría de la probabilidad , una distribución gaussiana exponencialmente modificada ( EMG , también conocida como distribución exGaussiana ) describe la suma de variables aleatorias normales y exponenciales independientes. Una variable aleatoria exGaussiana Z puede expresarse como Z = X + Y , donde X e Y son independientes, X es gaussiana con media μ y varianza σ 2 , e Y es exponencial de tasa λ . Tiene un sesgo positivo característico del componente exponencial.

También puede considerarse como una función ponderada de una exponencial desplazada, siendo el peso una función de la distribución normal.

Definición

La función de densidad de probabilidad (pdf) de la distribución normal modificada exponencialmente es [1]

donde erfc es la función de error complementaria definida como

Esta función de densidad se deriva mediante la convolución de las funciones de densidad de probabilidad normal y exponencial .

Formas alternativas de cálculo

Se utiliza una forma alternativa pero equivalente de la distribución EMG para describir la forma de los picos en cromatografía . [2] Esto es lo siguiente

dónde

es la amplitud de Gauss,
es el tiempo de relajación del exponente, es una varianza de la función de densidad de probabilidad exponencial .

Esta función no se puede calcular para algunos valores de parámetros (por ejemplo, ) debido a un desbordamiento aritmético. Delley propuso una forma alternativa, pero equivalente, de escribir la función: [3]

¿Dónde está una función de error complementaria escalada?

En el caso de esta fórmula, también es posible el desbordamiento aritmético, la región de desbordamiento es diferente de la primera fórmula, excepto por un τ muy pequeño.

Para τ pequeño es razonable utilizar la forma asintótica de la segunda fórmula:

La decisión sobre el uso de la fórmula se toma en función del parámetro :

para z < 0 el cálculo debe realizarse [2] de acuerdo con la primera fórmula,
para 0 ≤ z ≤ 6,71 · 10 7 (en el caso del formato de coma flotante de doble precisión ) según la segunda fórmula,
y para z > 6,71·10 7 según la tercera fórmula.

La moda (posición del vértice, valor más probable) se calcula [2] utilizando la derivada de la fórmula 2; para el cálculo se utiliza la inversa de la función de error complementaria escalada erfcxinv(). Kalambet et al. también proponen valores aproximados. [2] Aunque la moda tiene un valor superior al del gaussiano original, el vértice siempre se encuentra en el gaussiano original (sin modificar).

Estimación de parámetros

Hay tres parámetros: la media de la distribución normal ( μ ), la desviación estándar de la distribución normal ( σ ) y el parámetro de caída exponencial ( τ = 1 / λ ). La forma K = τ / σ también se utiliza a veces para caracterizar la distribución. Dependiendo de los valores de los parámetros, la distribución puede variar en forma desde casi normal hasta casi exponencial.

Los parámetros de la distribución se pueden estimar a partir de los datos de la muestra con el método de momentos de la siguiente manera: [4] [5]

donde m es la media muestral, s es la desviación estándar muestral y γ 1 es la asimetría .

Resolviendo estos para los parámetros se obtiene:

Recomendaciones

Ratcliff ha sugerido que debe haber al menos 100 puntos de datos en la muestra antes de que las estimaciones de los parámetros puedan considerarse confiables. [6] El promedio de Vincent se puede utilizar con muestras más pequeñas, ya que este procedimiento sólo distorsiona ligeramente la forma de la distribución. [7] Estas estimaciones puntuales se pueden utilizar como valores iniciales que se pueden refinar con métodos más potentes, incluida una optimización de mínimos cuadrados, que ha demostrado funcionar para el caso gaussiano multimodal exponencialmente modificado (MEMG). [8] Se publica una implementación de código con derivados analíticos de MEMG y un término de oscilación opcional para el procesamiento de sonido como parte de un proyecto de código abierto. [9]

Intervalos de confianza

Actualmente no hay tablas publicadas disponibles para pruebas de significancia con esta distribución. La distribución se puede simular formando la suma de dos variables aleatorias, una extraída de una distribución normal y la otra de una exponencial.

Sesgar

El valor del sesgo no paramétrico.

de esta distribución se sitúa entre 0 y 0,31. [10] [11] Se acerca al límite inferior cuando domina el componente normal, y al superior cuando domina el componente exponencial.

Ocurrencia

La distribución se utiliza como modelo teórico para la forma de los picos cromatográficos . [1] [2] [12] Se ha propuesto como modelo estadístico del tiempo intermitótico en células en división. [13] [14] También se utiliza en el modelado de haces de iones en racimos. [15] Se utiliza comúnmente en psicología y otras ciencias del cerebro en el estudio de los tiempos de respuesta. [16] [17] [18] En una ligera variante donde la media del componente normal se establece en cero, también se utiliza en el análisis de frontera estocástica , como una de las especificaciones distributivas para el término de error compuesto que modela la ineficiencia. [19] En el procesamiento de señales, los EMG se han extendido al caso multimodal con un término de oscilación opcional para representar señales de sonido digitalizadas. [8]

Distribuciones relacionadas

Esta familia de distribuciones es un caso especial o limitante de la distribución gamma-exponencial normal . Esto también puede verse como una generalización de tres parámetros de una distribución normal para agregar asimetría; Otra distribución similar es la distribución normal sesgada , que tiene colas más delgadas. La distribución es una distribución de probabilidad compuesta en la que la media de una distribución normal varía aleatoriamente como una distribución exponencial desplazada . [ cita necesaria ]

Se ha sugerido una distribución exponencial negativa gaussiana para modelar los precios de las opciones. [20] Si dicha variable aleatoria Y tiene parámetros μ , σ , λ , entonces su -Y negativo tiene una distribución gaussiana exponencialmente modificada con parámetros , σ , λ y, por lo tanto, Y tiene media y varianza .

Referencias

  1. ^ ab Grushka, Eli (1972). "Caracterización de picos gaussianos exponencialmente modificados en cromatografía". Química analítica . 44 (11): 1733-1738. doi :10.1021/ac60319a011. PMID  22324584.
  2. ^ abcde Kalambet, Y.; Kozmin, Y.; Mijaílova, K.; Nagaev, I.; Tikhonov, P. (2011). "Reconstrucción de picos cromatográficos mediante la función Gaussiana modificada exponencialmente". Revista de quimiometría . 25 (7): 352. doi : 10.1002/cem.1343. S2CID  121781856.
  3. ^ Delley, R (1985). "Serie para la forma de pico gaussiano exponencialmente modificada". Anal. química . 57 : 388. doi : 10.1021/ac00279a094.
  4. ^ Dyson, NA (1998). Métodos de integración cromatográfica. Real Sociedad de Química, Servicios de Información. pag. 27.ISBN 9780854045105. Consultado el 15 de mayo de 2015 .
  5. ^ Olivier J. y Norberg MM (2010) Datos positivamente sesgados: revisando la transformación de energía de Box-Cox. En t. J. Psic. Res. 3 (1) 68-75.
  6. ^ Ratcliff, R (1979). "Distribuciones del tiempo de reacción del grupo y análisis de estadísticas de distribución". Psicólogo. Toro . 86 (3): 446–461. CiteSeerX 10.1.1.409.9863 . doi :10.1037/0033-2909.86.3.446. PMID  451109. 
  7. ^ Vicente, SB (1912). "Las funciones de las vibrisas en el comportamiento de la rata blanca". Monografías sobre comportamiento animal . 1 (5): 7–81.
  8. ^ ab Hahne, C. (2022). "Osciladores gaussianos multimodales exponencialmente modificados". Simposio internacional de ultrasonidos IEEE 2022 (IUS) : 1–4. arXiv : 2209.12202 .
  9. ^ "MEMG en GitHub". GitHub .
  10. ^ Heathcote, A (1996). "RTSYS: una aplicación DOS para el análisis de datos de tiempo de reacción". Métodos, instrumentos y computadoras de investigación del comportamiento . 28 (3): 427–445. doi : 10.3758/bf03200523 . hdl : 1959.13/28044 .
  11. ^ Ulrich, R.; Molinero, J. (1994). "Efectos de la exclusión de valores atípicos en el análisis del tiempo de reacción". J. Exp. Psic.: General . 123 (1): 34–80. doi :10.1037/0096-3445.123.1.34. PMID  8138779.
  12. ^ Gladney, HM; Dowden, BF; Swalen, JD (1969). "Cromatografía gas-líquido asistida por computadora". Anal. química . 41 (7): 883–888. doi :10.1021/ac60276a013.
  13. ^ Golubev, A. (2010). "Relevancia gaussiana exponencialmente modificada (EMG) para distribuciones relacionadas con la proliferación y diferenciación celular". Revista de Biología Teórica . 262 (2): 257–266. Código Bib : 2010JThBi.262..257G. doi :10.1016/j.jtbi.2009.10.005. PMID  19825376.
  14. ^ Tyson, DR; Garbett, SP; Frick, PL; Quaranta, V. (2012). "Proliferación fraccionada: un método para desconvolucionar la dinámica de poblaciones celulares a partir de datos unicelulares". Métodos de la naturaleza . 9 (9): 923–928. doi :10.1038/nmeth.2138. PMC 3459330 . PMID  22886092. 
  15. ^ Nicolaescu, D.; Takaoka, GH; Ishikawa, J. (2006). "Caracterización multiparamétrica de haces de iones en racimos". Revista de ciencia y tecnología del vacío B: microelectrónica y estructuras nanométricas . 24 (5): 2236. Código bibliográfico : 2006JVSTB..24.2236N. doi :10.1116/1.2335433.
  16. ^ Palmer, EM; Horowitz Todd, S; Torralba, A; Wolfe, JM (2011). "¿Cuáles son las formas de las distribuciones del tiempo de respuesta en la búsqueda visual?". J Exp Psicología . 37 (1): 58–71. doi :10.1037/a0020747. PMC 3062635 . PMID  21090905. 
  17. ^ Rohrer, D; Wixted, JT (1994). "Un análisis de latencia y tiempo entre respuestas en recuerdo libre". Memoria y cognición . 22 (5): 511–524. doi : 10.3758/BF03198390 . PMID  7968547.
  18. ^ Soltanifar, M; Escobar, M; Dupuis, A; Schachar, R (2021). "Un modelado de mezcla bayesiana de distribuciones de tiempo de reacción de señales de parada: la segunda solución contextual para el problema de las secuelas de la inhibición en las estimaciones de SSRT". Ciencias del cerebro . 11 (9): 1–26. doi : 10.3390/brainsci11081102 . PMC 8391500 . PMID  34439721. 
  19. ^ Lovell, Knox CA; SC Kumbhakar (2000). Análisis de la frontera estocástica . Prensa de la Universidad de Cambridge. págs. 80–82. ISBN 0-521-48184-8.
  20. ^ Peter Carr y Dilip B. Madan, Métodos Saddlepoint para la fijación de precios de opciones, The Journal of Computational Finance (49–61) Volumen 13/Número 1, otoño de 2009