stringtranslate.com

Distribución gaussiana modificada exponencialmente

En teoría de probabilidad , una distribución gaussiana modificada exponencialmente ( EMG , también conocida como distribución exgaussiana ) describe la suma de variables aleatorias normales y exponenciales independientes. Una variable aleatoria exgaussiana Z puede expresarse como Z = X + Y , donde X e Y son independientes, X es gaussiana con media μ y varianza σ 2 , e Y es exponencial de tasa λ . Tiene una asimetría positiva característica del componente exponencial.

También puede considerarse como una función ponderada de una exponencial desplazada, siendo el peso una función de la distribución normal.

Definición

La función de densidad de probabilidad (pdf) de la distribución normal modificada exponencialmente es [1]

donde erfc es la función de error complementaria definida como

Esta función de densidad se deriva mediante la convolución de las funciones de densidad de probabilidad normal y exponencial .

Formas alternativas de cálculo

Se utiliza una forma alternativa pero equivalente de la distribución EMG para la descripción de la forma de los picos en cromatografía . [2] Esto es lo siguiente

dónde

es la amplitud de Gauss,
es el tiempo de relajación del exponente, es una varianza de la función de densidad de probabilidad exponencial .

Esta función no se puede calcular para algunos valores de parámetros (por ejemplo, ) debido a un desbordamiento aritmético. Delley propuso una forma alternativa, pero equivalente, de escribir la función: [3]

donde es una función de error complementaria escalada

En el caso de esta fórmula también es posible el desbordamiento aritmético, la región de desbordamiento es diferente de la primera fórmula, excepto que τ es muy pequeño.

Para τ pequeño es razonable utilizar la forma asintótica de la segunda fórmula:

La decisión sobre el uso de la fórmula se toma en función del parámetro :

para z < 0 el cálculo debe realizarse [2] de acuerdo con la primera fórmula,
para 0 ≤ z ≤ 6,71·10 7 (en el caso del formato de punto flotante de doble precisión ) según la segunda fórmula,
y para z > 6,71·10 7 según la tercera fórmula.

La moda (posición del ápice, valor más probable) se calcula [2] utilizando la derivada de la fórmula 2; para el cálculo se utiliza la inversa de la función de error complementaria escalada erfcxinv(). Kalambet et al. también proponen valores aproximados [2] . Aunque la moda tiene un valor superior al de la gaussiana original, el ápice siempre se encuentra en la gaussiana original (sin modificar).

Estimación de parámetros

Hay tres parámetros: la media de la distribución normal ( μ ), la desviación típica de la distribución normal ( σ ) y el parámetro de decaimiento exponencial ( τ = 1 / λ ). La forma K = τ / σ también se utiliza a veces para caracterizar la distribución. Dependiendo de los valores de los parámetros, la distribución puede variar en forma desde casi normal a casi exponencial.

Los parámetros de la distribución se pueden estimar a partir de los datos de muestra con el método de momentos de la siguiente manera: [4] [5]

donde m es la media de la muestra, s es la desviación estándar de la muestra y γ 1 es la asimetría .

Resolviendo estos parámetros obtenemos:

Recomendaciones

Ratcliff ha sugerido que debe haber al menos 100 puntos de datos en la muestra antes de que las estimaciones de los parámetros se consideren confiables. [6] El promedio de Vincent se puede utilizar con muestras más pequeñas, ya que este procedimiento solo distorsiona modestamente la forma de la distribución. [7] Estas estimaciones puntuales se pueden utilizar como valores iniciales que se pueden refinar con métodos más potentes, incluida una optimización de mínimos cuadrados, que ha demostrado funcionar para el caso de la gaussiana modificada exponencialmente multimodal (MEMG). [8] Se publica una implementación de código con derivadas analíticas de MEMG y un término de oscilación opcional para el procesamiento del sonido como parte de un proyecto de código abierto. [9]

Intervalos de confianza

Actualmente no hay tablas publicadas disponibles para realizar pruebas de significancia con esta distribución. La distribución se puede simular formando la suma de dos variables aleatorias, una extraída de una distribución normal y la otra de una exponencial.

Sesgar

El valor del sesgo no paramétrico

de esta distribución se encuentra entre 0 y 0,31. [10] [11] El límite inferior se alcanza cuando domina el componente normal y el superior cuando domina el componente exponencial.

Aparición

La distribución se utiliza como un modelo teórico para la forma de los picos cromatográficos . [1] [2] [12] Se ha propuesto como un modelo estadístico del tiempo intermitótico en células en división. [13] [14] También se utiliza para modelar haces de iones en racimo. [15] Se utiliza comúnmente en psicología y otras ciencias del cerebro en el estudio de los tiempos de respuesta. [16] [17] [18] En una ligera variante donde la media del componente normal se establece en cero, también se utiliza en el análisis de frontera estocástica , como una de las especificaciones distribucionales para el término de error compuesto que modela la ineficiencia. [19] En el procesamiento de señales, los EMG se han extendido al caso multimodal con un término de oscilación opcional para representar señales de sonido digitalizadas. [8]

Distribuciones relacionadas

Esta familia de distribuciones es un caso especial o límite de la distribución normal-exponencial-gamma . También puede verse como una generalización de tres parámetros de una distribución normal a la que se le añade asimetría; otra distribución similar es la distribución normal asimétrica , que tiene colas más delgadas. La distribución es una distribución de probabilidad compuesta en la que la media de una distribución normal varía aleatoriamente como una distribución exponencial desplazada . [ cita requerida ]

Se ha sugerido una distribución exponencial gaussiana negativa para modelar los precios de las opciones. [20] Si dicha variable aleatoria Y tiene parámetros μ , σ , λ , entonces su -Y negativa tiene una distribución gaussiana modificada exponencialmente con parámetros , σ , λ , y por lo tanto Y tiene media y varianza .

Referencias

  1. ^ ab Grushka, Eli (1972). "Caracterización de picos gaussianos modificados exponencialmente en cromatografía". Química analítica . 44 (11): 1733–1738. doi :10.1021/ac60319a011. PMID  22324584.
  2. ^ abcde Kalambet, Y.; Kozmin, Y.; Mikhailova, K.; Nagaev, I.; Tikhonov, P. (2011). "Reconstrucción de picos cromatográficos utilizando la función gaussiana modificada exponencialmente". Journal of Chemometrics . 25 (7): 352. doi :10.1002/cem.1343. S2CID  121781856.
  3. ^ Delley, R (1985). "Serie para la forma de pico gaussiano modificada exponencialmente". Anal. Chem . 57 : 388. doi :10.1021/ac00279a094.
  4. ^ Dyson, NA (1998). Métodos de integración cromatográfica. Royal Society of Chemistry, Servicios de información. p. 27. ISBN 9780854045105. Recuperado el 15 de mayo de 2015 .
  5. ^ Olivier J. y Norberg MM (2010) Datos sesgados positivamente: revisitando la transformación de potencia de Box-Cox. Int. J. Psych. Res. 3 (1) 68−75.
  6. ^ Ratcliff, R (1979). "Distribuciones de tiempo de reacción grupal y un análisis de estadísticas de distribución". Psychol. Bull . 86 (3): 446–461. CiteSeerX 10.1.1.409.9863 . doi :10.1037/0033-2909.86.3.446. PMID  451109. 
  7. ^ Vincent, SB (1912). "Las funciones de las vibrisas en el comportamiento de la rata blanca". Animal Behaviour Monographs . 1 (5): 7–81.
  8. ^ ab Hahne, C. (2022). "Osciladores gaussianos modificados exponencialmente multimodales". Simposio ultrasónico internacional IEEE 2022 (IUS) : 1–4. arXiv : 2209.12202 .
  9. ^ "MEMG en GitHub". GitHub .
  10. ^ Heathcote, A (1996). "RTSYS: una aplicación DOS para el análisis de datos de tiempo de reacción". Métodos, instrumentos y computadoras de investigación del comportamiento . 28 (3): 427–445. doi : 10.3758/bf03200523 . hdl : 1959.13/28044 .
  11. ^ Ulrich, R.; Miller, J. (1994). "Efectos de la exclusión de valores atípicos en el análisis del tiempo de reacción". J. Exp. Psych.: General . 123 (1): 34–80. doi :10.1037/0096-3445.123.1.34. PMID  8138779.
  12. ^ Gladney, HM; Dowden, BF; Swalen, JD (1969). "Cromatografía gas-líquido asistida por computadora". Anal. Chem . 41 (7): 883–888. doi :10.1021/ac60276a013.
  13. ^ Golubev, A. (2010). "Relevancia de la gaussiana modificada exponencialmente (EMG) para las distribuciones relacionadas con la proliferación y diferenciación celular". Journal of Theoretical Biology . 262 (2): 257–266. Bibcode :2010JThBi.262..257G. doi :10.1016/j.jtbi.2009.10.005. PMID  19825376.
  14. ^ Tyson, DR; Garbett, SP; Frick, PL; Quaranta, V. (2012). "Proliferación fraccional: un método para deconvolucionar la dinámica de la población celular a partir de datos de células individuales". Nature Methods . 9 (9): 923–928. doi :10.1038/nmeth.2138. PMC 3459330 . PMID  22886092. 
  15. ^ Nicolaescu, D.; Takaoka, GH; Ishikawa, J. (2006). "Caracterización multiparamétrica de haces de iones en racimo". Journal of Vacuum Science & Technology B: Microelectronics and Nanometer Structures . 24 (5): 2236. Bibcode :2006JVSTB..24.2236N. doi :10.1116/1.2335433.
  16. ^ Palmer, EM; Horowitz Todd, S; Torralba, A; Wolfe, JM (2011). "¿Cuáles son las formas de las distribuciones de tiempo de respuesta en la búsqueda visual?". J Exp Psychol . 37 (1): 58–71. doi :10.1037/a0020747. PMC 3062635 . PMID  21090905. 
  17. ^ Rohrer, D; Wixted, JT (1994). "Análisis de la latencia y el tiempo entre respuestas en el recuerdo libre". Memoria y cognición . 22 (5): 511–524. doi : 10.3758/BF03198390 . PMID  7968547.
  18. ^ Soltanifar, M; Escobar, M; Dupuis, A; Schachar, R (2021). "Un modelado de mezcla bayesiano de distribuciones de tiempo de reacción de señal de parada: la segunda solución contextual para el problema de los efectos posteriores de la inhibición en las estimaciones de SSRT". Ciencias del cerebro . 11 (9): 1–26. doi : 10.3390/brainsci11081102 . PMC 8391500 . PMID  34439721. 
  19. ^ Lovell, Knox CA; SC Kumbhakar (2000). Análisis de frontera estocástica . Cambridge University Press. págs. 80-82. ISBN 0-521-48184-8.
  20. ^ Peter Carr y Dilip B. Madan, Métodos de punto de silla para la fijación de precios de opciones, The Journal of Computational Finance (49–61) Volumen 13/Número 1, Otoño de 2009