Distribución normal plegada

La distribución normal plegada es una distribución de probabilidad relacionada con la distribución normal . Dada una variable aleatoria X con distribución normal con media μ y varianza σ ² , la variable aleatoria Y = | X | tiene una distribución normal plegada. Tal caso puede darse si solo se registra la magnitud de alguna variable, pero no su signo. La distribución se llama "plegada" porque la masa de probabilidad a la izquierda de x = 0 se pliega tomando el valor absoluto . En la física de la conducción de calor , la distribución normal plegada es una solución fundamental de la ecuación del calor en el semiespacio; corresponde a tener un aislante perfecto en un hiperplano que pasa por el origen.

Definiciones

Densidad

La función de densidad de probabilidad (PDF) está dada por

f_{Y}(x;\mu ,\sigma ^{2})={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\,e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}+{\frac {1}{\sqrt {2\pi \sigma ^{2}}}}\,e^{-{\frac {(x+\mu )^{2}}{2\sigma ^{2}}}}

para x ≥ 0, y 0 en todos los demás lugares. Una formulación alternativa viene dada por

f\left(x\right)={\sqrt {\frac {2}{\pi \sigma ^{2}}}}e^{-{\frac {\left(x^{2}+\mu ^{2}\right)}{2\sigma ^{2}}}}\cosh {\left({\frac {\mu x}{\sigma ^{2}}}\right)}

donde cosh es la función coseno hiperbólico . De ello se deduce que la función de distribución acumulativa (CDF) viene dada por:

F_{Y}(x;\mu ,\sigma ^{2})={\frac {1}{2}}[{\mbox{erf}}({\frac {x+\mu }{\sqrt {2\sigma ^{2}}}})+{\mbox{erf}}({\frac {x-\mu }{\sqrt {2\sigma ^{2}}}})]

para x ≥ 0, donde erf() es la función de error . Esta expresión se reduce a la CDF de la distribución seminormal cuando μ = 0.

La media de la distribución plegada es entonces

\mu _{Y}=\sigma {\sqrt {\frac {2}{\pi }}}\,\,\exp \left({\frac {-\mu ^{2}}{2\sigma ^{2}}}\right)+\mu \,{\mbox{erf}}\left({\frac {\mu }{\sqrt {2\sigma ^{2}}}}\right)

\mu _{Y}={\sqrt {\frac {2}{\pi }}}\sigma e^{-{\frac {\mu ^{2}}{2\sigma ^{2}}}}+\mu \left[1-2\Phi \left(-{\frac {\mu }{\sigma }}\right)\right]

¿Dónde está la función de distribución acumulativa normal ? ${\estilo de visualización \Phi}$

\Phi(x)\;=\;{\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {x}{\sqrt {2}}}\right)\right].

La varianza se expresa entonces fácilmente en términos de la media:

\sigma _{Y}^{2}=\mu ^{2}+\sigma ^{2}-\mu _{Y}^{2}.

Tanto la media ( μ ) como la varianza ( σ ² ) de X en la distribución normal original pueden interpretarse como los parámetros de ubicación y escala de Y en la distribución plegada.

Propiedades

Modo

La moda de la distribución es el valor de para el cual se maximiza la densidad. Para hallar este valor, tomamos la primera derivada de la densidad con respecto a y la igualamos a cero. Lamentablemente, no existe una forma cerrada. Sin embargo, podemos escribir la derivada de una mejor manera y terminar con una ecuación no lineal. ${\estilo de visualización x}$ ${\estilo de visualización x}$

${\frac {df(x)}{dx}}=0\Rightarrow -{\frac {\left(x-\mu \right)}{\sigma ^{2}}}e^{-{\frac {1}{2}}{\frac {\left(x-\mu \right)^{2}}{\sigma ^{2}}}}-{\frac {\left(x+\mu \right)}{\sigma ^{2}}}e^{-{\frac {1}{2}}{\frac {\left(x+\mu \right)^{2}}{\sigma ^{2}}}}=0$

$x\left[e^{-{\frac {1}{2}}{\frac {\left(x-\mu \right)^{2}}{\sigma ^{2}}}}+e^{-{\frac {1}{2}}{\frac {\left(x+\mu \right)^{2}}{\sigma ^{2}}}}\right]-\mu \left[e^{-{\frac {1}{2}}{\frac {\left(x-\mu \right)^{2}}{\sigma ^{2}}}}-e^{-{\frac {1}{2}}{\frac {\left(x+\mu \right)^{2}}{\sigma ^{2}}}}\right]=0$

$x\left(1+e^{-{\frac {2\mu x}{\sigma ^{2}}}}\right)-\mu \left(1-e^{-{\frac {2\mu x}{\sigma ^{2}}}}\right)=0$

$\left(\mu +x\right)e^{-{\frac {2\mu x}{\sigma ^{2}}}}=\mu -x$

$x=-{\frac {\sigma ^{2}}{2\mu }}\log {\frac {\mu -x}{\mu +x}}$ .

Tsagris et al. (2014) observaron a partir de una investigación numérica que cuando , se alcanza el máximo cuando , y cuando se vuelve mayor que , el máximo se acerca a . Por supuesto, esto es algo que se espera, ya que, en este caso, la normal plegada converge a la distribución normal. Para evitar cualquier problema con varianzas negativas, se sugiere la exponenciación del parámetro. Alternativamente, puede agregar una restricción, como si el optimizador opta por una varianza negativa, el valor de la verosimilitud logarítmica es NA o algo muy pequeño. $\mu <\sigma$ $x=0$ $\mu$ $3\sigma$ $\mu$

Función característica y otras funciones relacionadas

La función característica viene dada por

$\varphi _{x}\left(t\right)=e^{{\frac {-\sigma ^{2}t^{2}}{2}}+i\mu t}\Phi \left({\frac {\mu }{\sigma }}+i\sigma t\right)+e^{-{\frac {\sigma ^{2}t^{2}}{2}}-i\mu t}\Phi \left(-{\frac {\mu }{\sigma }}+i\sigma t\right)$ .

La función generadora de momentos está dada por

$M_{x}\left(t\right)=\varphi _{x}\left(-it\right)=e^{{\frac {\sigma ^{2}t^{2}}{2}}+\mu t}\Phi \left({\frac {\mu }{\sigma }}+\sigma t\right)+e^{{\frac {\sigma ^{2}t^{2}}{2}}-\mu t}\Phi \left(-{\frac {\mu }{\sigma }}+\sigma t\right)$ .

La función generadora cumulante está dada por

$K_{x}\left(t\right)=\log {M_{x}\left(t\right)}=\left({\frac {\sigma ^{2}t^{2}}{2}}+\mu t\right)+\log {\left\lbrace 1-\Phi \left(-{\frac {\mu }{\sigma }}-\sigma t\right)+e^{{\frac {\sigma ^{2}t^{2}}{2}}-\mu t}\left[1-\Phi \left({\frac {\mu }{\sigma }}-\sigma t\right)\right]\right\rbrace }$ .

La transformación de Laplace está dada por

$E\left(e^{-tx}\right)=e^{{\frac {\sigma ^{2}t^{2}}{2}}-\mu t}\left[1-\Phi \left(-{\frac {\mu }{\sigma }}+\sigma t\right)\right]+e^{{\frac {\sigma ^{2}t^{2}}{2}}+\mu t}\left[1-\Phi \left({\frac {\mu }{\sigma }}+\sigma t\right)\right]$ .

La transformada de Fourier está dada por

${\hat {f}}\left(t\right)=\varphi _{x}\left(-2\pi t\right)=e^{{\frac {-4\pi ^{2}\sigma ^{2}t^{2}}{2}}-i2\pi \mu t}\left[1-\Phi \left(-{\frac {\mu }{\sigma }}-i2\pi \sigma t\right)\right]+e^{-{\frac {4\pi ^{2}\sigma ^{2}t^{2}}{2}}+i2\pi \mu t}\left[1-\Phi \left({\frac {\mu }{\sigma }}-i2\pi \sigma t\right)\right]$ .

Distribuciones relacionadas

Cuando $μ = 0$ , la distribución de $Y$ es una distribución seminormal .
La variable aleatoria $(Y / σ) 2$ tiene una distribución chi-cuadrado no central con 1 grado de libertad y no centralidad igual a $(μ / σ) 2$ .
La distribución normal plegada también puede verse como el límite de la distribución t no estandarizada plegada a medida que los grados de libertad tienden al infinito.
Existe una versión bivariada desarrollada por Psarakis y Panaretos (2001) así como una versión multivariada desarrollada por Chakraborty y Chatterjee (2013).
La distribución de Rice es una generalización multivariada de la distribución normal plegada.
La distribución seminormal modificada ^[1] con la función de densidad de probabilidad activada se da como , donde denota la función Psi de Fox–Wright . $(0,\infty )$ $f(x)={\frac {2\beta ^{\frac {\alpha }{2}}x^{\alpha -1}\exp(-\beta x^{2}+\gamma x)}{\Psi {\left({\frac {\alpha }{2}},{\frac {\gamma }{\sqrt {\beta }}}\right)}}}$ $\Psi (\alpha ,z)={}_{1}\Psi _{1}\left({\begin{matrix}\left(\alpha ,{\frac {1}{2}}\right)\\(1,0)\end{matrix}};z\right)$

Inferencia estadística

Estimación de parámetros

Existen varias formas de estimar los parámetros de la normal plegada. Todas ellas son, en esencia, el procedimiento de estimación de máxima verosimilitud, pero en algunos casos se realiza una maximización numérica, mientras que en otros se busca la raíz de una ecuación. La verosimilitud logarítmica de la normal plegada cuando se dispone de una muestra de tamaño adecuado se puede escribir de la siguiente manera: $x_{i}$ $n$

$l=-{\frac {n}{2}}\log {2\pi \sigma ^{2}}+\sum _{i=1}^{n}\log {\left[e^{-{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}}+e^{-{\frac {\left(x_{i}+\mu \right)^{2}}{2\sigma ^{2}}}}\right]}$

$l=-{\frac {n}{2}}\log {2\pi \sigma ^{2}}+\sum _{i=1}^{n}\log {\left[e^{-{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}}\left(1+e^{-{\frac {\left(x_{i}+\mu \right)^{2}}{2\sigma ^{2}}}}e^{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}\right)\right]}$

$l=-{\frac {n}{2}}\log {2\pi \sigma ^{2}}-\sum _{i=1}^{n}{\frac {\left(x_{i}-\mu \right)^{2}}{2\sigma ^{2}}}+\sum _{i=1}^{n}\log {\left(1+e^{-{\frac {2\mu x_{i}}{\sigma ^{2}}}}\right)}$

En R (lenguaje de programación) , utilizando el paquete Rfast se puede obtener el MLE muy rápido (comando foldnorm.mle). Alternativamente, el comando optim o nlm se ajustará a esta distribución. La maximización es fácil, ya que intervienen dos parámetros ( y ). Nótese que tanto los valores positivos como los negativos para son aceptables, ya que pertenece a la línea real de números, por lo tanto, el signo no es importante porque la distribución es simétrica con respecto a él. El siguiente código está escrito en R $\mu$ $\sigma ^{2}$ $\mu$ $\mu$

plegado <- función ( y ) {    ## y es un vector con datos positivos n <- longitud ( y ) ## tamaño de muestra sy2 <- suma ( y ^ 2 )        sam <- función ( para , n , sy2 ) { yo <- para [ 1 ] ; se <- exp ( para [ 2 ] ) f <- - n / 2 * log ( 2 / pi / se ) + n * yo ^ 2 / 2 / se + sy2 / 2 / se - suma ( log ( cosh ( yo * y / se ) ) ) f }                                               mod <- optim ( c ( media ( y ), sd ( y ) ), n = n , sy2 = sy2 , sam , control = list ( maxit = 2000 ) ) mod <- optim ( mod $ par , sam , n = n , sy2 = sy2 , control = list ( maxit = 20000 ) ) resultado <- c ( - mod $ valor , mod $ par [ 1 ], exp ( mod $ par [ 2 ]) ) nombres ( resultado ) <- c ( "log-verosimilitud" , "mu" , "sigma al cuadrado" ) resultado                                                 }

Las derivadas parciales de la log-verosimilitud se escriben como

${\frac {\partial l}{\partial \mu }}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)}{\sigma ^{2}}}-{\frac {2}{\sigma ^{2}}}\sum _{i=1}^{n}{\frac {x_{i}e^{\frac {-2\mu x_{i}}{\sigma ^{2}}}}{1+e^{\frac {-2\mu x_{i}}{\sigma ^{2}}}}}$

${\frac {\partial l}{\partial \mu }}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)}{\sigma ^{2}}}-{\frac {2}{\sigma ^{2}}}\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}\ \ {\text{and}}$

${\frac {\partial l}{\partial \sigma ^{2}}}=-{\frac {n}{2\sigma ^{2}}}+{\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)^{2}}{2\sigma ^{4}}}+{\frac {2\mu }{\sigma ^{4}}}\sum _{i=1}^{n}{\frac {x_{i}e^{-{\frac {2\mu x_{i}}{\sigma ^{2}}}}}{1+e^{-{\frac {2\mu x_{i}}{\sigma ^{2}}}}}}$

Al igualar la primera derivada parcial de la verosimilitud logarítmica a cero, obtenemos una bonita relación

$\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)}{2}}$ .

Nótese que la ecuación anterior tiene tres soluciones, una en cero y dos más con el signo opuesto. Al sustituir la ecuación anterior, en la derivada parcial de la verosimilitud logarítmica con respecto a e igualarla a cero, obtenemos la siguiente expresión para la varianza. $\sigma ^{2}$

$\sigma ^{2}={\frac {\sum _{i=1}^{n}\left(x_{i}-\mu \right)^{2}}{n}}+{\frac {2\mu \sum _{i=1}^{n}\left(x_{i}-\mu \right)}{n}}={\frac {\sum _{i=1}^{n}\left(x_{i}^{2}-\mu ^{2}\right)}{n}}={\frac {\sum _{i=1}^{n}x_{i}^{2}}{n}}-\mu ^{2}$ ,

que es la misma fórmula que en la distribución normal . Una diferencia principal aquí es que y no son estadísticamente independientes. Las relaciones anteriores se pueden utilizar para obtener estimaciones de máxima verosimilitud de una manera recursiva eficiente. Comenzamos con un valor inicial para y encontramos la raíz positiva ( ) de la última ecuación. Luego, obtenemos un valor actualizado de . El procedimiento se repite hasta que el cambio en el valor de log-verosimilitud sea insignificante. Otra forma más fácil y eficiente es realizar un algoritmo de búsqueda. Escribamos la última ecuación de una manera más elegante. $\mu$ $\sigma ^{2}$ $\sigma ^{2}$ $\mu$ $\sigma ^{2}$

$2\sum _{i=1}^{n}{\frac {x_{i}}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}-\sum _{i=1}^{n}{\frac {x_{i}\left(1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}\right)}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}+n\mu =0$

$\sum _{i=1}^{n}{\frac {x_{i}\left(1-e^{\frac {2\mu x_{i}}{\sigma ^{2}}}\right)}{1+e^{\frac {2\mu x_{i}}{\sigma ^{2}}}}}+n\mu =0$ .

Se hace evidente que la optimización de la verosimilitud logarítmica con respecto a los dos parámetros se ha convertido en una búsqueda de raíz de una función. Por supuesto, esto es idéntico a la búsqueda de raíz anterior. Tsagris et al. (2014) observaron que hay tres raíces para esta ecuación para , es decir, hay tres valores posibles de que satisfacen esta ecuación. y , que son las estimaciones de máxima verosimilitud y 0, que corresponde a la verosimilitud logarítmica mínima. $\mu$ $\mu$ $-\mu$ $+\mu$

Véase también

Distribución acumulativa plegada
Distribución seminormal
La distribución seminormal modificada ^[1] con la función de densidad de probabilidad activada se da como , donde denota la función Psi de Fox–Wright . $(0,\infty )$ $f(x)={\frac {2\beta ^{\frac {\alpha }{2}}x^{\alpha -1}\exp(-\beta x^{2}+\gamma x)}{\Psi {\left({\frac {\alpha }{2}},{\frac {\gamma }{\sqrt {\beta }}}\right)}}}$ $\Psi (\alpha ,z)={}_{1}\Psi _{1}\left({\begin{matrix}\left(\alpha ,{\frac {1}{2}}\right)\\(1,0)\end{matrix}};z\right)$
Distribución normal truncada

Referencias

^ ab Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 de junio de 2021). "La distribución seminormal modificada: propiedades y un esquema de muestreo eficiente" (PDF) . Comunicaciones en estadística: teoría y métodos . 52 (5): 1591–1613. doi :10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.

Tsagris, M.; Beneki, C.; Hassani, H. (2014). "Sobre la distribución normal plegada". Matemáticas . 2 (1): 12–28. arXiv : 1402.3559 . doi : 10.3390/math2010012 .
Leone FC, Nottingham RB, Nelson LS (1961). "La distribución normal plegada". Technometrics . 3 (4): 543–550. doi :10.2307/1266560. hdl : 2027/mdp.39015095248541 . JSTOR 1266560.
Johnson NL (1962). "La distribución normal plegada: precisión de la estimación por máxima verosimilitud". Technometrics . 4 (2): 249–256. doi :10.2307/1266622. JSTOR 1266622.
Nelson LS (1980). "La distribución normal plegada". J Qual Technol . 12 (4): 236–238. doi :10.1080/00224065.1980.11980971. hdl : 2027/mdp.39015095248541 .
Elandt RC (1961). "La distribución normal plegada: dos métodos de estimación de parámetros a partir de momentos". Technometrics . 3 (4): 551–562. doi :10.2307/1266561. JSTOR 1266561.
Lin PC (2005). "Aplicación de la distribución normal plegada generalizada a las medidas de capacidad de proceso". Int J Adv Manuf Technol . 26 (7–8): 825–830. doi :10.1007/s00170-003-2043-x. S2CID 123589207.
Psarakis, S.; Panaretos, J. (1990). "La distribución t plegada". Communications in Statistics - Theory and Methods . 19 (7): 2717–2734. doi :10.1080/03610929008830342. S2CID 121332770.
Psarakis, S.; Panaretos, J. (2001). "Sobre algunas extensiones bivariadas de las distribuciones normal plegada y t plegada". Revista de Ciencias Estadísticas Aplicadas . 10 (2): 119–136.
Chakraborty, AK; Chatterjee, M. (2013). "Sobre la distribución normal plegada multivariante". Sankhyā: The Indian Journal of Statistics, Serie B . 75 (1): 1–15. JSTOR 42003783.

Enlaces externos

Random (antes Virtual Laboratories): La distribución normal plegada