Distribución de chi-cuadrado no central

En teoría de probabilidad y estadística , la distribución chi-cuadrado no central (o distribución chi-cuadrado no central, distribución no central $\chi ^{2}$ ) es una generalización no central de la distribución chi-cuadrado . Suele surgir en el análisis de potencia de pruebas estadísticas en las que la distribución nula es (quizás asintóticamente) una distribución chi-cuadrado; ejemplos importantes de dichas pruebas son las pruebas de razón de verosimilitud . ^[1]

Definiciones

Fondo

Sean k variables aleatorias independientes , distribuidas normalmente, con medias y varianzas unitarias. Entonces, la variable aleatoria $(X_{1},X_{2},\ldots ,X_{i},\ldots ,X_{k})$ $\mu_{i}$

\suma _{i=1}^{k}X_{i}^{2}

se distribuye según la distribución chi-cuadrado no central. Tiene dos parámetros: que especifica el número de grados de libertad (es decir, el número de ), y que está relacionado con la media de las variables aleatorias por: ${\estilo de visualización k}$ $Estilo de visualización X_{i}}$ $\lambda$ $X_{i}$

\lambda =\sum _{i=1}^{k}\mu _{i}^{2}.

$\lambda$ A veces se denomina parámetro de no centralidad . Tenga en cuenta que algunas referencias lo definen de otras maneras, como la mitad de la suma anterior o su raíz cuadrada. $\lambda$

Esta distribución surge en estadística multivariante como una derivada de la distribución normal multivariante . Mientras que la distribución chi-cuadrado central es la norma al cuadrado de un vector aleatorio con distribución (es decir, la distancia al cuadrado desde el origen hasta un punto tomado al azar de esa distribución), la no central es la norma al cuadrado de un vector aleatorio con distribución. Aquí hay un vector cero de longitud k , y es la matriz identidad de tamaño k . $N(0_{k},I_{k})$ $\chi ^{2}$ $N(\mu ,I_{k})$ $0_{k}$ $\mu =(\mu _{1},\ldots ,\mu _{k})$ $I_{k}$

Densidad

La función de densidad de probabilidad (pdf) está dada por

f_{X}(x;k,\lambda )=\sum _{i=0}^{\infty }{\frac {e^{-\lambda /2}(\lambda /2)^{i}}{i!}}f_{Y_{k+2i}}(x),

donde se distribuye como chi-cuadrado con grados de libertad. $Y_{q}$ $q$

A partir de esta representación, se observa que la distribución chi-cuadrado no central es una mezcla ponderada por Poisson de distribuciones chi-cuadrado centrales. Supongamos que una variable aleatoria J tiene una distribución de Poisson con media , y la distribución condicional de Z dado J = i es chi-cuadrado con k + 2 i grados de libertad. Entonces, la distribución incondicional de Z es chi-cuadrado no central con k grados de libertad y parámetro de no centralidad . $\lambda /2$ $\lambda$

Alternativamente, el pdf se puede escribir como

f_{X}(x;k,\lambda )={\frac {1}{2}}e^{-(x+\lambda )/2}\left({\frac {x}{\lambda }}\right)^{k/4-1/2}I_{k/2-1}({\sqrt {\lambda x}})

donde es una función de Bessel modificada del primer tipo dada por $I_{\nu }(y)$

I_{\nu }(y)=(y/2)^{\nu }\sum _{j=0}^{\infty }{\frac {(y^{2}/4)^{j}}{j!\Gamma (\nu +j+1)}}.

Utilizando la relación entre las funciones de Bessel y las funciones hipergeométricas , la función de densidad de probabilidad también se puede escribir como: ^[2]

f_{X}(x;k,\lambda )={{\rm {e}}^{-\lambda /2}}_{0}F_{1}(;k/2;\lambda x/4){\frac {1}{2^{k/2}\Gamma (k/2)}}{\rm {e}}^{-x/2}x^{k/2-1}.

El caso k = 0 ( cero grados de libertad ), en cuyo caso la distribución tiene un componente discreto en cero, es analizado por Torgersen (1972) y luego por Siegel (1979). ^[3]^[4]

Derivación del pdf

La derivación de la función de densidad de probabilidad se realiza más fácilmente realizando los siguientes pasos:

Dado que tienen variaciones unitarias, su distribución conjunta es esféricamente simétrica, hasta un desplazamiento de ubicación. $X_{1},\ldots ,X_{k}$
La simetría esférica implica entonces que la distribución de depende de las medias solo a través de la longitud al cuadrado, . Sin pérdida de generalidad, podemos tomar y . $X=X_{1}^{2}+\cdots +X_{k}^{2}$ $\lambda =\mu _{1}^{2}+\cdots +\mu _{k}^{2}$ $\mu _{1}={\sqrt {\lambda }}$ $\mu _{2}=\cdots =\mu _{k}=0$
Ahora, deriva la densidad de (es decir, el caso k = 1). La transformación simple de variables aleatorias muestra que $X=X_{1}^{2}$

{\begin{aligned}f_{X}(x,1,\lambda )&={\frac {1}{2{\sqrt {x}}}}\left(\phi ({\sqrt {x}}-{\sqrt {\lambda }})+\phi ({\sqrt {x}}+{\sqrt {\lambda }})\right)\\&={\frac {1}{\sqrt {2\pi x}}}e^{-(x+\lambda )/2}\cosh({\sqrt {\lambda x}}),\end{aligned}}

¿Dónde está la densidad normal estándar?

\phi (\cdot )

Expanda el término cosh en una serie de Taylor . Esto da la representación de la densidad de la mezcla ponderada por Poisson, siempre para k = 1. Los índices de las variables aleatorias de chi-cuadrado en la serie anterior son 1 + 2 i en este caso.
Finalmente, para el caso general, hemos asumido, sin pérdida de generalidad, que son normales estándar y, por lo tanto, tienen una distribución central de chi-cuadrado con ( k − 1) grados de libertad, independientemente de . Si utilizamos la representación de mezcla ponderada por Poisson para , y el hecho de que la suma de las variables aleatorias de chi-cuadrado también es un chi-cuadrado, completamos el resultado. Los índices de la serie son (1 + 2 i ) + ( k − 1) = k + 2 i como se requiere. $X_{2},\ldots ,X_{k}$ $X_{2}^{2}+\cdots +X_{k}^{2}$ $X_{1}^{2}$ $X_{1}^{2}$

Propiedades

Función generadora de momentos

La función generadora de momentos está dada por

M(t;k,\lambda )={\frac {\exp \left({\frac {\lambda t}{1-2t}}\right)}{(1-2t)^{k/2}}}.

Momentos

Los primeros momentos crudos son:

\mu '_{1}=k+\lambda

\mu '_{2}=(k+\lambda )^{2}+2(k+2\lambda )

\mu '_{3}=(k+\lambda )^{3}+6(k+\lambda )(k+2\lambda )+8(k+3\lambda )

\mu '_{4}=(k+\lambda )^{4}+12(k+\lambda )^{2}(k+2\lambda )+4(11k^{2}+44k\lambda +36\lambda ^{2})+48(k+4\lambda ).

Los primeros momentos centrales son:

\mu _{2}=2(k+2\lambda )\,

\mu _{3}=8(k+3\lambda )\,

\mu _{4}=12(k+2\lambda )^{2}+48(k+4\lambda )\,

El n -ésimo cumulante es

\kappa _{n}=2^{n-1}(n-1)!(k+n\lambda ).\,

Por eso

\mu '_{n}=2^{n-1}(n-1)!(k+n\lambda )+\sum _{j=1}^{n-1}{\frac {(n-1)!2^{j-1}}{(n-j)!}}(k+j\lambda )\mu '_{n-j}.

Función de distribución acumulativa

Nuevamente, utilizando la relación entre las distribuciones chi-cuadrado central y no central, la función de distribución acumulativa (cdf) se puede escribir como

P(x;k,\lambda )=e^{-\lambda /2}\;\sum _{j=0}^{\infty }{\frac {(\lambda /2)^{j}}{j!}}Q(x;k+2j)

donde es la función de distribución acumulativa de la distribución chi-cuadrado central con k grados de libertad que viene dada por $Q(x;k)\,$

Q(x;k)={\frac {\gamma (k/2,x/2)}{\Gamma (k/2)}}\,

¿Y dónde está la función gamma incompleta inferior ?

\gamma (k,z)\,

La función Q de Marcum también se puede utilizar para representar la CDF. ^[5] $Q_{M}(a,b)$

P(x;k,\lambda )=1-Q_{\frac {k}{2}}\left({\sqrt {\lambda }},{\sqrt {x}}\right)

Cuando los grados de libertad k son un entero impar positivo, tenemos una expresión en forma cerrada para la función de distribución acumulativa complementaria dada por ^[6]

{\begin{aligned}P(x;2n+1,\lambda )&=1-Q_{n+1/2}({\sqrt {\lambda }},{\sqrt {x}})\\&=1-\left[Q({\sqrt {x}}-{\sqrt {\lambda }})+Q({\sqrt {x}}+{\sqrt {\lambda }})+e^{-(x+\lambda )/2}\sum _{m=1}^{n}\left({\frac {x}{\lambda }}\right)^{m/2-1/4}I_{m-1/2}({\sqrt {\lambda x}})\right],\end{aligned}}

donde n es un entero no negativo, Q es la función Q gaussiana e I es la función de Bessel modificada de primera especie con orden semientero. La función de Bessel modificada de primera especie con orden semientero en sí misma puede representarse como una suma finita en términos de funciones hiperbólicas .

En particular, para k = 1, tenemos

P(x;1,\lambda )=1-\left[Q({\sqrt {x}}-{\sqrt {\lambda }})+Q({\sqrt {x}}+{\sqrt {\lambda }})\right].

Además, para k = 3, tenemos

P(x;3,\lambda )=1-\left[Q({\sqrt {x}}-{\sqrt {\lambda }})+Q({\sqrt {x}}+{\sqrt {\lambda }})+{\sqrt {\frac {2}{\pi }}}{\frac {\sinh({\sqrt {\lambda x}})}{\sqrt {\lambda }}}e^{-(x+\lambda )/2}\right].

Aproximación (incluso para cuantiles)

Abdel-Aty deriva (como "primera aproximación") una transformación de Wilson-Hilferty no central : ^[7]

$\left({\frac {\chi '^{2}}{k+\lambda }}\right)^{\frac {1}{3}}$ se distribuye aproximadamente de manera normal , es decir, $\sim {\mathcal {N}}\left(1-{\frac {2}{9f}},{\frac {2}{9f}}\right),$

P(x;k,\lambda )\approx \Phi \left\{{\frac {\left({\frac {x}{k+\lambda }}\right)^{1/3}-\left(1-{\frac {2}{9f}}\right)}{\sqrt {\frac {2}{9f}}}}\right\},{\text{where }}\ f:={\frac {(k+\lambda )^{2}}{k+2\lambda }}=k+{\frac {\lambda ^{2}}{k+2\lambda }},

lo cual es bastante preciso y se adapta bien a la no centralidad. Además, se convierte para , en el caso de chi-cuadrado (central) . $f=f(k,\lambda )$ $f=k$ $\lambda =0$

Sankaran analiza una serie de aproximaciones de forma cerrada para la función de distribución acumulativa . ^[8] En un artículo anterior, derivó y enuncia la siguiente aproximación: ^[9]

P(x;k,\lambda )\approx \Phi \left\{{\frac {({\frac {x}{k+\lambda }})^{h}-(1+hp(h-1-0.5(2-h)mp))}{h{\sqrt {2p}}(1+0.5mp)}}\right\}

dónde

\Phi \lbrace \cdot \rbrace \,

denota la función de distribución acumulativa de la distribución normal estándar ;

h=1-{\frac {2}{3}}{\frac {(k+\lambda )(k+3\lambda )}{(k+2\lambda )^{2}}}\,;

p={\frac {k+2\lambda }{(k+\lambda )^{2}}};

m=(h-1)(1-3h)\,.

Esta y otras aproximaciones se analizan en un libro de texto posterior. ^[10]

Más recientemente, dado que la CDF de una distribución chi-cuadrado no central con un grado de libertad impar se puede calcular con exactitud, la CDF para un grado de libertad par se puede aproximar explotando las propiedades de monotonía y concavidad logarítmica de la función Marcum-Q como

P(x;2n,\lambda )\approx {\frac {1}{2}}\left[P(x;2n-1,\lambda )+P(x;2n+1,\lambda )\right].

Otra aproximación que también sirve como límite superior está dada por

P(x;2n,\lambda )\approx 1-\left[(1-P(x;2n-1,\lambda ))(1-P(x;2n+1,\lambda ))\right]^{1/2}.

Para una probabilidad dada, estas fórmulas se invierten fácilmente para proporcionar la aproximación correspondiente para , para calcular cuantiles aproximados. $x$

Distribuciones relacionadas

Si la distribución de chi-cuadrado es no central , entonces la distribución de chi-cuadrado es también no central: $V$ $V\sim \chi _{k}^{2}$ $V$ $V\sim {\chi '}_{k}^{2}(0)$
Una combinación lineal de variables chi-cuadrado independientes no centrales se distribuye de forma chi-cuadrado generalizada . $\xi =\sum _{i}\lambda _{i}Y_{i}+c,\quad Y_{i}\sim \chi '^{2}(m_{i},\delta _{i}^{2})$
Si y y es independiente de entonces se desarrolla una variable no central distribuida en F como $V_{1}\sim {\chi '}_{k_{1}}^{2}(\lambda )$ $V_{2}\sim {\chi '}_{k_{2}}^{2}(0)$ $V_{1}$ $V_{2}$ ${\frac {V_{1}/k_{1}}{V_{2}/k_{2}}}\sim F'_{k_{1},k_{2}}(\lambda )$
Si , entonces $J\sim \mathrm {Poisson} \left({{\frac {1}{2}}\lambda }\right)$ $\chi _{k+2J}^{2}\sim {\chi '}_{k}^{2}(\lambda )$
Si , entonces toma la distribución de Rice con parámetro . $V\sim {\chi '}_{2}^{2}(\lambda )$ ${\sqrt {V}}$ ${\sqrt {\lambda }}$
Aproximación normal: ^[11] si , entonces en distribución como o . $V\sim {\chi '}_{k}^{2}(\lambda )$ ${\frac {V-(k+\lambda )}{\sqrt {2(k+2\lambda )}}}\to N(0,1)$ $k\to \infty$ $\lambda \to \infty$
Si y , donde son independientes, entonces donde . $V_{1}\sim {\chi '}_{k_{1}}^{2}(\lambda _{1})$ $V_{2}\sim {\chi '}_{k_{2}}^{2}(\lambda _{2})$ $V_{1},V_{2}$ $W=(V_{1}+V_{2})\sim {\chi '}_{k}^{2}(\lambda _{1}+\lambda _{2})$ $k=k_{1}+k_{2}$
En general, para un conjunto finito de , la suma de estas variables aleatorias distribuidas de manera chi-cuadrado no central tiene la distribución donde . Esto se puede ver utilizando funciones generadoras de momentos de la siguiente manera: por la independencia de las variables aleatorias. Queda por introducir la MGF para las distribuciones chi-cuadrado no centrales en el producto y calcular la nueva MGF; esto se deja como ejercicio. Alternativamente, se puede ver a través de la interpretación en la sección de antecedentes anterior como sumas de cuadrados de variables aleatorias independientes distribuidas normalmente con varianzas de 1 y las medias especificadas. $V_{i}\sim {\chi '}_{k_{i}}^{2}(\lambda _{i}),i\in \left\{1..N\right\}$ $Y=\sum _{i=1}^{N}V_{i}$ $Y\sim {\chi '}_{k_{y}}^{2}(\lambda _{y})$ $k_{y}=\sum _{i=1}^{N}k_{i},\lambda _{y}=\sum _{i=1}^{N}\lambda _{i}$ $M_{Y}(t)=M_{\sum _{i=1}^{N}V_{i}}(t)=\prod _{i=1}^{N}M_{V_{i}}(t)$ $V_{i}$
La distribución chi-cuadrado compleja no central tiene aplicaciones en sistemas de comunicación por radio y radar. ^{[ cita requerida ]} Sean variables aleatorias complejas escalares independientes con simetría circular no central, medias de y varianzas unitarias: . Entonces la variable aleatoria real se distribuye de acuerdo con la distribución chi-cuadrado compleja no central, que es efectivamente una distribución no central escalada (por 1/2) con el doble de grados de libertad y el doble del parámetro de no centralidad: $(z_{1},\ldots ,z_{k})$ $\mu _{i}$ $\operatorname {E} \left|z_{i}-\mu _{i}\right|^{2}=1$ $S=\sum _{i=1}^{k}\left|z_{i}\right|^{2}$ ${\chi '}^{2}$

f_{S}(S)=\left({\frac {S}{\lambda }}\right)^{(k-1)/2}e^{-(S+\lambda )}I_{k-1}(2{\sqrt {S\lambda }})

dónde

\lambda =\sum _{i=1}^{k}\left|\mu _{i}\right|^{2}.

Transformaciones

Sankaran (1963) analiza las transformaciones de la forma . Analiza las expansiones de los cumulantes de hasta el término y demuestra que las siguientes opciones de producen resultados razonables: $z=[(X-b)/(k+\lambda )]^{1/2}$ $z$ $O((k+\lambda )^{-4})$ $b$

$b=(k-1)/2$ hace que el segundo cumulante de sea aproximadamente independiente de $z$ $\lambda$
$b=(k-1)/3$ hace que el tercer cumulante de sea aproximadamente independiente de $z$ $\lambda$
$b=(k-1)/4$ hace que el cuarto cumulante de sea aproximadamente independiente de $z$ $\lambda$

Además, se puede utilizar una transformación más simple como transformación estabilizadora de varianza que produce una variable aleatoria con media y varianza . $z_{1}=(X-(k-1)/2)^{1/2}$ $(\lambda +(k-1)/2)^{1/2}$ $O((k+\lambda )^{-2})$

La usabilidad de estas transformaciones puede verse obstaculizada por la necesidad de tomar las raíces cuadradas de números negativos.

Ocurrencia y aplicaciones

Utilizar en intervalos de tolerancia

Los intervalos de tolerancia de regresión normal bilateral se pueden obtener basándose en la distribución de chi-cuadrado no central. ^[12] Esto permite el cálculo de un intervalo estadístico dentro del cual, con cierto nivel de confianza, cae una proporción específica de una población muestreada.

Notas

^ Patnaik, PB (1949). "La distribución no central de χ2 y F y sus aplicaciones". Biometrika . 36 (1/2): 202–232. doi :10.2307/2332542. ISSN 0006-3444.
^ Muirhead (2005) Teorema 1.3.4
^ Torgersen, EN (1972), "Notas suplementarias sobre modelos lineales", Serie de preimpresiones: Memorias estadísticas, Departamento de Matemáticas, Universidad de Oslo, http://urn.nb.no/URN:NBN:no-58681
^ Siegel, AF (1979), "La distribución chi-cuadrado no central con cero grados de libertad y prueba de uniformidad", Biometrika , 66, 381–386
^ Nuttall, Albert H. (1975): Algunas integrales que involucran la función QM , IEEE Transactions on Information Theory , 21(1), 95–96, ISSN 0018-9448
^ A. Annamalai, C. Tellambura y John Matyjas (2009). "Un nuevo giro en la función Q generalizada de Marcum Q _M ( a , b ) con orden fraccionario M y sus aplicaciones". 2009 6th IEEE Consumer Communications and Networking Conference , 1–5, ISBN 978-1-4244-2308-8
^ Abdel-Aty, S. (1954). "Fórmulas aproximadas para los puntos porcentuales y la integral de probabilidad de la distribución χ2 no central". Biometrika . 41 : 538–540. JSTOR 2332731.
^ Sankaran, M. (1963). "Aproximaciones a la distribución chi-cuadrado no central". Biometrika . 50 (1–2): 199–204. doi :10.1093/biomet/50.1-2.199.
^ Sankaran, M. (1959). "Sobre la distribución chi-cuadrado no central". Biometrika . 46 (1–2): 235–237. doi :10.1093/biomet/46.1-2.235.
^ Johnson et al. (1995) Distribuciones univariadas continuas Sección 29.8
^ Muirhead (2005) páginas 22–24 y problema 1.18.
^ Derek S. Young (agosto de 2010). «tolerancia: un paquete R para estimar intervalos de tolerancia». Journal of Statistical Software . 36 (5): 1–39. ISSN 1548-7660 . Consultado el 19 de febrero de 2013 ., pág. 32

Referencias

Abramowitz, M. y Stegun, IA (1972), Manual de funciones matemáticas , Dover.
Johnson, NL, Kotz, S., Balakrishnan, N. (1995), Distribuciones univariadas continuas, volumen 2 (segunda edición) , Wiley. ISBN 0-471-58494-0
Muirhead, R. (2005) Aspectos de la teoría estadística multivariante (2.ª edición). Wiley. ISBN 0-471-76985-1
Press, SJ (1966), "Combinaciones lineales de variables chi-cuadrado no centrales", The Annals of Mathematical Statistics , 37 (2): 480–487, doi : 10.1214/aoms/1177699531 , JSTOR 2238621