Generalización no central de la distribución chi-cuadrado.
En teoría de probabilidad y estadística , la distribución chi-cuadrado no central (o distribución chi-cuadrado no central, distribución no central ) es una generalización no central de la distribución chi-cuadrado . A menudo surge en el análisis de potencia de pruebas estadísticas en las que la distribución nula es (quizás asintóticamente) una distribución chi-cuadrado; Ejemplos importantes de tales pruebas son las pruebas de razón de verosimilitud . [1]
Definiciones
Fondo
Sean k variables aleatorias independientes , distribuidas normalmente con medias y varianzas unitarias. Entonces la variable aleatoria
se distribuye según la distribución chi-cuadrado no central. Tiene dos parámetros: que especifica el número de grados de libertad (es decir, el número de ) y que está relacionado con la media de las variables aleatorias mediante:
A veces se le llama parámetro de no centralidad . Tenga en cuenta que algunas referencias se definen de otras maneras, como la mitad de la suma anterior o su raíz cuadrada.
Esta distribución surge en la estadística multivariada como una derivada de la distribución normal multivariada . Mientras que la distribución chi-cuadrado central es la norma al cuadrado de un vector aleatorio con distribución (es decir, la distancia al cuadrado desde el origen hasta un punto tomado al azar de esa distribución), la no central es la norma al cuadrado de un vector aleatorio con distribución. Aquí hay un vector cero de longitud k y es la matriz identidad de tamaño k .
Densidad
La función de densidad de probabilidad (pdf) está dada por
donde se distribuye como chi-cuadrado con grados de libertad.
A partir de esta representación, la distribución chi-cuadrado no central se ve como una mezcla ponderada de Poisson de distribuciones chi-cuadrado centrales. Supongamos que una variable aleatoria J tiene una distribución de Poisson con media y la distribución condicional de Z dado J = i es chi-cuadrado con k + 2 i grados de libertad. Entonces, la distribución incondicional de Z es chi-cuadrado no central con k grados de libertad y parámetro de no centralidad .
Alternativamente, el pdf se puede escribir como
donde es una función de Bessel modificada del primer tipo dada por
Usando la relación entre funciones de Bessel y funciones hipergeométricas , la pdf también se puede escribir como: [2]
El caso k = 0 ( cero grados de libertad ), en cuyo caso la distribución tiene un componente discreto en cero, es discutido por Torgersen (1972) y más adelante por Siegel (1979).
Derivación del pdf
La derivación de la función de densidad de probabilidad se realiza más fácilmente realizando los siguientes pasos:
- Dado que tienen variaciones unitarias, su distribución conjunta es esféricamente simétrica, hasta un cambio de ubicación.
- La simetría esférica implica entonces que la distribución de depende de la media sólo a través de la longitud al cuadrado, . Por tanto, sin pérdida de generalidad, podemos tomar y .
- Ahora deduzca la densidad de (es decir, el caso k = 1). La transformación simple de variables aleatorias muestra que
- ¿Dónde está la densidad normal estándar?
- Ampliar el término de cosh en una serie de Taylor . Esto da la representación de la mezcla ponderada de Poisson de la densidad, aún para k = 1. Los índices de las variables aleatorias chi-cuadrado en la serie anterior son 1 + 2 i en este caso.
- Finalmente, para el caso general. Hemos asumido, sin pérdida de generalidad, que son normales estándar y, por lo tanto, tienen una distribución chi-cuadrado central con ( k − 1) grados de libertad, independientemente de . El uso de la representación de mezcla ponderada de Poisson para , y el hecho de que la suma de variables aleatorias chi-cuadrado también es un chi-cuadrado, completa el resultado. Los índices de la serie son (1 + 2 i ) + ( k − 1) = k + 2 i según sea necesario.
Propiedades
Función generadora de momento
La función generadora de momento está dada por
Momentos
Los primeros momentos crudos son:
Los primeros momentos centrales son:
El enésimo acumulante es
Por eso
Función de distribución acumulativa
Utilizando nuevamente la relación entre las distribuciones chi-cuadrado central y no central, la función de distribución acumulativa (cdf) se puede escribir como
donde es la función de distribución acumulativa de la distribución central chi-cuadrado con k grados de libertad que viene dada por
- y dónde está la función gamma incompleta inferior .
La función Q de Marcum también se puede utilizar para representar la cdf. [3]
Cuando los grados de libertad k son un entero impar positivo, tenemos una expresión en forma cerrada para la función de distribución acumulativa complementaria dada por [4]
donde n es un número entero no negativo, Q es la función Q gaussiana e I es la función de Bessel modificada de primer tipo con orden semientero. La función de Bessel modificada de primer tipo con orden semientero en sí misma se puede representar como una suma finita en términos de funciones hiperbólicas .
En particular, para k = 1, tenemos
Además, para k = 3, tenemos
Aproximación (incluso para cuantiles)
Abdel-Aty [5] deriva (como "primera aproximación") una transformación no central de Wilson-Hilferty :
tiene una distribución aproximadamente normal , es decir,
lo cual es bastante preciso y se adapta bien a la no centralidad. Además, para , se convierte en el caso de chi-cuadrado (central) .
Sankaran [6] analiza una serie de aproximaciones de forma cerrada para la función de distribución acumulativa . En un artículo anterior, [7] derivó y afirmó la siguiente aproximación:
dónde
- denota la función de distribución acumulativa de la distribución normal estándar ;
Esta y otras aproximaciones se analizan en un libro de texto posterior. [8]
Más recientemente, dado que la CDF de una distribución chi-cuadrado no central con grados de libertad impares se puede calcular exactamente, la CDF para grados pares de libertad se puede aproximar explotando las propiedades de monotonicidad y concavidad logarítmica de la función Marcum-Q como
Otra aproximación que también sirve como límite superior está dada por
Para una probabilidad dada, estas fórmulas se invierten fácilmente para proporcionar la aproximación correspondiente a , para calcular cuantiles aproximados.
Distribuciones relacionadas
- Si el chi-cuadrado está distribuido, entonces también está distribuido el chi-cuadrado no central:
- Una combinación lineal de variables chi-cuadrado independientes no centrales se distribuye chi-cuadrado generalizado .
- Si y y es independiente de entonces se desarrolla una variable distribuida F no central como
- Si entonces
- Si , entonces toma la distribución de Rice con el parámetro .
- Aproximación normal: [9] si , entonces en distribución como o .
- Si y donde son independientes, entonces donde .
- En general, para un conjunto finito de , la suma de estas variables aleatorias distribuidas chi-cuadrado no centrales tiene la distribución donde . Esto se puede ver usando funciones generadoras de momentos de la siguiente manera: por la independencia de las variables aleatorias. Queda por introducir el MGF para las distribuciones de chi cuadrado no centrales en el producto y calcular el nuevo MGF; esto se deja como ejercicio. Alternativamente, se puede ver a través de la interpretación en la sección de antecedentes anterior como sumas de cuadrados de variables aleatorias independientes distribuidas normalmente con varianzas de 1 y las medias especificadas.
- La compleja distribución chi-cuadrado no central tiene aplicaciones en sistemas de radar y comunicaciones por radio. [ cita necesaria ] Sean variables aleatorias complejas escalares independientes con simetría circular no central, medias y varianzas unitarias :. Luego, la variable aleatoria real se distribuye de acuerdo con la compleja distribución chi-cuadrado no central, que es efectivamente una no central escalada (a la mitad) con el doble de grado de libertad y el doble de parámetro de no centralidad:
- dónde
Transformaciones
Sankaran (1963) analiza las transformaciones de la forma . Analiza las expansiones de los cumulantes de hasta el término y muestra que las siguientes elecciones de producen resultados razonables:
- hace que el segundo acumulante de aproximadamente sea independiente de
- hace que el tercer acumulante de aproximadamente sea independiente de
- hace que el cuarto acumulante de aproximadamente sea independiente de
Además, se puede utilizar una transformación más simple como transformación estabilizadora de la varianza que produce una variable aleatoria con media y varianza .
La usabilidad de estas transformaciones puede verse obstaculizada por la necesidad de extraer raíces cuadradas de números negativos.
Ocurrencia y aplicaciones
Uso en intervalos de tolerancia.
Se pueden obtener intervalos de tolerancia de regresión normal bilaterales basándose en la distribución chi-cuadrado no central. [10] Esto permite calcular un intervalo estadístico dentro del cual, con cierto nivel de confianza, se encuentra una proporción específica de una población muestreada.
Notas
- ^ Patnaik, PB (1949). "La distribución no central χ2 y F y sus aplicaciones". Biometrika . 36 (1/2): 202–232. doi :10.2307/2332542. ISSN 0006-3444.
- ^ Muirhead (2005) Teorema 1.3.4
- ^ Nuttall, Albert H. (1975): Algunas integrales que involucran la función QM , IEEE Transactions on Information Theory , 21(1), 95–96, ISSN 0018-9448
- ^ A. Annamalai, C. Tellambura y John Matyjas (2009). "Un nuevo giro en la función Q generalizada de Marcum Q M ( a , b ) con orden fraccional M y sus aplicaciones". 2009 Sexta Conferencia de redes y comunicaciones del consumidor del IEEE , 1–5, ISBN 978-1-4244-2308-8
- ^ Abdel-Aty, S. (1954). Fórmulas aproximadas para los puntos porcentuales y la integral de probabilidad de la distribución no central de χ2 Biometrika 41, 538–540. doi:10.2307/2332731
- ^ Sankaran, M. (1963). Aproximaciones a la distribución de chi-cuadrado no central Biometrika , 50(1-2), 199–204
- ^ Sankaran, M. (1959). "Sobre la distribución de chi-cuadrado no central", Biometrika 46, 235–237
- ^ Johnson y col. (1995) Distribuciones univariadas continuas Sección 29.8
- ^ Muirhead (2005) páginas 22-24 y problema 1.18.
- ^ Derek S. Young (agosto de 2010). "tolerancia: un paquete R para estimar intervalos de tolerancia". Revista de software estadístico . 36 (5): 1–39. ISSN 1548-7660 . Consultado el 19 de febrero de 2013 ., pag. 32
Referencias
- Abramowitz, M. y Stegun, IA (1972), Manual de funciones matemáticas , Dover.
- Johnson, NL, Kotz, S., Balakrishnan, N. (1995), Distribuciones univariadas continuas, volumen 2 (segunda edición) , Wiley. ISBN 0-471-58494-0
- Muirhead, R. (2005) Aspectos de la teoría estadística multivariada (segunda edición). Wiley. ISBN 0-471-76985-1
- Torgersen, EN (1972), "Notas complementarias sobre modelos lineales", Serie preimpresa: Memorias estadísticas, Departamento de Matemáticas, Universidad de Oslo, http://urn.nb.no/URN:NBN:no-58681
- Siegel, AF (1979), "La distribución de chi-cuadrado no central con cero grados de libertad y pruebas de uniformidad", Biometrika , 66, 381–386
- Press, SJ (1966), "Combinaciones lineales de variables de chi-cuadrado no centrales", The Annals of Mathematical Statistics , 37 (2): 480–487, doi : 10.1214/aoms/1177699531 , JSTOR 2238621