stringtranslate.com

Distribución de chi-cuadrado no central

En teoría de probabilidad y estadística , la distribución chi-cuadrado no central (o distribución chi-cuadrado no central, distribución no central ) es una generalización no central de la distribución chi-cuadrado . Suele surgir en el análisis de potencia de pruebas estadísticas en las que la distribución nula es (quizás asintóticamente) una distribución chi-cuadrado; ejemplos importantes de dichas pruebas son las pruebas de razón de verosimilitud . [1]

Definiciones

Fondo

Sean k variables aleatorias independientes , distribuidas normalmente, con medias y varianzas unitarias. Entonces, la variable aleatoria

se distribuye según la distribución chi-cuadrado no central. Tiene dos parámetros: que especifica el número de grados de libertad (es decir, el número de ), y que está relacionado con la media de las variables aleatorias por:

A veces se denomina parámetro de no centralidad . Tenga en cuenta que algunas referencias lo definen de otras maneras, como la mitad de la suma anterior o su raíz cuadrada.

Esta distribución surge en estadística multivariante como una derivada de la distribución normal multivariante . Mientras que la distribución chi-cuadrado central es la norma al cuadrado de un vector aleatorio con distribución (es decir, la distancia al cuadrado desde el origen hasta un punto tomado al azar de esa distribución), la no central es la norma al cuadrado de un vector aleatorio con distribución. Aquí hay un vector cero de longitud k , y es la matriz identidad de tamaño k .

Densidad

La función de densidad de probabilidad (pdf) está dada por

donde se distribuye como chi-cuadrado con grados de libertad.

A partir de esta representación, se observa que la distribución chi-cuadrado no central es una mezcla ponderada por Poisson de distribuciones chi-cuadrado centrales. Supongamos que una variable aleatoria J tiene una distribución de Poisson con media , y la distribución condicional de Z dado J  =  i es chi-cuadrado con k  + 2 i grados de libertad. Entonces, la distribución incondicional de Z es chi-cuadrado no central con k grados de libertad y parámetro de no centralidad .

Alternativamente, el pdf se puede escribir como

donde es una función de Bessel modificada del primer tipo dada por

Utilizando la relación entre las funciones de Bessel y las funciones hipergeométricas , la función de densidad de probabilidad también se puede escribir como: [2]

El caso k  = 0 ( cero grados de libertad ), en cuyo caso la distribución tiene un componente discreto en cero, es analizado por Torgersen (1972) y luego por Siegel (1979). [3] [4]

Derivación del pdf

La derivación de la función de densidad de probabilidad se realiza más fácilmente realizando los siguientes pasos:

  1. Dado que tienen variaciones unitarias, su distribución conjunta es esféricamente simétrica, hasta un desplazamiento de ubicación.
  2. La simetría esférica implica entonces que la distribución de depende de las medias solo a través de la longitud al cuadrado, . Sin pérdida de generalidad, podemos tomar y .
  3. Ahora, deriva la densidad de (es decir, el caso k  = 1). La transformación simple de variables aleatorias muestra que
¿Dónde está la densidad normal estándar?
  1. Expanda el término cosh en una serie de Taylor . Esto da la representación de la densidad de la mezcla ponderada por Poisson, siempre para k  = 1. Los índices de las variables aleatorias de chi-cuadrado en la serie anterior son 1 + 2 i en este caso.
  2. Finalmente, para el caso general, hemos asumido, sin pérdida de generalidad, que son normales estándar y, por lo tanto, tienen una distribución central de chi-cuadrado con ( k  − 1) grados de libertad, independientemente de . Si utilizamos la representación de mezcla ponderada por Poisson para , y el hecho de que la suma de las variables aleatorias de chi-cuadrado también es un chi-cuadrado, completamos el resultado. Los índices de la serie son (1 + 2 i ) + ( k  − 1) =  k  + 2 i como se requiere.

Propiedades

Función generadora de momentos

La función generadora de momentos está dada por

Momentos

Los primeros momentos crudos son:

Los primeros momentos centrales son:

El n -ésimo cumulante es

Por eso

Función de distribución acumulativa

Nuevamente, utilizando la relación entre las distribuciones chi-cuadrado central y no central, la función de distribución acumulativa (cdf) se puede escribir como

donde es la función de distribución acumulativa de la distribución chi-cuadrado central con k grados de libertad que viene dada por

¿Y dónde está la función gamma incompleta inferior ?

La función Q de Marcum también se puede utilizar para representar la CDF. [5]

Cuando los grados de libertad k son un entero impar positivo, tenemos una expresión en forma cerrada para la función de distribución acumulativa complementaria dada por [6]

donde n es un entero no negativo, Q es la función Q gaussiana e I es la función de Bessel modificada de primera especie con orden semientero. La función de Bessel modificada de primera especie con orden semientero en sí misma puede representarse como una suma finita en términos de funciones hiperbólicas .

En particular, para k = 1, tenemos

Además, para k = 3, tenemos

Aproximación (incluso para cuantiles)

Abdel-Aty deriva (como "primera aproximación") una transformación de Wilson-Hilferty no central : [7]

se distribuye aproximadamente de manera normal , es decir,

lo cual es bastante preciso y se adapta bien a la no centralidad. Además, se convierte para , en el caso de chi-cuadrado (central) .

Sankaran analiza una serie de aproximaciones de forma cerrada para la función de distribución acumulativa . [8] En un artículo anterior, derivó y enuncia la siguiente aproximación: [9]

dónde

denota la función de distribución acumulativa de la distribución normal estándar ;

Esta y otras aproximaciones se analizan en un libro de texto posterior. [10]

Más recientemente, dado que la CDF de una distribución chi-cuadrado no central con un grado de libertad impar se puede calcular con exactitud, la CDF para un grado de libertad par se puede aproximar explotando las propiedades de monotonía y concavidad logarítmica de la función Marcum-Q como

Otra aproximación que también sirve como límite superior está dada por

Para una probabilidad dada, estas fórmulas se invierten fácilmente para proporcionar la aproximación correspondiente para , para calcular cuantiles aproximados.

Distribuciones relacionadas

dónde

Transformaciones

Sankaran (1963) analiza las transformaciones de la forma . Analiza las expansiones de los cumulantes de hasta el término y demuestra que las siguientes opciones de producen resultados razonables:

Además, se puede utilizar una transformación más simple como transformación estabilizadora de varianza que produce una variable aleatoria con media y varianza .

La usabilidad de estas transformaciones puede verse obstaculizada por la necesidad de tomar las raíces cuadradas de números negativos.

Ocurrencia y aplicaciones

Utilizar en intervalos de tolerancia

Los intervalos de tolerancia de regresión normal bilateral se pueden obtener basándose en la distribución de chi-cuadrado no central. [12] Esto permite el cálculo de un intervalo estadístico dentro del cual, con cierto nivel de confianza, cae una proporción específica de una población muestreada.

Notas

  1. ^ Patnaik, PB (1949). "La distribución no central de χ2 y F y sus aplicaciones". Biometrika . 36 (1/2): 202–232. doi :10.2307/2332542. ISSN  0006-3444.
  2. ^ Muirhead (2005) Teorema 1.3.4
  3. ^ Torgersen, EN (1972), "Notas suplementarias sobre modelos lineales", Serie de preimpresiones: Memorias estadísticas, Departamento de Matemáticas, Universidad de Oslo, http://urn.nb.no/URN:NBN:no-58681
  4. ^ Siegel, AF (1979), "La distribución chi-cuadrado no central con cero grados de libertad y prueba de uniformidad", Biometrika , 66, 381–386
  5. ^ Nuttall, Albert H. (1975): Algunas integrales que involucran la función QM , IEEE Transactions on Information Theory , 21(1), 95–96, ISSN  0018-9448
  6. ^ A. Annamalai, C. Tellambura y John Matyjas (2009). "Un nuevo giro en la función Q generalizada de Marcum Q M ( ab ) con orden fraccionario M y sus aplicaciones". 2009 6th IEEE Consumer Communications and Networking Conference , 1–5, ISBN 978-1-4244-2308-8 
  7. ^ Abdel-Aty, S. (1954). "Fórmulas aproximadas para los puntos porcentuales y la integral de probabilidad de la distribución χ2 no central". Biometrika . 41 : 538–540. JSTOR  2332731.
  8. ^ Sankaran, M. (1963). "Aproximaciones a la distribución chi-cuadrado no central". Biometrika . 50 (1–2): 199–204. doi :10.1093/biomet/50.1-2.199.
  9. ^ Sankaran, M. (1959). "Sobre la distribución chi-cuadrado no central". Biometrika . 46 (1–2): 235–237. doi :10.1093/biomet/46.1-2.235.
  10. ^ Johnson et al. (1995) Distribuciones univariadas continuas Sección 29.8
  11. ^ Muirhead (2005) páginas 22–24 y problema 1.18.
  12. ^ Derek S. Young (agosto de 2010). «tolerancia: un paquete R para estimar intervalos de tolerancia». Journal of Statistical Software . 36 (5): 1–39. ISSN  1548-7660 . Consultado el 19 de febrero de 2013 ., pág. 32

Referencias