stringtranslate.com

Distribución chi-cuadrado no central

En teoría de probabilidad y estadística , la distribución chi-cuadrado no central (o distribución chi-cuadrado no central, distribución no central ) es una generalización no central de la distribución chi-cuadrado . A menudo surge en el análisis de potencia de pruebas estadísticas en las que la distribución nula es (quizás asintóticamente) una distribución chi-cuadrado; Ejemplos importantes de tales pruebas son las pruebas de razón de verosimilitud . [1]

Definiciones

Fondo

Sean k variables aleatorias independientes , distribuidas normalmente con medias y varianzas unitarias. Entonces la variable aleatoria

se distribuye según la distribución chi-cuadrado no central. Tiene dos parámetros: que especifica el número de grados de libertad (es decir, el número de ) y que está relacionado con la media de las variables aleatorias mediante:

A veces se le llama parámetro de no centralidad . Tenga en cuenta que algunas referencias se definen de otras maneras, como la mitad de la suma anterior o su raíz cuadrada.

Esta distribución surge en la estadística multivariada como una derivada de la distribución normal multivariada . Mientras que la distribución chi-cuadrado central es la norma al cuadrado de un vector aleatorio con distribución (es decir, la distancia al cuadrado desde el origen hasta un punto tomado al azar de esa distribución), la no central es la norma al cuadrado de un vector aleatorio con distribución. Aquí hay un vector cero de longitud k y es la matriz identidad de tamaño k .

Densidad

La función de densidad de probabilidad (pdf) está dada por

donde se distribuye como chi-cuadrado con grados de libertad.

A partir de esta representación, la distribución chi-cuadrado no central se ve como una mezcla ponderada de Poisson de distribuciones chi-cuadrado centrales. Supongamos que una variable aleatoria J tiene una distribución de Poisson con media y la distribución condicional de Z dado J  =  i es chi-cuadrado con k  + 2 i grados de libertad. Entonces, la distribución incondicional de Z es chi-cuadrado no central con k grados de libertad y parámetro de no centralidad .

Alternativamente, el pdf se puede escribir como

donde es una función de Bessel modificada del primer tipo dada por

Usando la relación entre funciones de Bessel y funciones hipergeométricas , la pdf también se puede escribir como: [2]

El caso k  = 0 ( cero grados de libertad ), en cuyo caso la distribución tiene un componente discreto en cero, es discutido por Torgersen (1972) y más adelante por Siegel (1979).

Derivación del pdf

La derivación de la función de densidad de probabilidad se realiza más fácilmente realizando los siguientes pasos:

  1. Dado que tienen variaciones unitarias, su distribución conjunta es esféricamente simétrica, hasta un cambio de ubicación.
  2. La simetría esférica implica entonces que la distribución de depende de la media sólo a través de la longitud al cuadrado, . Por tanto, sin pérdida de generalidad, podemos tomar y .
  3. Ahora deduzca la densidad de (es decir, el caso k  = 1). La transformación simple de variables aleatorias muestra que
¿Dónde está la densidad normal estándar?
  1. Ampliar el término de cosh en una serie de Taylor . Esto da la representación de la mezcla ponderada de Poisson de la densidad, aún para k  = 1. Los índices de las variables aleatorias chi-cuadrado en la serie anterior son 1 + 2 i en este caso.
  2. Finalmente, para el caso general. Hemos asumido, sin pérdida de generalidad, que son normales estándar y, por lo tanto, tienen una distribución chi-cuadrado central con ( k  − 1) grados de libertad, independientemente de . El uso de la representación de mezcla ponderada de Poisson para , y el hecho de que la suma de variables aleatorias chi-cuadrado también es un chi-cuadrado, completa el resultado. Los índices de la serie son (1 + 2 i ) + ( k  − 1) =  k  + 2 i según sea necesario.

Propiedades

Función generadora de momento

La función generadora de momento está dada por

Momentos

Los primeros momentos crudos son:

Los primeros momentos centrales son:

El enésimo acumulante es ​

Por eso

Función de distribución acumulativa

Utilizando nuevamente la relación entre las distribuciones chi-cuadrado central y no central, la función de distribución acumulativa (cdf) se puede escribir como

donde es la función de distribución acumulativa de la distribución central chi-cuadrado con k grados de libertad que viene dada por

y dónde está la función gamma incompleta inferior .

La función Q de Marcum también se puede utilizar para representar la cdf. [3]

Cuando los grados de libertad k son un entero impar positivo, tenemos una expresión en forma cerrada para la función de distribución acumulativa complementaria dada por [4]

donde n es un número entero no negativo, Q es la función Q gaussiana e I es la función de Bessel modificada de primer tipo con orden semientero. La función de Bessel modificada de primer tipo con orden semientero en sí misma se puede representar como una suma finita en términos de funciones hiperbólicas .

En particular, para k = 1, tenemos

Además, para k = 3, tenemos

Aproximación (incluso para cuantiles)

Abdel-Aty [5] deriva (como "primera aproximación") una transformación no central de Wilson-Hilferty :

tiene una distribución aproximadamente normal , es decir,

lo cual es bastante preciso y se adapta bien a la no centralidad. Además, para , se convierte en el caso de chi-cuadrado (central) .

Sankaran [6] analiza una serie de aproximaciones de forma cerrada para la función de distribución acumulativa . En un artículo anterior, [7] derivó y afirmó la siguiente aproximación:

dónde

denota la función de distribución acumulativa de la distribución normal estándar ;

Esta y otras aproximaciones se analizan en un libro de texto posterior. [8]

Más recientemente, dado que la CDF de una distribución chi-cuadrado no central con grados de libertad impares se puede calcular exactamente, la CDF para grados pares de libertad se puede aproximar explotando las propiedades de monotonicidad y concavidad logarítmica de la función Marcum-Q como

Otra aproximación que también sirve como límite superior está dada por

Para una probabilidad dada, estas fórmulas se invierten fácilmente para proporcionar la aproximación correspondiente a , para calcular cuantiles aproximados.

Distribuciones relacionadas

dónde

Transformaciones

Sankaran (1963) analiza las transformaciones de la forma . Analiza las expansiones de los cumulantes de hasta el término y muestra que las siguientes elecciones de producen resultados razonables:

Además, se puede utilizar una transformación más simple como transformación estabilizadora de la varianza que produce una variable aleatoria con media y varianza .

La usabilidad de estas transformaciones puede verse obstaculizada por la necesidad de extraer raíces cuadradas de números negativos.

Ocurrencia y aplicaciones

Uso en intervalos de tolerancia.

Se pueden obtener intervalos de tolerancia de regresión normal bilaterales basándose en la distribución chi-cuadrado no central. [10] Esto permite calcular un intervalo estadístico dentro del cual, con cierto nivel de confianza, se encuentra una proporción específica de una población muestreada.

Notas

  1. ^ Patnaik, PB (1949). "La distribución no central χ2 y F y sus aplicaciones". Biometrika . 36 (1/2): 202–232. doi :10.2307/2332542. ISSN  0006-3444.
  2. ^ Muirhead (2005) Teorema 1.3.4
  3. ^ Nuttall, Albert H. (1975): Algunas integrales que involucran la función QM , IEEE Transactions on Information Theory , 21(1), 95–96, ISSN  0018-9448
  4. ^ A. Annamalai, C. Tellambura y John Matyjas (2009). "Un nuevo giro en la función Q generalizada de Marcum Q M ( ab ) con orden fraccional M y sus aplicaciones". 2009 Sexta Conferencia de redes y comunicaciones del consumidor del IEEE , 1–5, ISBN 978-1-4244-2308-8 
  5. ^ Abdel-Aty, S. (1954). Fórmulas aproximadas para los puntos porcentuales y la integral de probabilidad de la distribución no central de χ2 Biometrika 41, 538–540. doi:10.2307/2332731
  6. ^ Sankaran, M. (1963). Aproximaciones a la distribución de chi-cuadrado no central Biometrika , 50(1-2), 199–204
  7. ^ Sankaran, M. (1959). "Sobre la distribución de chi-cuadrado no central", Biometrika 46, 235–237
  8. ^ Johnson y col. (1995) Distribuciones univariadas continuas Sección 29.8
  9. ^ Muirhead (2005) páginas 22-24 y problema 1.18.
  10. ^ Derek S. Young (agosto de 2010). "tolerancia: un paquete R para estimar intervalos de tolerancia". Revista de software estadístico . 36 (5): 1–39. ISSN  1548-7660 . Consultado el 19 de febrero de 2013 ., pag. 32

Referencias