Distribución t no central

En Teoría de la probabilidad y Estadística, la distribución t no central generaliza la distribución t de Student mediante un parámetro de no centralidad.

También se utiliza en la modelización robusta de datos.

Se dice[1]​ que la variable aleatoria

Debe tenerse en cuenta que el parámetro de no centralidad puede ser negativo.

Comentario sobre los grados de libertad no enteros.

Esto es correcto gracias a que una distribución χ² cuadrado está bien definida para

La función de densidad de la distribución t no central no tiene una expresión sencilla y veremos diversas formulaciones que aparecen en la literatura.

{\displaystyle f(t)={\frac {\nu ^{\nu /2}\,e^{-{\frac {\mu ^{2}\nu }{2(\nu +t^{2})}}}}{{\sqrt {\pi }}\,2^{\frac {\nu -1}{2}}\,\Gamma ({\frac {\nu }{2}})\,(\nu +t^{2})^{\frac {\nu +1}{2}}}}\int _{0}^{\infty }z^{\nu }e^{-{\frac {1}{2}}{\Big (}z-{\frac {t\mu }{\sqrt {\nu +t^{2}}}}{\Big )}^{2}}\,dz,\quad t\in \mathbb {R} .\qquad \qquad (1)}

es un número natural, esta fórmula puede escribirse en términos de la función

Expresión en términos de la función de distribución El software estadístico R y otros programas estadísticos utilizan la siguiente expresión para calcular la función de densidad [1]:

, la función de densidad conjunta del vector

Esta función es biyectiva de clase

A continuación se razona que puede intercambiarse la integral con el sumatorio y se llega a

Ahora se calcula cada integral mediante el cambio de variable

La fórmula (3) se deduce de la fórmula (1) utilizando la representación integral de la función cilíndrica parabólica

La fórmula (4) se obtiene a partir de (3) mediante la relación entre las funciones cilíndricas parabólicas y las funciones hipergeométricas confluentes [10]​ [11]​ [12]​

es simétrica respecto al 0 y que la función

que hemos calculado antes sólo depende de

Aplicando la fórmula de duplicación de la función beta y simplificando, juntando todos los términos del sumatorio, se obtiene

Pero como se comprueba a partir de (1) o (2),

no central es [17]​ En particular, la media y la varianza son:

Por un lado, para la distribución normal estándar

Por otra parte, debido a que

, podemos calcular la siguiente integral para cualquier número natural

, y la integral de la derecha da

son independientes y todas tienen distribución

(por tanto, de la hipótesis alternativa), podemos calcular la potencia del test, es decir, la probabilidad de rechazar la hipótesis nula cuando es falsa, en este punto, de la siguiente manera: escribimos

Por tanto, la potencia del test en el punto

Los intervalos de tolerancia normales unilaterales tienen una solución exacta en términos de la media muestral y la varianza muestral basada en la distribución t no central.

[19]​ Esto permite calcular un intervalo estadístico dentro del cual, con cierto nivel de confianza, se encuentra una proporción especificada de la población.