Distribución t multivariada

En estadística , la distribución t multivariante (o distribución de Student multivariante ) es una distribución de probabilidad multivariante . Es una generalización a vectores aleatorios de la distribución t de Student , que es una distribución aplicable a variables aleatorias univariadas . Si bien el caso de una matriz aleatoria podría tratarse dentro de esta estructura, la distribución t matricial es distinta y hace un uso particular de la estructura matricial.

Definición

Un método común de construcción de una distribución t multivariada , para el caso de dimensiones, se basa en la observación de que si y son independientes y se distribuyen como y (es decir, distribuciones normales y chi-cuadrado multivariadas ) respectivamente, la matriz es una matriz p × p , y es un vector constante, entonces la variable aleatoria tiene la densidad ^[1] ${\estilo de visualización p}$ $\mathbf {y}$ ${\estilo de visualización u}$ $N({\mathbf {0} },{\boldsymbol {\Sigma }})$ $\chi _{\nu }^{2}$ $\mathbf {\Sigma } \,$ ${\boldsymbol {\mu }}$ ${\textstyle {\mathbf {x} }={\mathbf {y} }/{\sqrt {u/\nu }}+{\boldsymbol {\mu }}}$

{\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\nu ^{p/2}\pi ^{p/2}\left|{\boldsymbol {\Sigma }}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {x} }-{\boldsymbol {\mu }})^{T}{\boldsymbol {\Sigma }}^{-1}({\mathbf {x} }-{\boldsymbol {\mu }})\right]^{-(\nu +p)/2}

y se dice que se distribuye como una distribución t multivariada con parámetros . Nótese que no es la matriz de covarianza ya que la covarianza está dada por (para ). ${\boldsymbol {\Sigma }},{\boldsymbol {\mu }},\nu$ $\mathbf {\Sigma}$ $\nu /(\nu -2)\mathbf {\Sigma }$ $\nu >2$

La definición constructiva de una distribución t multivariada sirve simultáneamente como algoritmo de muestreo:

Generar y , independientemente. $u\sim \chi _{\nu }^{2}$ $\mathbf {y} \sim N(\mathbf {0} ,{\boldsymbol {\Sigma }})$
Calcular . $\mathbf {x} \gets {\sqrt {\nu /u}}\mathbf {y} +{\boldsymbol {\mu }}$

Esta formulación da lugar a la representación jerárquica de una distribución t multivariada como una mezcla a escala de normales: donde indica una distribución gamma con densidad proporcional a , y sigue condicionalmente a . $u\sim \mathrm {Ga} (\nu /2,\nu /2)$ $\mathrm {Ga} (a,b)$ $x^{a-1}e^{-bx}$ $\mathbf {x} \mid u$ $N({\boldsymbol {\mu }},u^{-1}{\boldsymbol {\Sigma }})$

En el caso especial , la distribución es una distribución de Cauchy multivariada . $\nu =1$

Derivación

De hecho, existen muchos candidatos para la generalización multivariada de la distribución t de Student . Kotz y Nadarajah (2004) han realizado un estudio exhaustivo del campo. La cuestión esencial es definir una función de densidad de probabilidad de varias variables que sea la generalización apropiada de la fórmula para el caso univariante. En una dimensión ( ), con y , tenemos la función de densidad de probabilidad $p=1$ $t=x-\mu$ $\Sigma =1$

f(t)={\frac {\Gamma [(\nu +1)/2]}{{\sqrt {\nu \pi \,}}\,\Gamma [\nu /2]}}(1+t^{2}/\nu )^{-(\nu +1)/2}

y un enfoque es utilizar una función correspondiente de varias variables. Esta es la idea básica de la teoría de distribución elíptica , donde se escribe una función correspondiente de variables que reemplaza por una función cuadrática de todas las . Está claro que esto solo tiene sentido cuando todas las distribuciones marginales tienen los mismos grados de libertad . Con , se tiene una elección sencilla de función de densidad multivariante $p$ $t_{i}$ $t^{2}$ $t_{i}$ $\nu$ $\mathbf {A} ={\boldsymbol {\Sigma }}^{-1}$

f(\mathbf {t} )={\frac {\Gamma ((\nu +p)/2)\left|\mathbf {A} \right|^{1/2}}{{\sqrt {\nu ^{p}\pi ^{p}\,}}\,\Gamma (\nu /2)}}\left(1+\sum _{i,j=1}^{p,p}A_{ij}t_{i}t_{j}/\nu \right)^{-(\nu +p)/2}

que es la opción estándar pero no la única.

Un caso especial importante es la distribución t bivariada estándar, p = 2:

f(t_{1},t_{2})={\frac {\left|\mathbf {A} \right|^{1/2}}{2\pi }}\left(1+\sum _{i,j=1}^{2,2}A_{ij}t_{i}t_{j}/\nu \right)^{-(\nu +2)/2}

Tenga en cuenta que . ${\frac {\Gamma \left({\frac {\nu +2}{2}}\right)}{\pi \ \nu \Gamma \left({\frac {\nu }{2}}\right)}}={\frac {1}{2\pi }}$

Ahora, si es la matriz identidad, la densidad es $\mathbf {A}$

f(t_{1},t_{2})={\frac {1}{2\pi }}\left(1+(t_{1}^{2}+t_{2}^{2})/\nu \right)^{-(\nu +2)/2}.

La dificultad de la representación estándar se revela en esta fórmula, que no se factoriza en el producto de las distribuciones unidimensionales marginales. Cuando es diagonal, se puede demostrar que la representación estándar tiene correlación cero , pero las distribuciones marginales no son estadísticamente independientes . $\Sigma$

Una notable ocurrencia espontánea de la distribución multivariada elíptica es su apariencia matemática formal cuando se aplican métodos de mínimos cuadrados a datos normales multivariados, como la solución econométrica clásica de varianza mínima de Markowitz para carteras de activos. ^[2]

Función de distribución acumulativa

La definición de la función de distribución acumulativa (cdf) en una dimensión se puede extender a múltiples dimensiones definiendo la siguiente probabilidad (aquí hay un vector real): $\mathbf {x}$

F(\mathbf {x} )=\mathbb {P} (\mathbf {X} \leq \mathbf {x} ),\quad {\textrm {where}}\;\;\mathbf {X} \sim t_{\nu }({\boldsymbol {\mu }},{\boldsymbol {\Sigma }}).

No existe una fórmula sencilla para , pero se puede aproximar numéricamente mediante la integración de Monte Carlo . ^[3]^[4]^[5] $F(\mathbf {x} )$

Distribución condicional

Esto fue desarrollado por Muirhead ^[6] y Cornish ^[7] , pero luego derivado usando la representación de razón chi-cuadrado más simple anterior, por Roth ^[1] y Ding ^[8] . Sea el vector una distribución t multivariada y particionada en dos subvectores de elementos: $X$ $p_{1},p_{2}$

X_{p}={\begin{bmatrix}X_{1}\\X_{2}\end{bmatrix}}\sim t_{p}\left(\mu _{p},\Sigma _{p\times p},\nu \right)

donde , los vectores medios conocidos son y la matriz de escala es . $p_{1}+p_{2}=p$ $\mu _{p}={\begin{bmatrix}\mu _{1}\\\mu _{2}\end{bmatrix}}$ $\Sigma _{p\times p}={\begin{bmatrix}\Sigma _{11}&\Sigma _{12}\\\Sigma _{21}&\Sigma _{22}\end{bmatrix}}$

Roth y Ding encuentran que la distribución condicional es una nueva distribución t con parámetros modificados. $p(X_{1}|X_{2})$

X_{1}|X_{2}\sim t_{p_{1}}\left(\mu _{1|2},{\frac {\nu +d_{2}}{\nu +p_{2}}}\Sigma _{11|2},\nu +p_{2}\right)

Una expresión equivalente en Kotz et. al. es algo menos concisa.

Por lo tanto, la distribución condicional se representa más fácilmente como un procedimiento de dos pasos. Primero se forma la distribución intermedia anterior y luego, utilizando los parámetros siguientes, la distribución condicional explícita se convierte en $X_{1}|X_{2}\sim t_{p_{1}}\left(\mu _{1|2},\Psi ,{\tilde {\nu }}\right)$

f(X_{1}|X_{2})={\frac {\Gamma \left[({\tilde {\nu }}+p_{1})/2\right]}{\Gamma ({\tilde {\nu }}/2)(\pi \,{\tilde {\nu }})^{p_{1}/2}\left|{\boldsymbol {\Psi }}\right|^{1/2}}}\left[1+{\frac {1}{\tilde {\nu }}}(X_{1}-\mu _{1|2})^{T}{\boldsymbol {\Psi }}^{-1}(X_{1}-\mu _{1|2})\right]^{-({\tilde {\nu }}+p_{1})/2}

dónde

{\tilde {\nu }}=\nu +p_{2}

Los grados de libertad efectivos se incrementan con el número de variables en desuso .

\nu

p_{2}

\mu _{1|2}=\mu _{1}+\Sigma _{12}\Sigma _{22}^{-1}\left(X_{2}-\mu _{2}\right)

es la media condicional de

x_{1}

\Sigma _{11|2}=\Sigma _{11}-\Sigma _{12}\Sigma _{22}^{-1}\Sigma _{21}

es el complemento de Schur de .

\Sigma _{22}{\text{ in }}\Sigma

d_{2}=(X_{2}-\mu _{2})^{T}\Sigma _{22}^{-1}(X_{2}-\mu _{2})

es la distancia al cuadrado de Mahalanobis de con matriz de escala

X_{2}

\mu _{2}

\Sigma _{22}

\Psi ={\frac {\nu +d_{2}}{\nu +p_{2}}}\Sigma _{11|2}

es la covarianza condicional para .

{\tilde {\nu }}>2

Cópulas basadas en el multivariantea

El uso de tales distribuciones está disfrutando de un renovado interés debido a las aplicaciones en finanzas matemáticas , especialmente a través del uso de la cópula t de Student . ^[9]

Representación elíptica

Construida como una distribución elíptica , ^[10] tome el caso centralizado más simple con simetría esférica y sin escala, entonces la t -PDF multivariada toma la forma $\Sigma =\operatorname {I} \,$

f_{X}(X)=g(X^{T}X)={\frac {\Gamma {\big (}{\frac {1}{2}}(\nu +p)\,{\big )}}{(\nu \pi )^{\,p/2}\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}}{\bigg (}1+\nu ^{-1}X^{T}X{\bigg )}^{-(\nu +p)/2}

donde y = grados de libertad como se define en Muirhead ^[6] sección 1.5. La covarianza de es $X=(x_{1},\cdots ,x_{p})^{T}{\text{ is a }}p{\text{-vector}}$ $\nu$ $X$

\operatorname {E} \left(XX^{T}\right)=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{X}(x_{1},\dots ,x_{p})XX^{T}\,dx_{1}\dots dx_{p}={\frac {\nu }{\nu -2}}\operatorname {I}

El objetivo es convertir la PDF cartesiana en una radial. Kibria y Joarder, ^[11] definen la medida radial y, notando que la densidad depende solo de r ₂ , obtenemos $r_{2}=R^{2}={\frac {X^{T}X}{p}}$

$\operatorname {E} [r_{2}]=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{X}(x_{1},\dots ,x_{p}){\frac {X^{T}X}{p}}\,dx_{1}\dots dx_{p}={\frac {\nu }{\nu -2}}$

que es equivalente a la varianza del vector de elementos tratado como una secuencia aleatoria univariante de cola pesada y media cero con elementos no correlacionados, pero estadísticamente dependientes. $p$ $X$

Distribución radial

$r_{2}={\frac {X^{T}X}{p}}$ Sigue la distribución de Fisher-Snedecor : $F$

r_{2}\sim f_{F}(p,\nu )=B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}{\bigg (}{\frac {p}{\nu }}{\bigg )}^{p/2}r_{2}^{p/2-1}{\bigg (}1+{\frac {p}{\nu }}r_{2}{\bigg )}^{-(p+\nu )/2}

que tienen un valor medio . -Las distribuciones surgen naturalmente en las pruebas de sumas de cuadrados de datos muestreados después de la normalización por la desviación estándar de la muestra. $\operatorname {E} [r_{2}]={\frac {\nu }{\nu -2}}$ $F$

Mediante un cambio de variable aleatoria a en la ecuación anterior, conservando el vector , tenemos una distribución de probabilidad $y={\frac {p}{\nu }}r_{2}={\frac {X^{T}X}{\nu }}$ $p$ $X$ $\operatorname {E} [y]=\int _{-\infty }^{\infty }\cdots \int _{-\infty }^{\infty }f_{X}(X){\frac {X^{T}X}{\nu }}\,dx_{1}\dots dx_{p}={\frac {p}{\nu -2}}$

{\begin{aligned}f_{Y}(y|\,p,\nu )&=\left|{\frac {p}{\nu }}\right|^{-1}B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}{\big (}{\frac {p}{\nu }}{\big )}^{\,p/2}{\big (}{\frac {p}{\nu }}{\big )}^{-p/2-1}y^{\,p/2-1}{\big (}1+y{\big )}^{-(p+\nu )/2}\\\\&=B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}y^{\,p/2-1}(1+y)^{-(\nu +p)/2}\end{aligned}}

que es una distribución Beta-prima regular cuyo valor medio es . $y\sim \beta \,'{\bigg (}y;{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}$ ${\frac {{\frac {1}{2}}p}{{\frac {1}{2}}\nu -1}}={\frac {p}{\nu -2}}$

Distribución radial acumulada

Dada la distribución Beta-prima, la función de distribución acumulativa radial de se conoce: $y$

F_{Y}(y)\sim I\,{\bigg (}{\frac {y}{1+y}};\,{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}B{\bigg (}{\frac {p}{2}},{\frac {\nu }{2}}{\bigg )}^{-1}

donde es la función Beta incompleta y se aplica con un supuesto esférico . $I$ $\Sigma$

En el caso escalar, , la distribución es equivalente a la t de Student con la equivalencia , teniendo la variable t colas de doble cara para fines de CDF, es decir, la "prueba t de dos colas". $p=1$ $t^{2}=y^{2}\sigma ^{-1}$

La distribución radial también se puede derivar mediante una transformación de coordenadas sencilla de cartesiana a esférica. Una superficie de radio constante en con PDF es una superficie de isodensidad. Dado este valor de densidad, el cuanto de probabilidad en una capa de área de superficie y espesor en es . $R=(X^{T}X)^{1/2}$ $p_{X}(X)\propto {\bigg (}1+\nu ^{-1}R^{2}{\bigg )}^{-(\nu +p)/2}$ $A_{R}$ $\delta R$ $R$ $\delta P=p_{X}(R)\,A_{R}\delta R$

La esfera cerrada de radio tiene área de superficie . La sustitución en muestra que la esfera tiene un elemento de probabilidad que es equivalente a la función de densidad radial $p$ $R$ $A_{R}={\frac {2\pi ^{p/2}R^{\,p-1}}{\Gamma (p/2)}}$ $\delta P$ $\delta P=p_{X}(R){\frac {2\pi ^{p/2}R^{p-1}}{\Gamma (p/2)}}\delta R$

f_{R}(R)={\frac {\Gamma {\big (}{\frac {1}{2}}(\nu +p)\,{\big )}}{\nu ^{\,p/2}\pi ^{\,p/2}\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}}{\frac {2\pi ^{p/2}R^{p-1}}{\Gamma (p/2)}}{\bigg (}1+{\frac {R^{2}}{\nu }}{\bigg )}^{-(\nu +p)/2}

lo que se simplifica aún más a donde está la función Beta . $f_{R}(R)={\frac {2}{\nu ^{1/2}B{\big (}{\frac {1}{2}}p,{\frac {1}{2}}\nu {\big )}}}{\bigg (}{\frac {R^{2}}{\nu }}{\bigg )}^{(p-1)/2}{\bigg (}1+{\frac {R^{2}}{\nu }}{\bigg )}^{-(\nu +p)/2}$ $B(*,*)$

Cambiar la variable radial a devuelve la distribución Beta Prime anterior $y=R^{2}/\nu$

f_{Y}(y)={\frac {1}{B{\big (}{\frac {1}{2}}p,{\frac {1}{2}}\nu {\big )}}}y^{\,p/2-1}{\bigg (}1+y{\bigg )}^{-(\nu +p)/2}

Para escalar las variables radiales sin cambiar la función de forma radial, defina la matriz de escala , lo que produce una función de densidad cartesiana de 3 parámetros, es decir, la probabilidad en el elemento de volumen es $\Sigma =\alpha \operatorname {I}$ $\Delta _{P}$ $dx_{1}\dots dx_{p}$

\Delta _{P}{\big (}f_{X}(X\,|\alpha ,p,\nu ){\big )}={\frac {\Gamma {\big (}{\frac {1}{2}}(\nu +p)\,{\big )}}{(\nu \pi )^{\,p/2}\alpha ^{\,p/2}\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}}{\bigg (}1+{\frac {X^{T}X}{\alpha \nu }}{\bigg )}^{-(\nu +p)/2}\;dx_{1}\dots dx_{p}

o, en términos de variable radial escalar , $R$

f_{R}(R\,|\alpha ,p,\nu )={\frac {2}{\alpha ^{1/2}\;\nu ^{1/2}B{\big (}{\frac {1}{2}}p,{\frac {1}{2}}\nu {\big )}}}{\bigg (}{\frac {R^{2}}{\alpha \,\nu }}{\bigg )}^{(p-1)/2}{\bigg (}1+{\frac {R^{2}}{\alpha \,\nu }}{\bigg )}^{-(\nu +p)/2}

Momentos radiales

Los momentos de todas las variables radiales , con el supuesto de distribución esférica, se pueden derivar de la distribución Beta Prime. Si entonces , se conoce el resultado. Por lo tanto, para la variable tenemos $Z\sim \beta '(a,b)$ $\operatorname {E} (Z^{m})={\frac {B(a+m,b-m)}{B(a,b)}}$ $y={\frac {p}{\nu }}R^{2}$

\operatorname {E} (y^{m})={\frac {B({\frac {1}{2}}p+m,{\frac {1}{2}}\nu -m)}{B({\frac {1}{2}}p,{\frac {1}{2}}\nu )}}={\frac {\Gamma {\big (}{\frac {1}{2}}p+m{\big )}\;\Gamma {\big (}{\frac {1}{2}}\nu -m{\big )}}{\Gamma {\big (}{\frac {1}{2}}p{\big )}\;\Gamma {\big (}{\frac {1}{2}}\nu {\big )}}},\;\nu /2>m

Los momentos de son $r_{2}=\nu \,y$

\operatorname {E} (r_{2}^{m})=\nu ^{m}\operatorname {E} (y^{m})

Al introducir la matriz de escala se obtienen los siguientes resultados : $\alpha \operatorname {I}$

\operatorname {E} (r_{2}^{m}|\alpha )=\alpha ^{m}\nu ^{m}\operatorname {E} (y^{m})

Los momentos relacionados con la variable radial se encuentran estableciendo y con lo cual $R$ $R=(\alpha \nu y)^{1/2}$ $M=2m$

\operatorname {E} (R^{M})=\operatorname {E} {\big (}(\alpha \nu y)^{1/2}{\big )}^{2m}=(\alpha \nu )^{M/2}\operatorname {E} (y^{M/2})=(\alpha \nu )^{M/2}{\frac {B{\big (}{\frac {1}{2}}(p+M),{\frac {1}{2}}(\nu -M){\big )}}{B({\frac {1}{2}}p,{\frac {1}{2}}\nu )}}

Combinaciones lineales y transformaciones afines

Transformación de rango completo

Esto se relaciona estrechamente con el método normal multivariante y se describe en Kotz y Nadarajah, Kibria y Joarder, Roth y Cornish. Partiendo de una versión algo simplificada de la función de densidad de probabilidad central de MV-t: , donde es una constante y es arbitraria pero fija, sea una matriz de rango completo y forme el vector . Luego, mediante un cambio sencillo de variables $f_{X}(X)={\frac {\mathrm {K} }{\left|\Sigma \right|^{1/2}}}\left(1+\nu ^{-1}X^{T}\Sigma ^{-1}X\right)^{-\left(\nu +p\right)/2}$ $\mathrm {K}$ $\nu$ $\Theta \in \mathbb {R} ^{p\times p}$ $Y=\Theta X$

f_{Y}(Y)={\frac {\mathrm {K} }{\left|\Sigma \right|^{1/2}}}\left(1+\nu ^{-1}Y^{T}\Theta ^{-T}\Sigma ^{-1}\Theta ^{-1}Y\right)^{-\left(\nu +p\right)/2}\left|{\frac {\partial Y}{\partial X}}\right|^{-1}

La matriz de derivadas parciales es y el jacobiano se convierte en . Por lo tanto ${\frac {\partial Y_{i}}{\partial X_{j}}}=\Theta _{i,j}$ $\left|{\frac {\partial Y}{\partial X}}\right|=\left|\Theta \right|$

f_{Y}(Y)={\frac {\mathrm {K} }{\left|\Sigma \right|^{1/2}\left|\Theta \right|}}\left(1+\nu ^{-1}Y^{T}\Theta ^{-T}\Sigma ^{-1}\Theta ^{-1}Y\right)^{-\left(\nu +p\right)/2}

El denominador se reduce a

\left|\Sigma \right|^{1/2}\left|\Theta \right|=\left|\Sigma \right|^{1/2}\left|\Theta \right|^{1/2}\left|\Theta ^{T}\right|^{1/2}=\left|\Theta \Sigma \Theta ^{T}\right|^{1/2}

En su totalidad:

f_{Y}(Y)={\frac {\Gamma \left[(\nu +p)/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,p/2}\left|\Theta \Sigma \Theta ^{T}\right|^{1/2}}}\left(1+\nu ^{-1}Y^{T}\left(\Theta \Sigma \Theta ^{T}\right)^{-1}Y\right)^{-\left(\nu +p\right)/2}

que es una distribución MV- t regular .

En general, si y tiene rango completo , entonces $X\sim t_{p}(\mu ,\Sigma ,\nu )$ $\Theta ^{p\times p}$ $p$

\Theta X+c\sim t_{p}(\Theta \mu +c,\Theta \Sigma \Theta ^{T},\nu )

Distribuciones marginales

Este es un caso especial de la transformación lineal de reducción de rango que se muestra a continuación. Kotz define las distribuciones marginales de la siguiente manera: Partición en dos subvectores de elementos: $X\sim t(p,\mu ,\Sigma ,\nu )$ $p_{1},p_{2}$

X_{p}={\begin{bmatrix}X_{1}\\X_{2}\end{bmatrix}}\sim t\left(p_{1}+p_{2},\mu _{p},\Sigma _{p\times p},\nu \right)

con , significa , matriz de escala $p_{1}+p_{2}=p$ $\mu _{p}={\begin{bmatrix}\mu _{1}\\\mu _{2}\end{bmatrix}}$ $\Sigma _{p\times p}={\begin{bmatrix}\Sigma _{11}&\Sigma _{12}\\\Sigma _{21}&\Sigma _{22}\end{bmatrix}}$

entonces , tal que $X_{1}\sim t\left(p_{1},\mu _{1},\Sigma _{11},\nu \right)$ $X_{2}\sim t\left(p_{2},\mu _{2},\Sigma _{22},\nu \right)$

f(X_{1})={\frac {\Gamma \left[(\nu +p_{1})/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,p_{1}/2}\left|{{\boldsymbol {\Sigma }}_{11}}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {X} _{1}}-{{\boldsymbol {\mu }}_{1}})^{T}{\boldsymbol {\Sigma }}_{11}^{-1}({\mathbf {X} _{1}}-{{\boldsymbol {\mu }}_{1}})\right]^{-(\nu \,+\,p_{1})/2}

f(X_{2})={\frac {\Gamma \left[(\nu +p_{2})/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,p_{2}/2}\left|{{\boldsymbol {\Sigma }}_{22}}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}({\mathbf {X} _{2}}-{{\boldsymbol {\mu }}_{2}})^{T}{\boldsymbol {\Sigma }}_{22}^{-1}({\mathbf {X} _{2}}-{{\boldsymbol {\mu }}_{2}})\right]^{-(\nu \,+\,p_{2})/2}

Si se construye una transformación en la forma

\Theta _{p_{1}\times \,p}={\begin{bmatrix}1&\cdots &0&\cdots &0\\0&\ddots &0&\cdots &0\\0&\cdots &1&\cdots &0\end{bmatrix}}

Entonces el vector , como se analiza a continuación, tiene la misma distribución que la distribución marginal de . $Y=\Theta X$ $X_{1}$

Transformación lineal reductora de rango

En el caso de la transformación lineal, si es una matriz rectangular , de rango el resultado es una reducción de dimensionalidad. Aquí, el jacobiano es aparentemente rectangular, pero el valor en la función de densidad de probabilidad del denominador es correcto. Hay una discusión sobre los determinantes del producto de matrices rectangulares en Aitken. ^[12] En general, si y tiene rango completo , entonces $\Theta$ $\Theta \in \mathbb {R} ^{m\times p},m<p$ $m$ $\left|\Theta \right|$ $\left|\Theta \Sigma \Theta ^{T}\right|^{1/2}$ $X\sim t(p,\mu ,\Sigma ,\nu )$ $\Theta ^{m\times p}$ $m$

Y=\Theta X+c\sim t(m,\Theta \mu +c,\Theta \Sigma \Theta ^{T},\nu )

f_{Y}(Y)={\frac {\Gamma \left[(\nu +m)/2\right]}{\Gamma (\nu /2)\,(\nu \,\pi )^{\,m/2}\left|\Theta \Sigma \Theta ^{T}\right|^{1/2}}}\left[1+{\frac {1}{\nu }}(Y-c_{1})^{T}(\Theta \Sigma \Theta ^{T})^{-1}(Y-c_{1})\right]^{-(\nu \,+\,m)/2},\;c_{1}=\Theta \mu +c

En casos extremos , si m = 1 y se convierte en un vector fila, entonces el escalar Y sigue una distribución t de Student univariante de doble cara definida por con los mismos grados de libertad. Kibria et. al. utilizan la transformación afín para encontrar las distribuciones marginales que también son MV- t . $\Theta$ $t^{2}=Y^{2}/\sigma ^{2}$ $\nu$

Durante las transformaciones afines de variables con distribuciones elípticas, todos los vectores deben derivar en última instancia de un vector esférico isótropo inicial cuyos elementos permanecen "entrelazados" y no son estadísticamente independientes. $Z$
Un vector de muestras t de Student independientes no es consistente con la distribución t multivariada .
La suma de dos vectores t multivariados de muestra generados con muestras de Chi-cuadrado independientes y valores diferentes no producirá distribuciones internamente consistentes, aunque sí generará un problema de Behrens-Fisher . ^[13] $\nu$ ${\textstyle {1}/{\sqrt {u_{1}/\nu _{1}}},\;\;{1}/{\sqrt {u_{2}/\nu _{2}}}}$
Taleb compara muchos ejemplos de distribuciones multivariadas elípticas y no elípticas de cola gruesa

Conceptos relacionados

En estadística univariante, la prueba t de Student utiliza la distribución t de Student .
La distribución t multivariada elíptica surge espontáneamente en soluciones de mínimos cuadrados linealmente restringidas que involucran datos fuente normales multivariados, por ejemplo, la solución de varianza mínima global de Markowitz en el análisis de cartera financiera. ^[14]^[15]^[2] que aborda un conjunto de vectores aleatorios normales o una matriz aleatoria. No surge en mínimos cuadrados ordinarios (MCO) o regresión múltiple con variables dependientes e independientes fijas, cuyo problema tiende a producir probabilidades de error normales de buen comportamiento.
La distribución T -cuadrado de Hotelling es una distribución que surge en las estadísticas multivariadas.
La distribución matricial t es una distribución de variables aleatorias dispuestas en una estructura matricial.

Véase también

Distribución normal multivariada , que es el caso límite de la distribución t de Student multivariada cuando . $\nu \uparrow \infty$
Distribución Chi , la función de densidad de probabilidad del factor de escala en la construcción de la distribución t de Student y también la norma 2 (o norma euclidiana ) de un vector multivariado distribuido normalmente (centrado en cero).
- Distribución de Rayleigh#t de Student , longitud de vector aleatorio de distribución t multivariada
Distancia de Mahalanobis

Referencias

^ ab Roth, Michael (17 de abril de 2013). "Sobre la distribución t multivariante" (PDF) . Grupo de Control Automático. Universidad de Linköpin, Suecia . Archivado (PDF) del original el 31 de julio de 2022. Consultado el 1 de junio de 2022 .
^ ab Bodnar, T; Okhrin, Y (2008). "Propiedades de la distribución Wishart singular, inversa y generalizada inversa particionada" (PDF) . Journal of Multivariate Analysis . 99 (Eqn.20): 2389–2405. doi :10.1016/j.jmva.2008.02.024.
^ Botev, Z.; Chen, Y.-L. (2022). "Capítulo 4: Cálculos de estudiantes multivariados truncados mediante inclinación exponencial". En Botev, Zdravko; Keller, Alejandro; Lemieux, Christiane; Tuffin, Bruno (eds.). Avances en modelado y simulación: Festschrift para Pierre L'Ecuyer . Saltador. págs. 65–87. doi :10.1007/978-3-031-10193-9_4. ISBN 978-3-031-10192-2.
^ Botev, ZI; L'Ecuyer, P. (6 de diciembre de 2015). "Estimación de probabilidad eficiente y simulación de la distribución t de Student multivariada truncada". Conferencia de Simulación de Invierno de 2015 (WSC) . Huntington Beach, CA, EE. UU.: IEEE. págs. 380–391. doi :10.1109/WSC.2015.7408180.
^ Genz, Alan (2009). Cálculo de probabilidades normales y t multivariadas. Apuntes de clase sobre estadística. Vol. 195. Springer. doi :10.1007/978-3-642-01689-9. ISBN 978-3-642-01689-9Archivado desde el original el 27 de agosto de 2022. Consultado el 5 de septiembre de 2017 .
^ ab Muirhead, Robb (1982). Aspectos de la teoría estadística multivariante . Estados Unidos: Wiley. págs. 32-36. Teorema 1.5.4. ISBN 978-0-47 1-76985-9.
^ Cornish, EA (1954). "La distribución t multivariante asociada con un conjunto de muestras normales desviadas". Revista australiana de física . 7 : 531–542. doi : 10.1071/PH550193 .
^ Ding, Peng (2016). "Sobre la distribución condicional de la distribución t multivariante". The American Statistician . 70 (3): 293–295. arXiv : 1604.00561 . doi :10.1080/00031305.2016.1164756. S2CID 55842994.
^ Demarta, Stefano; McNeil, Alexander (2004). "La cópula t y cópulas relacionadas" (PDF) . Risknet .
^ Osiewalski, Jacek; Steele, Mark (1996). "Momentos posteriores de parámetros de escala en modelos de muestreo elíptico". Análisis bayesiano en estadística y econometría . Wiley. págs. 323–335. ISBN 0-471-11856-7.
^ Kibria, KMG; Joarder, AH (enero de 2006). "Una breve revisión de la distribución t multivariante" (PDF) . Revista de investigación estadística . 40 (1): 59–72. doi :10.1007/s42979-021-00503-0. S2CID 232163198.
^ Aitken, AC - (1948). Determinantes y matrices (5.ª ed.). Edimburgo: Oliver y Boyd. pp. Capítulo IV, sección 36.
^ Giron, Javier; del Castilo, Carmen (2010). "La distribución multivariante de Behrens-Fisher". Journal of Multivariate Analysis . 101 (9): 2091–2102. doi : 10.1016/j.jmva.2010.04.008 .
^ Okhrin, Y; Schmid, W (2006). "Propiedades distributivas de las ponderaciones de cartera". Revista de Econometría . 134 : 235–256. doi :10.1016/j.jeconom.2005.06.022.
^ Bodnar, T; Dmytriv, S; Parolya, N; Schmid, W (2019). "Pruebas para los pesos de la cartera de varianza mínima global en un entorno de alta dimensión". IEEE Trans. On Signal Processing . 67 (17): 4479–4493. arXiv : 1710.09587 . Código Bibliográfico :2019ITSP...67.4479B. doi :10.1109/TSP.2019.2929964.

Literatura

Kotz, Samuel; Nadarajah, Saralees (2004). Distribuciones t multivariadas y sus aplicaciones . Cambridge University Press. ISBN 978-0521826549.
Cherubini, Umberto; Luciano, Elisa; Vecchiato, Walter (2004). Métodos de cópula en finanzas . John Wiley e hijos. ISBN 978-0470863442.
Taleb, Nassim Nicholas (2023). Consecuencias estadísticas de las colas gordas (1.ª ed.). Academic Press. ISBN 979-8218248031.

Enlaces externos

Métodos de cópula frente a distribuciones multivariadas canónicas: la distribución T de Student multivariada con grados de libertad generales
Distribución t de Student multivariada