stringtranslate.com

Distribución t multivariada

En estadística , la distribución t multivariada (o distribución de Student multivariada ) es una distribución de probabilidad multivariada . Es una generalización a vectores aleatorios de la distribución t de Student , que es una distribución aplicable a variables aleatorias univariadas . Si bien el caso de una matriz aleatoria podría tratarse dentro de esta estructura, la distribución t de la matriz es distinta y hace un uso particular de la estructura matricial.

Definición

Un método común de construcción de una distribución t multivariada , para el caso de dimensiones, se basa en la observación de que si y son independientes y están distribuidas como y (es decir, distribuciones normal multivariada y chi-cuadrado ), respectivamente, la matriz es p  ×  matriz p , y es un vector constante, entonces la variable aleatoria tiene la densidad [1]

y se dice que está distribuido como una distribución t multivariada con parámetros . Tenga en cuenta que no es la matriz de covarianza ya que la covarianza viene dada por (para ).

La definición constructiva de una distribución t multivariada sirve simultáneamente como algoritmo de muestreo:

  1. Generar y , de forma independiente.
  2. Calcular .

Esta formulación da lugar a la representación jerárquica de una distribución t multivariada como una mezcla de escala de normales: donde indica una distribución gamma con densidad proporcional a y sigue condicionalmente .

En el caso especial , la distribución es una distribución de Cauchy multivariada .

Derivación

De hecho, existen muchos candidatos para la generalización multivariada de la distribución t de Student . Kotz y Nadarajah (2004) han realizado un amplio estudio de este campo. La cuestión esencial es definir una función de densidad de probabilidad de varias variables que sea la generalización adecuada de la fórmula para el caso univariado. En una dimensión ( ), con y , tenemos la función de densidad de probabilidad

y un enfoque es utilizar una función correspondiente de varias variables. Esta es la idea básica de la teoría de la distribución elíptica , donde se escribe una función correspondiente de variables que se reemplaza por una función cuadrática de todas las . Está claro que esto sólo tiene sentido cuando todas las distribuciones marginales tienen los mismos grados de libertad . Con , uno tiene una elección simple de función de densidad multivariada

que es la opción estándar pero no la única.

Un caso especial importante es la distribución t bivariada estándar., pag = 2:

Tenga en cuenta que .

Ahora, si es la matriz identidad, la densidad es

La dificultad con la representación estándar se revela en esta fórmula, que no factoriza el producto de las distribuciones marginales unidimensionales. Cuando es diagonal, se puede demostrar que la representación estándar tiene correlación cero , pero las distribuciones marginales no son estadísticamente independientes .

Una aparición espontánea notable de la distribución elíptica multivariada es su apariencia matemática formal cuando se aplican métodos de mínimos cuadrados a datos normales multivariados, como la solución econométrica de varianza mínima clásica de Markowitz para carteras de activos. [2]

Función de distribución acumulativa

La definición de la función de distribución acumulativa (cdf) en una dimensión se puede extender a múltiples dimensiones definiendo la siguiente probabilidad (aquí hay un vector real):

No existe una fórmula sencilla para , pero se puede aproximar numéricamente mediante la integración de Monte Carlo . [3] [4] [5]

Distribución condicional

Esto fue desarrollado por Muirhead [6] y Cornish. [7] pero luego se derivó utilizando la representación más simple de la relación chi-cuadrado anterior, por Roth [1] y Ding. [8] Deje que el vector siga una distribución t multivariada y se divida en dos subvectores de elementos:

donde , los vectores medios conocidos son y la matriz de escala es .

Roth y Ding encuentran que la distribución condicional es una nueva distribución t con parámetros modificados.

Una expresión equivalente en Kotz et. Alabama. es algo menos conciso.

Al formar primero una distribución intermedia , la distribución condicional explícita se representa como:

dónde

Grados de libertad efectivos, aumentados por las variables en desuso.
es la media condicional de
es el complemento de Schur de ; la covarianza condicional.
es la distancia de Mahalanobis al cuadrado con matriz de escala

Cópulas basadas en la t multivariada

El uso de tales distribuciones está gozando de un interés renovado debido a las aplicaciones en finanzas matemáticas , especialmente mediante el uso de la cópula t de Student . [9]

Representación elíptica

Construida como una distribución elíptica , [10] toma el caso centralizado más simple con simetría esférica y sin escala, luego la t -PDF multivariada toma la forma

donde y = grados de libertad como se define en Muirhead [6] sección 1.5. La covarianza de es

El objetivo es convertir la PDF cartesiana a radial. Kibria y Joarder, [11] definen la medida radial y, observando que la densidad depende sólo de r 2 , obtenemos

que es equivalente a la varianza del vector de elementos tratado como una secuencia aleatoria univariante de cola pesada y media cero con elementos no correlacionados, pero estadísticamente dependientes.

Distribución radial

sigue la Fisher-Snedecor o distribución:

teniendo valor medio . -Las distribuciones surgen naturalmente en pruebas de sumas de cuadrados de datos muestreados después de la normalización por la desviación estándar de la muestra.

Mediante un cambio de variable aleatoria en la ecuación anterior, manteniendo -vector , tenemos una distribución de probabilidad

que es una distribución Beta-prime regular que tiene un valor medio .

Distribución radial acumulativa

Dada la distribución Beta-prime, se conoce la función de distribución radial acumulativa de :

donde es la función Beta incompleta y se aplica con un supuesto esférico.

En el caso escalar , la distribución es equivalente a t de Student con la equivalencia , la variable t tiene colas de doble cara para propósitos CDF, es decir, la "prueba t de dos colas".

La distribución radial también se puede derivar mediante una sencilla transformación de coordenadas de cartesiana a esférica. Una superficie de radio constante con PDF es una superficie de isodensidad. Dado este valor de densidad, el cuanto de probabilidad en una capa de área de superficie y espesor en es .

La esfera encerrada de radio tiene área de superficie . La sustitución en muestra que el caparazón tiene un elemento de probabilidad que es equivalente a la función de densidad radial

lo que simplifica aún más dónde está la función Beta .

Cambiar la variable radial para devolver la distribución Beta Prime anterior

Para escalar las variables radiales sin cambiar la función de forma radial, defina la matriz de escala , lo que producirá una función de densidad cartesiana de 3 parámetros, es decir. la probabilidad en elemento de volumen es

o, en términos de variable radial escalar ,

Momentos radiales

Los momentos de todas las variables radiales, con el supuesto de distribución esférica, se pueden derivar de la distribución Beta Prime. Si es así , un resultado conocido. Así, para la variable tenemos

Los momentos de son

al introducir la matriz de escala se obtiene

Los momentos relacionados con la variable radial se encuentran estableciendo y con lo cual

Combinaciones lineales y transformación afín

Transformación de rango completo

Esto se relaciona estrechamente con el método normal multivariado y se describe en Kotz y Nadarajah, Kibria y Joarder, Roth y Cornish. A partir de una versión algo simplificada del pdf central MV-t: , donde es una constante y es arbitraria pero fija, sea una matriz de rango completo y forme un vector . Luego, mediante un simple cambio de variables

La matriz de derivadas parciales es y la jacobiana se convierte en . De este modo

El denominador se reduce a

En su totalidad:

que es una distribución regular MV- t .

En general, si y tiene rango completo , entonces

Distribuciones marginales

Este es un caso especial de la siguiente transformación lineal de reducción de rango. Kotz define las distribuciones marginales de la siguiente manera. Partición en dos subvectores de elementos:

con , media , matriz de escala

entonces , tal que

Si se construye una transformación en la forma

entonces el vector , como se analiza a continuación, tiene la misma distribución que la distribución marginal de .

Transformación lineal de reducción de rango

En el caso de la transformación lineal, si es una matriz rectangular , el resultado de rango es la reducción de dimensionalidad. Aquí, el jacobiano es aparentemente rectangular, pero el valor en el denominador pdf es correcto. Hay una discusión sobre los determinantes del producto de matriz rectangular en Aitken. [12] En general, si y tiene rango completo , entonces

In extremis , si m = 1 y se convierte en un vector fila, entonces el escalar Y sigue una distribución t de Student univariada de doble cara definida por con los mismos grados de libertad. Kibria et. Alabama. use la transformación afín para encontrar las distribuciones marginales que también son MV- t .

Conceptos relacionados

Ver también

Referencias

  1. ^ ab Roth, Michael (17 de abril de 2013). "Sobre la distribución t multivariada" (PDF) . Grupo de Control Automático. Universidad de Linköpin, Suecia . Archivado (PDF) desde el original el 31 de julio de 2022 . Consultado el 1 de junio de 2022 .
  2. ^ ab Bodnar, T; Okhrin, Y (2008). "Propiedades de la distribución Wishart particionada inversa singular, inversa y generalizada" (PDF) . Revista de análisis multivariado . 99 (ecuación 20): 2389–2405.
  3. ^ Botev, Z.; Chen, Y.-L. (2022). "Capítulo 4: Cálculos de estudiantes multivariados truncados mediante inclinación exponencial". En Botev, Zdravko; Keller, Alejandro; Lemieux, Christiane; Tuffin, Bruno (eds.). Avances en modelado y simulación: Festschrift para Pierre L'Ecuyer . Saltador. págs. 65–87. ISBN 978-3-031-10192-2.
  4. ^ Botev, ZI; L'Ecuyer, P. (6 de diciembre de 2015). "Estimación eficiente de probabilidad y simulación de la distribución t de Student multivariada truncada". Conferencia de simulación de invierno de 2015 (WSC) . Huntington Beach, California, Estados Unidos: IEEE. págs. 380–391. doi :10.1109/WSC.2015.7408180.
  5. ^ Genz, Alan (2009). Cálculo de probabilidades multivariadas normales y t. Apuntes de conferencias sobre estadística. vol. 195. Saltador. doi :10.1007/978-3-642-01689-9. ISBN 978-3-642-01689-9. Archivado desde el original el 27 de agosto de 2022 . Consultado el 5 de septiembre de 2017 .
  6. ^ ab Muirhead, Robb (1982). Aspectos de la teoría estadística multivariada . Estados Unidos: Wiley. Págs. 32–36 Teorema 1.5.4. ISBN 978-0-47 1-76985-9.
  7. ^ de Cornualles, EA (1954). "La distribución t multivariada asociada con un conjunto de desviaciones muestrales normales". Revista Australiana de Física . 7 : 531–542. doi : 10.1071/PH550193 .
  8. ^ Ding, Peng (2016). "Sobre la distribución condicional de la distribución t multivariada". El estadístico estadounidense . 70 (3): 293–295. arXiv : 1604.00561 . doi :10.1080/00031305.2016.1164756. S2CID  55842994.
  9. ^ Demarta, Stefano; McNeil, Alejandro (2004). «La t Cópula y Cópulas afines» (PDF) . Red de riesgo .
  10. ^ Osiewalski, Jacek; Steele, Marcos (1996). "Momentos posteriores de los parámetros de escala en modelos de muestreo elípticos". Análisis Bayesiano en Estadística y Econometría . Wiley. págs. 323–335. ISBN 0-471-11856-7.
  11. ^ Kibria, KMG; Joarder, AH (enero de 2006). "Una breve reseña de la distribución t multivariada" (PDF) . Revista de investigación estadística . 40 (1): 59–72. doi :10.1007/s42979-021-00503-0. S2CID  232163198.
  12. ^ Aitken, AC - (1948). Determinantes y matrices (5ª ed.). Edimburgo: Oliver y Boyd. págs. Capítulo IV, sección 36.
  13. ^ Girón, Javier; del Castillo, Carmen (2010). "La distribución multivariada de Behrens-Fisher". Revista de análisis multivariado . 101 (9): 2091-2102. doi : 10.1016/j.jmva.2010.04.008 .
  14. ^ Okrin, Y; Schmid, W (2006). "Propiedades distributivas de las ponderaciones de cartera". Revista de Econometría . 134 : 235–256.
  15. ^ Bodnar, T; Dmítriv, S; Parolya, N; Schmid, W (2019). "Pruebas para las ponderaciones de la cartera de varianza mínima global en un entorno de alta dimensión". Traducción IEEE. sobre procesamiento de señales . 67 (17): 4479–4493.

Literatura

enlaces externos