Covarianza y correlación

En teoría de probabilidad y estadística , los conceptos matemáticos de covarianza y correlación son muy similares. ^[1]^[2] Ambos describen el grado en el que dos variables aleatorias o conjuntos de variables aleatorias tienden a desviarse de sus valores esperados de maneras similares.

Si X e Y son dos variables aleatorias, con medias (valores esperados) μ _X y μ _Y y desviaciones estándar σ _X y σ _Y , respectivamente, entonces su covarianza y correlación son las siguientes:

covarianza: ${\text{cov}}_{XY}=\sigma _{XY}=E[(X-\mu _{X})\,(Y-\mu _{Y})]$
correlación: ${\text{corr}}_{XY}=\rho_{XY}=E[(X-\mu_{X})\,(Y-\mu_{Y})]/(\sigma_{X}\sigma_{Y})\,,$

de modo que $\rho_{XY}=\sigma_{XY}/(\sigma_{X}\sigma_{Y})$

donde E es el operador de valor esperado. Cabe destacar que la correlación es adimensional mientras que la covarianza está en unidades obtenidas al multiplicar las unidades de las dos variables.

Si Y siempre toma los mismos valores que X , tenemos la covarianza de una variable consigo misma (es decir ), que se llama varianza y se denota más comúnmente como el cuadrado de la desviación estándar. La correlación de una variable consigo misma es siempre 1 (excepto en el caso degenerado donde las dos varianzas son cero porque X siempre toma el mismo valor único, en cuyo caso la correlación no existe ya que su cálculo implicaría la división por 0 ). De manera más general, la correlación entre dos variables es 1 (o –1) si una de ellas siempre toma un valor que está dado exactamente por una función lineal de la otra con respectivamente una pendiente positiva (o negativa) . $Estilo de visualización: sigma__{XX}$ $estilo de visualización sigma _{X}^{2},}$

Aunque los valores de las covarianzas y correlaciones teóricas están vinculados de la manera descrita anteriormente, las distribuciones de probabilidad de las estimaciones muestrales de estas cantidades no están vinculadas de ninguna manera sencilla y, por lo general, deben tratarse por separado.

Variables aleatorias múltiples

Con cualquier número de variables aleatorias superior a 1, las variables se pueden apilar en un vector aleatorio cuyo ^elementoi es la variable aleatoria i. Luego, las varianzas y covarianzas se pueden colocar en una ^matrizde covarianza , en la que el elemento ( i , j ) es la covarianza entre la variable aleatoria i y la ^j. ^Delmismo modo, las correlaciones se pueden colocar en una matriz de correlación .

Análisis de series temporales

En el caso de una serie temporal estacionaria en sentido amplio, tanto las medias como las varianzas son constantes a lo largo del tiempo (E( X n _+m ) = E( X _n ) = μ _X y var( X _n+m ) = var( X _n ) y lo mismo para la variable Y ). En este caso la covarianza cruzada y la correlación cruzada son funciones de la diferencia temporal:

covarianza cruzada: $\sigma _{XY}(m)=E[(X_{n}-\mu _{X})\,(Y_{n+m}-\mu _{Y})],$
correlación cruzada: $\rho_{XY}(m)=E[(X_{n}-\mu_{X})\,(Y_{n+m}-\mu_{Y})]/(\sigma_{X}\sigma_{Y}).$

Si Y es la misma variable que X , las expresiones anteriores se denominan autocovarianza y autocorrelación :

autocovarianza: $\sigma _{XX}(m)=E[(X_{n}-\mu _{X})\,(X_{n+m}-\mu _{X})],$
autocorrelación: $\rho_{XX}(m)=E[(X_{n}-\mu_{X})\,(X_{n+m}-\mu_{X})]/(\sigma_{X}^{2}).$

Referencias

^ Weisstein, Eric W. "Covarianza". MundoMatemático .
^ Weisstein, Eric W. "Correlación estadística". MathWorld .