Autocorrelación

La autocorrelación , a veces conocida como correlación serial en el caso de tiempo discreto , es la correlación de una señal con una copia retrasada de sí misma en función del retraso. De manera informal, es la similitud entre observaciones de una variable aleatoria en función del desfase temporal entre ellas. El análisis de la autocorrelación es una herramienta matemática para encontrar patrones repetitivos, como la presencia de una señal periódica oscurecida por el ruido , o para identificar la frecuencia fundamental faltante en una señal implícita en sus frecuencias armónicas . A menudo se utiliza en el procesamiento de señales para analizar funciones o series de valores, como las señales del dominio del tiempo .

Distintos campos de estudio definen la autocorrelación de forma diferente y no todas estas definiciones son equivalentes. En algunos campos, el término se utiliza indistintamente con el de autocovarianza .

Los procesos de raíz unitaria , los procesos de tendencia estacionaria , los procesos autorregresivos y los procesos de promedio móvil son formas específicas de procesos con autocorrelación.

Autocorrelación de procesos estocásticos

En estadística , la autocorrelación de un proceso aleatorio real o complejo es la correlación de Pearson entre valores del proceso en diferentes momentos, en función de los dos momentos o del desfase temporal. Sea un proceso aleatorio, y sea cualquier momento temporal ( puede ser un entero para un proceso de tiempo discreto o un número real para un proceso de tiempo continuo ). Entonces es el valor (o realización ) producido por una ejecución dada del proceso en el momento . Supóngase que el proceso tiene media y varianza en el momento , para cada . Entonces la definición de la función de autocorrelación entre los momentos y es ^[1]^{: p.388}^[2]^{: p.165} $\izquierda\{X_{t}\derecha\}$ ${\estilo de visualización t}$ ${\estilo de visualización t}$ $Estilo de visualización X_ {t}}$ ${\estilo de visualización t}$ $\mu_{t}$ $Estilo de visualización: sigma _{t}^{2}}$ ${\estilo de visualización t}$ ${\estilo de visualización t}$ $estilo de visualización t_{1}$ $estilo de visualización t_{2}$

$\operatorname {R} _{XX}(t_{1},t_{2})=\operatorname {E} \left[X_{t_{1}}{\overline {X}}_{t_{2}}\right]$

donde es el operador de valor esperado y la barra representa la conjugación compleja . Tenga en cuenta que la expectativa puede no estar bien definida . $\nombre del operador {E}$

Restando la media antes de la multiplicación se obtiene la función de autocovarianza entre los tiempos y : ^[1]^{: p.392}^[2]^{: p.168} $estilo de visualización t_{1}$ $estilo de visualización t_{2}$

$\operatorname {K} _{XX}(t_{1},t_{2})=\operatorname {E} \left[(X_{t_{1}}-\mu _{t_{1}}){\overline {(X_{t_{2}}-\mu _{t_{2}})}}\right]=\operatorname {E} \left[X_{t_{1}}{\overline {X}}_{t_{2}}\right]-\mu _{t_{1}}{\overline {\mu }}_{t_{2}}$

Téngase en cuenta que esta expresión no está bien definida para todas las series temporales o procesos, porque la media puede no existir o la varianza puede ser cero (para un proceso constante) o infinita (para procesos con distribución que carece de momentos de buen comportamiento, como ciertos tipos de ley de potencia ).

Definición de proceso estocástico estacionario de sentido amplio

Si es un proceso estacionario de sentido amplio , entonces la media y la varianza son independientes del tiempo y, además, la función de autocovarianza depende solo del desfase entre y : la autocovarianza depende solo de la distancia temporal entre el par de valores, pero no de su posición en el tiempo. Esto implica además que la autocovarianza y la autocorrelación se pueden expresar como una función del desfase temporal, y que esta sería una función par del desfase . Esto da las formas más familiares para la función de autocorrelación ^[1]^{: p.395} $\izquierda\{X_{t}\derecha\}$ ${\estilo de visualización \mu}$ $\sigma ^{2}$ $estilo de visualización t_{1}$ $estilo de visualización t_{2}$ $\tau =t_{2}-t_{1}$

$\operatorname {R} _{XX}(\tau )=\operatorname {E} \left[X_{t+\tau }{\overline {X}}_{t}\right]$

y la función de autocovarianza :

$\operatorname {K} _{XX}(\tau )=\operatorname {E} \left[(X_{t+\tau }-\mu ){\overline {(X_{t}-\mu )}}\right]=\operatorname {E} \left[X_{t+\tau }{\overline {X}}_{t}\right]-\mu {\overline {\mu }}$

En particular, tenga en cuenta que

$\operatorname {K} _{XX}(0)=\sigma ^{2}.$

Normalización

En algunas disciplinas (por ejemplo, estadística y análisis de series temporales ) es una práctica habitual normalizar la función de autocovarianza para obtener un coeficiente de correlación de Pearson dependiente del tiempo . Sin embargo, en otras disciplinas (por ejemplo, ingeniería), la normalización suele descartarse y los términos "autocorrelación" y "autocovarianza" se utilizan indistintamente.

La definición del coeficiente de autocorrelación de un proceso estocástico es ^[2]^{: p.169}

$\rho _{XX}(t_{1},t_{2})={\frac {\operatorname {K} _{XX}(t_{1},t_{2})}{\sigma _{t_{1}}\sigma _{t_{2}}}}={\frac {\operatorname {E} \left[(X_{t_{1}}-\mu _{t_{1}}){\overline {(X_{t_{2}}-\mu _{t_{2}})}}\right]}{\sigma _{t_{1}}\sigma _{t_{2}}}}.$

Si la función está bien definida, su valor debe estar en el rango , donde 1 indica correlación perfecta y −1 indica anticorrelación perfecta . $\rho_{XX}$ ${\estilo de visualización [-1,1]}$

Para un proceso estacionario de sentido amplio (WSS), la definición es

$\rho _{XX}(\tau )={\frac {\operatorname {K} _{XX}(\tau )}{\sigma ^{2}}}={\frac {\operatorname {E} \left[(X_{t+\tau }-\mu ){\overline {(X_{t}-\mu )}}\right]}{\sigma ^{2}}}$ .

La normalización es importante tanto porque la interpretación de la autocorrelación como correlación proporciona una medida libre de escala de la fuerza de la dependencia estadística , como porque la normalización tiene un efecto sobre las propiedades estadísticas de las autocorrelaciones estimadas.

Propiedades

Propiedad de simetría

El hecho de que la función de autocorrelación sea una función par se puede expresar como ^[2]^{: p.171} respectivamente para un proceso WSS: ^[2]^{: p.173} $\nombre del operador {R} _{XX}$ $\operatorname {R} _{XX}(t_{1},t_{2})={\overline {\operatorname {R} _{XX}(t_{2},t_{1})}}$ $\operatorname {R} _{XX}(\tau )={\overline {\operatorname {R} _{XX}(-\tau )}}.$

Máximo en cero

Para un proceso WSS: ^[2]^{: p.174} Nótese que siempre es real. $\left|\nombre del operador {R} _{XX}(\tau )\right|\leq \nombre del operador {R} _{XX}(0)$ $\nombre del operador {R} _{XX}(0)$

Desigualdad de Cauchy-Schwarz

La desigualdad de Cauchy-Schwarz , desigualdad para procesos estocásticos: ^[1]^{: p.392} $\left|\nombredeloperador {R} _{XX}(t_{1},t_{2})\right|^{2}\leq \nombredeloperador {E} \left[|X_{t_{1}}|^{2}\right]\nombredeloperador {E} \left[|X_{t_{2}}|^{2}\right]$

Autocorrelación del ruido blanco

La autocorrelación de una señal de ruido blanco de tiempo continuo tendrá un pico fuerte (representado por una función delta de Dirac ) en y será exactamente para todos los demás . $\tau = 0$ ${\estilo de visualización 0}$ ${\estilo de visualización \tau}$

Teorema de Wiener-Khinchin

El teorema de Wiener-Khinchin relaciona la función de autocorrelación con la densidad espectral de potencia a través de la transformada de Fourier : $\nombre del operador {R} _{XX}$ $Estilo de visualización S_ {XX}}$

$\operatorname {R} _{XX}(\tau )=\int _{-\infty }^{\infty }S_{XX}(f)e^{i2\pi f\tau }\,{\rm {d}}f$

$S_{XX}(f)=\int _{-\infty }^{\infty }\operatorname {R} _{XX}(\tau )e^{-i2\pi f\tau }\,{\rm {d}}\tau .$

Para funciones de valores reales, la función de autocorrelación simétrica tiene una transformada simétrica real, por lo que el teorema de Wiener-Khinchin se puede reexpresar solo en términos de cosenos reales:

$\operatorname {R} _{XX}(\tau )=\int _{-\infty }^{\infty }S_{XX}(f)\cos(2\pi f\tau )\,{\rm {d}}f$

$S_{XX}(f)=\int _{-\infty }^{\infty }\operatorname {R} _{XX}(\tau )\cos(2\pi f\tau )\,{\rm {d}}\tau .$

Autocorrelación de vectores aleatorios

La matriz de autocorrelación (también llamada segundo momento) de un vector aleatorio (potencialmente dependiente del tiempo) es una matriz que contiene como elementos las autocorrelaciones de todos los pares de elementos del vector aleatorio . La matriz de autocorrelación se utiliza en varios algoritmos de procesamiento de señales digitales . $\mathbf {X} =(X_{1},\ldots ,X_{n})^{\rm {T}}$ $n\times n$ $\mathbf {X}$

Para un vector aleatorio que contiene elementos aleatorios cuyo valor esperado y varianza existen, la matriz de autocorrelación se define por ^[3]^{: p.190}^[1]^{: p.334} $\mathbf {X} =(X_{1},\ldots ,X_{n})^{\rm {T}}$

$\operatorname {R} _{\mathbf {X} \mathbf {X} }\triangleq \ \operatorname {E} \left[\mathbf {X} \mathbf {X} ^{\rm {T}}\right]$

donde denota la matriz transpuesta de dimensiones . ${}^{\rm {T}}$ $n\times n$

Escrito por componentes:

$\operatorname {R} _{\mathbf {X} \mathbf {X} }={\begin{bmatrix}\operatorname {E} [X_{1}X_{1}]&\operatorname {E} [X_{1}X_{2}]&\cdots &\operatorname {E} [X_{1}X_{n}]\\\\\operatorname {E} [X_{2}X_{1}]&\operatorname {E} [X_{2}X_{2}]&\cdots &\operatorname {E} [X_{2}X_{n}]\\\\\vdots &\vdots &\ddots &\vdots \\\\\operatorname {E} [X_{n}X_{1}]&\operatorname {E} [X_{n}X_{2}]&\cdots &\operatorname {E} [X_{n}X_{n}]\\\\\end{bmatrix}}$

Si es un vector aleatorio complejo , la matriz de autocorrelación se define en cambio por $\mathbf {Z}$

$\operatorname {R} _{\mathbf {Z} \mathbf {Z} }\triangleq \ \operatorname {E} [\mathbf {Z} \mathbf {Z} ^{\rm {H}}].$

Aquí denota transposición hermítica . ${}^{\rm {H}}$

Por ejemplo, si es un vector aleatorio, entonces es una matriz cuya entrada -ésima es . $\mathbf {X} =\left(X_{1},X_{2},X_{3}\right)^{\rm {T}}$ $\operatorname {R} _{\mathbf {X} \mathbf {X} }$ $3\times 3$ $(i,j)$ $\operatorname {E} [X_{i}X_{j}]$

Propiedades de la matriz de autocorrelación

La matriz de autocorrelación es una matriz hermítica para vectores aleatorios complejos y una matriz simétrica para vectores aleatorios reales. ^[3]^{: p.190}
La matriz de autocorrelación es una matriz semidefinida positiva , ^[3]^{: p.190} es decir para un vector aleatorio real, y respectivamente en el caso de un vector aleatorio complejo. $\mathbf {a} ^{\mathrm {T} }\operatorname {R} _{\mathbf {X} \mathbf {X} }\mathbf {a} \geq 0\quad {\text{for all }}\mathbf {a} \in \mathbb {R} ^{n}$ $\mathbf {a} ^{\mathrm {H} }\operatorname {R} _{\mathbf {Z} \mathbf {Z} }\mathbf {a} \geq 0\quad {\text{for all }}\mathbf {a} \in \mathbb {C} ^{n}$
Todos los valores propios de la matriz de autocorrelación son reales y no negativos.
La matriz de autocovarianza está relacionada con la matriz de autocorrelación de la siguiente manera: Respectivamente, para vectores aleatorios complejos: $\operatorname {K} _{\mathbf {X} \mathbf {X} }=\operatorname {E} [(\mathbf {X} -\operatorname {E} [\mathbf {X} ])(\mathbf {X} -\operatorname {E} [\mathbf {X} ])^{\rm {T}}]=\operatorname {R} _{\mathbf {X} \mathbf {X} }-\operatorname {E} [\mathbf {X} ]\operatorname {E} [\mathbf {X} ]^{\rm {T}}$ $\operatorname {K} _{\mathbf {Z} \mathbf {Z} }=\operatorname {E} [(\mathbf {Z} -\operatorname {E} [\mathbf {Z} ])(\mathbf {Z} -\operatorname {E} [\mathbf {Z} ])^{\rm {H}}]=\operatorname {R} _{\mathbf {Z} \mathbf {Z} }-\operatorname {E} [\mathbf {Z} ]\operatorname {E} [\mathbf {Z} ]^{\rm {H}}$

Autocorrelación de señales deterministas

En el procesamiento de señales , la definición anterior se utiliza a menudo sin la normalización, es decir, sin restar la media y dividir por la varianza. Cuando la función de autocorrelación se normaliza por la media y la varianza, a veces se la denomina coeficiente de autocorrelación ^[4] o función de autocovarianza.

Autocorrelación de señales de tiempo continuo

Dada una señal , la autocorrelación continua se define con mayor frecuencia como la integral de correlación cruzada continua de consigo misma, con un desfase de . ^[1]^{: p.411} $f(t)$ $R_{ff}(\tau )$ $f(t)$ $\tau$

$R_{ff}(\tau )=\int _{-\infty }^{\infty }f(t+\tau ){\overline {f(t)}}\,{\rm {d}}t=\int _{-\infty }^{\infty }f(t){\overline {f(t-\tau )}}\,{\rm {d}}t$

donde representa el conjugado complejo de . Nótese que el parámetro en la integral es una variable ficticia y solo es necesario para calcular la integral. No tiene un significado específico. ${\overline {f(t)}}$ $f(t)$ $t$

Autocorrelación de señales de tiempo discreto

La autocorrelación discreta en el desfase para una señal de tiempo discreto es $R$ $\ell$ $y(n)$

$R_{yy}(\ell )=\sum _{n\in Z}y(n)\,{\overline {y(n-\ell )}}$

Las definiciones anteriores funcionan para señales que son integrables al cuadrado o sumables al cuadrado, es decir, de energía finita. Las señales que "duran para siempre" se tratan en cambio como procesos aleatorios, en cuyo caso se necesitan definiciones diferentes, basadas en valores esperados. Para procesos aleatorios estacionarios en sentido amplio , las autocorrelaciones se definen como

${\begin{aligned}R_{ff}(\tau )&=\operatorname {E} \left[f(t){\overline {f(t-\tau )}}\right]\\R_{yy}(\ell )&=\operatorname {E} \left[y(n)\,{\overline {y(n-\ell )}}\right].\end{aligned}}$

Para los procesos que no son estacionarios , estas también serán funciones de , o . $t$ $n$

Para los procesos que también son ergódicos , la expectativa puede reemplazarse por el límite de un promedio de tiempo. La autocorrelación de un proceso ergódico a veces se define como o se equipara a ^[4]

${\begin{aligned}R_{ff}(\tau )&=\lim _{T\rightarrow \infty }{\frac {1}{T}}\int _{0}^{T}f(t+\tau ){\overline {f(t)}}\,{\rm {d}}t\\R_{yy}(\ell )&=\lim _{N\rightarrow \infty }{\frac {1}{N}}\sum _{n=0}^{N-1}y(n)\,{\overline {y(n-\ell )}}.\end{aligned}}$

Estas definiciones tienen la ventaja de que dan resultados de un solo parámetro bien definidos y sensibles para funciones periódicas, incluso cuando esas funciones no son el resultado de procesos ergódicos estacionarios.

Alternativamente, las señales que duran eternamente pueden ser tratadas mediante un análisis de función de autocorrelación de corto plazo, utilizando integrales de tiempo finito. (Véase la transformada de Fourier de corto plazo para un proceso relacionado).

Definición de señales periódicas

Si es una función periódica continua de período , la integración de a se reemplaza por la integración sobre cualquier intervalo de longitud : $f$ $T$ $-\infty$ $\infty$ $[t_{0},t_{0}+T]$ $T$

$R_{ff}(\tau )\triangleq \int _{t_{0}}^{t_{0}+T}f(t+\tau ){\overline {f(t)}}\,dt$

que es equivalente a

$R_{ff}(\tau )\triangleq \int _{t_{0}}^{t_{0}+T}f(t){\overline {f(t-\tau )}}\,dt$

Propiedades

A continuación, describiremos únicamente las propiedades de las autocorrelaciones unidimensionales, ya que la mayoría de las propiedades se transfieren fácilmente del caso unidimensional al caso multidimensional. Estas propiedades son válidas para procesos estacionarios de sentido amplio . ^[5]

Una propiedad fundamental de la autocorrelación es la simetría, , que es fácil de demostrar a partir de la definición. En el caso continuo, $R_{ff}(\tau )=R_{ff}(-\tau )$
- La autocorrelación es una función par cuando es una función real, y $R_{ff}(-\tau )=R_{ff}(\tau )$ $f$
- La autocorrelación es una función hermítica cuando es una función compleja . $R_{ff}(-\tau )=R_{ff}^{*}(\tau )$ $f$
La función de autocorrelación continua alcanza su pico en el origen, donde toma un valor real, es decir, para cualquier retraso , . ^[1]^{: p.410} Esto es una consecuencia de la desigualdad de reordenamiento . El mismo resultado se cumple en el caso discreto. $\tau$ $|R_{ff}(\tau )|\leq R_{ff}(0)$
La autocorrelación de una función periódica es, en sí misma, periódica con el mismo período.
La autocorrelación de la suma de dos funciones completamente no correlacionadas (la correlación cruzada es cero para todas ) es la suma de las autocorrelaciones de cada función por separado. $\tau$
Dado que la autocorrelación es un tipo específico de correlación cruzada , mantiene todas las propiedades de la correlación cruzada.
Al utilizar el símbolo para representar la convolución y es una función que manipula la función y se define como , la definición de puede escribirse como: $*$ $g_{-1}$ $f$ $g_{-1}(f)(t)=f(-t)$ $R_{ff}(\tau )$ $R_{ff}(\tau )=(f*g_{-1}({\overline {f}}))(\tau )$

Autocorrelación multidimensional

La autocorrelación multidimensional se define de manera similar. Por ejemplo, en tres dimensiones, la autocorrelación de una señal discreta sumable al cuadrado sería

$R(j,k,\ell )=\sum _{n,q,r}x_{n,q,r}\,{\overline {x}}_{n-j,q-k,r-\ell }.$

Cuando se restan los valores medios de las señales antes de calcular una función de autocorrelación, la función resultante suele denominarse función de autocovarianza.

Computación eficiente

Para los datos expresados como una secuencia discreta , con frecuencia es necesario calcular la autocorrelación con una alta eficiencia computacional . Se puede utilizar un método de fuerza bruta basado en la definición de procesamiento de señales cuando el tamaño de la señal es pequeño. Por ejemplo, para calcular la autocorrelación de la secuencia de señales reales (es decir , y para todos los demás valores de $i$ ) a mano, primero reconocemos que la definición que acabamos de dar es la misma que la multiplicación "habitual", pero con desplazamientos a la derecha, donde cada adición vertical da la autocorrelación para valores de retardo particulares: $R_{xx}(j)=\sum _{n}x_{n}\,{\overline {x}}_{n-j}$ $x=(2,3,-1)$ $x_{0}=2,x_{1}=3,x_{2}=-1$ $x_{i}=0$ ${\begin{array}{rrrrrr}&2&3&-1\\\times &2&3&-1\\\hline &-2&-3&1\\&&6&9&-3\\+&&&4&6&-2\\\hline &-2&3&14&3&-2\end{array}}$

Por lo tanto, la secuencia de autocorrelación requerida es , donde y la autocorrelación para otros valores de retardo es cero. En este cálculo no realizamos la operación de arrastre durante la suma como es habitual en la multiplicación normal. Tenga en cuenta que podemos reducir a la mitad el número de operaciones requeridas explotando la simetría inherente de la autocorrelación. Si la señal resulta ser periódica, es decir, entonces obtenemos una autocorrelación circular (similar a la convolución circular ) donde las colas izquierda y derecha de la secuencia de autocorrelación anterior se superpondrán y darán que tiene el mismo período que la secuencia de señal. El procedimiento puede considerarse como una aplicación de la propiedad de convolución de la transformada Z de una señal discreta. $R_{xx}=(-2,3,14,3,-2)$ $R_{xx}(0)=14,$ $R_{xx}(-1)=R_{xx}(1)=3,$ $R_{xx}(-2)=R_{xx}(2)=-2,$ $x=(\ldots ,2,3,-1,2,3,-1,\ldots ),$ $R_{xx}=(\ldots ,14,1,1,14,1,1,\ldots )$ $x.$

Si bien el algoritmo de fuerza bruta es de orden $n 2$ , existen varios algoritmos eficientes que pueden calcular la autocorrelación en orden $n log(n)$ . Por ejemplo, el teorema de Wiener-Khinchin permite calcular la autocorrelación a partir de los datos brutos $X (t)$ con dos transformadas rápidas de Fourier (FFT): ^[6]^{[ página necesaria ]}

${\begin{aligned}F_{R}(f)&=\operatorname {FFT} [X(t)]\\S(f)&=F_{R}(f)F_{R}^{*}(f)\\R(\tau )&=\operatorname {IFFT} [S(f)]\end{aligned}}$

donde IFFT denota la transformada rápida de Fourier inversa . El asterisco denota el conjugado complejo .

$Como alternativa, se puede realizar una correlación τ$ múltiple utilizando un cálculo de fuerza bruta para valores $τ$ bajos y luego agrupando progresivamente los datos $X (t)$ con una densidad logarítmica para calcular valores más altos, lo que da como resultado la misma eficiencia $n log(n)$ , pero con menores requisitos de memoria. ^[7]^[8]

Estimación

Para un proceso discreto con media y varianza conocidas para el cual observamos observaciones , se puede obtener una estimación del coeficiente de autocorrelación como $n$ $\{X_{1},\,X_{2},\,\ldots ,\,X_{n}\}$

${\hat {R}}(k)={\frac {1}{(n-k)\sigma ^{2}}}\sum _{t=1}^{n-k}(X_{t}-\mu )(X_{t+k}-\mu )$

para cualquier entero positivo . Cuando se conocen la media y la varianza verdaderas, esta estimación es insesgada . Si no se conocen la media y la varianza verdaderas del proceso, existen varias posibilidades: $k<n$ $\mu$ $\sigma ^{2}$

Si y se reemplazan por las fórmulas estándar para la media de la muestra y la varianza de la muestra, entonces se trata de una estimación sesgada . $\mu$ $\sigma ^{2}$
Una estimación basada en periodograma reemplaza en la fórmula anterior con . Esta estimación siempre está sesgada; sin embargo, normalmente tiene un error cuadrático medio menor . ^[9]^[10] $n-k$ $n$
Otras posibilidades se derivan de tratar las dos porciones de datos por separado y calcular medias muestrales y/o varianzas muestrales separadas para utilizarlas en la definición de la estimación. ^[^{cita requerida}^] $\{X_{1},\,X_{2},\,\ldots ,\,X_{n-k}\}$ $\{X_{k+1},\,X_{k+2},\,\ldots ,\,X_{n}\}$

La ventaja de las estimaciones del último tipo es que el conjunto de autocorrelaciones estimadas, como función de , forma entonces una función que es una autocorrelación válida en el sentido de que es posible definir un proceso teórico que tenga exactamente esa autocorrelación. Otras estimaciones pueden sufrir el problema de que, si se utilizan para calcular la varianza de una combinación lineal de las , la varianza calculada puede resultar negativa. ^[11] $k$ $X$

Análisis de regresión

En el análisis de regresión que utiliza datos de series temporales , la autocorrelación en una variable de interés se modela típicamente con un modelo autorregresivo (AR), un modelo de promedio móvil (MA), su combinación como un modelo autorregresivo de promedio móvil (ARMA) o una extensión de este último llamado modelo autorregresivo integrado de promedio móvil (ARIMA). Con múltiples series de datos interrelacionados, se utiliza la autorregresión vectorial (VAR) o sus extensiones.

En los mínimos cuadrados ordinarios (MCO), la adecuación de la especificación de un modelo se puede comprobar en parte estableciendo si hay autocorrelación de los residuos de regresión . La autocorrelación problemática de los errores, que en sí mismos no son observados, generalmente se puede detectar porque produce autocorrelación en los residuos observables. (Los errores también se conocen como "términos de error" en econometría ). La autocorrelación de los errores viola el supuesto de mínimos cuadrados ordinarios de que los términos de error no están correlacionados, lo que significa que el teorema de Gauss-Markov no se aplica y que los estimadores de MCO ya no son los mejores estimadores lineales insesgados ( BLUE ). Si bien no sesga las estimaciones de los coeficientes de MCO, los errores estándar tienden a subestimarse (y las puntuaciones t a sobreestimarse) cuando las autocorrelaciones de los errores en rezagos bajos son positivas.

La prueba tradicional para la presencia de autocorrelación de primer orden es la estadística de Durbin-Watson o, si las variables explicativas incluyen una variable dependiente rezagada, la estadística h de Durbin . Sin embargo, la estadística de Durbin-Watson se puede mapear linealmente a la correlación de Pearson entre valores y sus rezagos. ^[12] Una prueba más flexible, que cubre la autocorrelación de órdenes superiores y es aplicable independientemente de si los regresores incluyen rezagos de la variable dependiente o no, es la prueba de Breusch-Godfrey . Esto implica una regresión auxiliar, en donde los residuos obtenidos de la estimación del modelo de interés se regresionan sobre (a) los regresores originales y (b) k rezagos de los residuos, donde 'k' es el orden de la prueba. La versión más simple de la estadística de prueba de esta regresión auxiliar es TR ² , donde T es el tamaño de la muestra y R ² es el coeficiente de determinación . Bajo la hipótesis nula de no autocorrelación, esta estadística se distribuye $\chi ^{2}$ asintóticamente con k grados de libertad.

Las respuestas a la autocorrelación distinta de cero incluyen los mínimos cuadrados generalizados y el estimador Newey-West HAC (Heteroscedasticidad y autocorrelación consistentes). ^[13]

En la estimación de un modelo de promedio móvil (MA), se utiliza la función de autocorrelación para determinar la cantidad adecuada de términos de error rezagado que se deben incluir. Esto se basa en el hecho de que para un proceso MA de orden q , tenemos , para , y , para . $R(\tau )\neq 0$ $\tau =0,1,\ldots ,q$ $R(\tau )=0$ $\tau >q$

Aplicaciones

La capacidad de la autocorrelación para encontrar patrones repetitivos en los datos produce muchas aplicaciones, entre ellas:

El análisis de autocorrelación se utiliza ampliamente en la espectroscopia de correlación de fluorescencia ^[14] para proporcionar información cuantitativa sobre la difusión a nivel molecular y las reacciones químicas. ^[15]
Otra aplicación de la autocorrelación es la medición de espectros ópticos y la medición de pulsos de luz de muy corta duración producidos por láseres , ambos utilizando autocorreladores ópticos .
La autocorrelación se utiliza para analizar datos de dispersión de luz dinámica , lo que permite determinar en particular las distribuciones de tamaño de partículas de tamaño nanométrico o micelas suspendidas en un fluido. Un láser que incide sobre la mezcla produce un patrón de motas que resulta del movimiento de las partículas. La autocorrelación de la señal se puede analizar en términos de la difusión de las partículas. A partir de esto, conociendo la viscosidad del fluido, se pueden calcular los tamaños de las partículas.
Se utiliza en el sistema GPS para corregir el retardo de propagación , o desplazamiento temporal, entre el momento de la transmisión de la señal portadora en los satélites y el momento del receptor en tierra. Esto se hace mediante el receptor generando una señal de réplica del código C/A (de adquisición gruesa) de 1023 bits y generando líneas de chips de código [-1,1] en paquetes de diez a la vez, o 10 230 chips (1023 × 10), desplazándose ligeramente a medida que avanza para adaptarse al desplazamiento Doppler en la señal de satélite entrante, hasta que la señal de réplica del receptor y los códigos de la señal de satélite coincidan. ^[16]
La intensidad de dispersión de rayos X de ángulo pequeño de un sistema nanoestructurado es la transformada de Fourier de la función de autocorrelación espacial de la densidad electrónica.
En la ciencia de superficies y la microscopía de sonda de barrido , la autocorrelación se utiliza para establecer un vínculo entre la morfología de la superficie y las características funcionales. ^[17]
En óptica, las autocorrelaciones y correlaciones cruzadas normalizadas dan el grado de coherencia de un campo electromagnético.
En astronomía , la autocorrelación puede determinar la frecuencia de los púlsares .
En música , la autocorrelación (cuando se aplica en escalas de tiempo menores a un segundo) se utiliza como un algoritmo de detección de tono tanto para afinadores de instrumentos como para "Auto Tune" (usado como un efecto de distorsión o para fijar la entonación). ^[18] Cuando se aplica en escalas de tiempo mayores a un segundo, la autocorrelación puede identificar el ritmo musical , por ejemplo para determinar el tempo .
Los difraccionistas de rayos X utilizan la autocorrelación en el espacio en lugar del tiempo, a través de la función de Patterson , para ayudar a recuperar la "información de la fase de Fourier" sobre las posiciones de los átomos que no está disponible únicamente mediante la difracción.
En estadística, la autocorrelación espacial entre las ubicaciones de las muestras también ayuda a estimar las incertidumbres del valor medio cuando se muestrea una población heterogénea.
El algoritmo SEQUEST para analizar espectros de masas utiliza la autocorrelación junto con la correlación cruzada para evaluar la similitud de un espectro observado con un espectro idealizado que representa un péptido .
En astrofísica , la autocorrelación se utiliza para estudiar y caracterizar la distribución espacial de las galaxias en el universo y en observaciones de múltiples longitudes de onda de sistemas binarios de rayos X de baja masa .
En datos de panel , la autocorrelación espacial se refiere a la correlación de una variable consigo misma a través del espacio.
En el análisis de datos de Monte Carlo de cadenas de Markov , se debe tener en cuenta la autocorrelación para la determinación correcta del error.
En geociencias (específicamente en geofísica ) se puede utilizar para calcular un atributo sísmico de autocorrelación a partir de un estudio sísmico 3D del subsuelo.
En la ecografía médica , se utiliza la autocorrelación para visualizar el flujo sanguíneo.
En la elección de una cartera intertemporal , la presencia o ausencia de autocorrelación en la tasa de rendimiento de un activo puede afectar la porción óptima de la cartera que se debe mantener en ese activo.
En relés numéricos , se ha utilizado la autocorrelación para medir con precisión la frecuencia del sistema de potencia. ^[19]

Dependencia serial

La dependencia serial está estrechamente vinculada a la noción de autocorrelación, pero representa un concepto distinto (véase Correlación y dependencia ). En particular, es posible tener dependencia serial pero no correlación (lineal). Sin embargo, en algunos campos, ambos términos se utilizan como sinónimos.

Una serie temporal de una variable aleatoria tiene dependencia serial si el valor en algún momento de la serie depende estadísticamente del valor en otro momento . Una serie es serialmente independiente si no existe dependencia entre ningún par. $t$ $s$

Si una serie temporal es estacionaria , entonces la dependencia estadística entre el par implicaría que existe dependencia estadística entre todos los pares de valores en el mismo desfase . $\left\{X_{t}\right\}$ $(X_{t},X_{s})$ $\tau =s-t$

Véase también

Matriz de autocorrelación
Autocorrelación de una palabra formal
Técnica de autocorrelación
Autocorrelacionador
Estimación de Cochrane-Orcutt (transformación para términos de error autocorrelacionados)
Función de correlación
Correlograma
Correlación cruzada
CUMPLEAÑOS
Espectroscopia de correlación de fluorescencia
Autocorrelación óptica
Función de autocorrelación parcial
Autocorrelación filogenética (problema de Galton)
Algoritmo de detección de tono
Transformación de Prais-Winsten
Correlación escalada
Triple correlación
Estimación imparcial de la desviación estándar

Referencias

^ abcdefg Gubner, John A. (2006). Probabilidad y procesos aleatorios para ingenieros eléctricos e informáticos . Cambridge University Press. ISBN 978-0-521-86470-1.
^ abcdef Kun Il Park, Fundamentos de probabilidad y procesos estocásticos con aplicaciones a las comunicaciones, Springer, 2018, ISBN 978-3-319-68074-3
^ abc Papoulis, Athanasius, Probabilidad, variables aleatorias y procesos estocásticos , McGraw-Hill, 1991
^ ab Dunn, Patrick F. (2005). Medición y análisis de datos para ingeniería y ciencia . Nueva York: McGraw-Hill. ISBN 978-0-07-282538-1.
^ Proakis, John (31 de agosto de 2001). Ingeniería de sistemas de comunicación (2.ª edición) (2.ª ed.). Pearson. pág. 168. ISBN 978-0130617934.
^ Box, GEP; Jenkins, GM; Reinsel, GC (1994). Análisis de series temporales: pronóstico y control (3.ª ed.). Upper Saddle River, NJ: Prentice–Hall. ISBN 978-0130607744.
^ Frenkel, D.; Smit, B. (2002). "cap. 4.4.2". Entendiendo la simulación molecular (2.ª ed.). Londres: Academic Press. ISBN 978-0122673511.
^ Colberg, P.; Höfling, F. (2011). "Simulaciones altamente aceleradas de dinámicas vítreas utilizando GPU: advertencias sobre precisión de punto flotante limitada". Comput. Phys. Commun. 182 (5): 1120–1129. arXiv : 0912.3824 . Código Bibliográfico :2011CoPhC.182.1120C. doi :10.1016/j.cpc.2011.01.009. S2CID 7173093.
^ Priestley, MB (1982). Análisis espectral y series temporales . Londres, Nueva York: Academic Press. ISBN 978-0125649018.
^ Percival, Donald B.; Andrew T. Walden (1993). Análisis espectral para aplicaciones físicas: técnicas univariadas convencionales y multicono . Cambridge University Press. págs. 190–195. ISBN 978-0-521-43541-3.
^ Percival, Donald B. (1993). "Tres propiedades curiosas de la varianza muestral y la autocovarianza para procesos estacionarios con media desconocida". The American Statistician . 47 (4): 274–276. doi :10.1080/00031305.1993.10475997.
^ "Técnicas de correlación serial". Ideas estadísticas . 26 de mayo de 2014.
^ Baum, Christopher F. (2006). Introducción a la econometría moderna con Stata . Stata Press. ISBN 978-1-59718-013-9.
^ Elson, Elliot L. (diciembre de 2011). "Espectroscopia de correlación de fluorescencia: pasado, presente, futuro". Biophysical Journal . 101 (12): 2855–2870. Bibcode :2011BpJ...101.2855E. doi :10.1016/j.bpj.2011.11.012. PMC 3244056 . PMID 22208184.
^ Hołyst, Robert; Poniewierski, Andrzej; Zhang, Xuzhu (2017). "Forma analítica de la función de autocorrelación para la espectroscopia de correlación de fluorescencia". Soft Matter . 13 (6): 1267–1275. Bibcode :2017SMat...13.1267H. doi : 10.1039/C6SM02643E . ISSN 1744-683X. PMID 28106203.
^ Van Sickle, Jan (2008). GPS para agrimensores (tercera edición). CRC Press. págs. 18-19. ISBN 978-0-8493-9195-8.
^ Kalvani, Payam Rajabi; Jahangiri, Ali Reza; Shapouri, Samaneh; Sari, Amirhossein; Jalili, Yousef Seyed (agosto de 2019). "Análisis AFM multimodo de películas delgadas de óxido de zinc dopado con aluminio pulverizadas a varias temperaturas de sustrato para aplicaciones optoelectrónicas". Superlattices and Microstructures . 132 : 106173. doi :10.1016/j.spmi.2019.106173. S2CID 198468676.
^ Tyrangiel, Josh (5 de febrero de 2009). "Auto-Tune: por qué la música pop suena perfecta". Time . Archivado desde el original el 10 de febrero de 2009.
^ Kasztenny, Bogdan (marzo de 2016). "Un nuevo método para la medición rápida de frecuencias para aplicaciones de protección" (PDF) . Schweitzer Engineering Laboratories. Archivado (PDF) del original el 2022-10-09 . Consultado el 28 de mayo de 2022 .

Lectura adicional

Kmenta, Jan (1986). Elementos de econometría (segunda edición). Nueva York: Macmillan. Págs. 298-334. ISBN. 978-0-02-365070-3.
Marno Verbeek (10 de agosto de 2017). Una guía para la econometría moderna. Wiley. ISBN 978-1-119-40110-0.
Soltanalian, Mojtaba; Stoica, Petre (2012). "Diseño computacional de secuencias con buenas propiedades de correlación". IEEE Transactions on Signal Processing . 60 (5): 2180. Bibcode :2012ITSP...60.2180S. doi :10.1109/TSP.2012.2186134.
Solomon W. Golomb y Guang Gong . Diseño de señales para una buena correlación: para comunicaciones inalámbricas, criptografía y radar. Cambridge University Press, 2005.
Klapetek, Petr (2018). Procesamiento cuantitativo de datos en microscopía de sonda de barrido: aplicaciones de SPM para nanometrología (segunda edición). Elsevier. pp. 108–112 ISBN 9780128133477 .
Weisstein, Eric W. "Autocorrelación". MathWorld .