stringtranslate.com

Correlación cruzada

Comparación visual de convolución , correlación cruzada y autocorrelación . Para las operaciones que involucran la función f y suponiendo que la altura de f es 1,0, el valor del resultado en 5 puntos diferentes se indica mediante el área sombreada debajo de cada punto. Además, la simetría vertical de f es la razón y son idénticos en este ejemplo.

En el procesamiento de señales , la correlación cruzada es una medida de similitud de dos series en función del desplazamiento de una con respecto a la otra. Esto también se conoce como producto escalar deslizante o producto interno deslizante . Se utiliza comúnmente para buscar una característica conocida más corta en una señal larga. Tiene aplicaciones en el reconocimiento de patrones , análisis de partículas individuales , tomografía electrónica , promediado , criptoanálisis y neurofisiología . La correlación cruzada es similar en naturaleza a la convolución de dos funciones. En una autocorrelación , que es la correlación cruzada de una señal consigo misma, siempre habrá un pico en un desfase de cero, y su tamaño será la energía de la señal.

En probabilidad y estadística , el término correlaciones cruzadas se refiere a las correlaciones entre las entradas de dos vectores aleatorios y , mientras que las correlaciones de un vector aleatorio son las correlaciones entre las entradas de sí mismo, las que forman la matriz de correlación de . Si cada uno de y es una variable aleatoria escalar que se realiza repetidamente en una serie temporal , entonces las correlaciones de las diversas instancias temporales de se conocen como autocorrelaciones de , y las correlaciones cruzadas de con a lo largo del tiempo son correlaciones cruzadas temporales. En probabilidad y estadística, la definición de correlación siempre incluye un factor de estandarización de tal manera que las correlaciones tienen valores entre −1 y +1.

Si y son dos variables aleatorias independientes con funciones de densidad de probabilidad y , respectivamente, entonces la densidad de probabilidad de la diferencia se da formalmente por la correlación cruzada (en el sentido de procesamiento de señales) ; sin embargo, esta terminología no se utiliza en probabilidad y estadística. En cambio, la convolución (equivalente a la correlación cruzada de y ) da la función de densidad de probabilidad de la suma .

Correlación cruzada de señales deterministas

Para funciones continuas y , la correlación cruzada se define como: [1] [2] [3] que es equivalente a donde denota el conjugado complejo de , y se llama desplazamiento o rezago. Para funciones altamente correlacionadas y que tienen una correlación cruzada máxima en un , una característica en en también ocurre más tarde en en , por lo tanto, podría describirse como rezagada por .

Si y son ambas funciones periódicas continuas de período , la integración de a se reemplaza por la integración sobre cualquier intervalo de longitud : que es equivalente a De manera similar, para funciones discretas, la correlación cruzada se define como: [4] [5] que es equivalente a: Para funciones discretas finitas , la correlación cruzada (circular) se define como: [6] que es equivalente a: Para funciones discretas finitas , , la correlación cruzada de kernel se define como: [7] donde es un vector de funciones de kernel y es una transformada afín .

En concreto, puede ser una transformación de traslación circular, una transformación de rotación o una transformación de escala, etc. La correlación cruzada de kernel extiende la correlación cruzada del espacio lineal al espacio de kernel. La correlación cruzada es equivariante a la traslación; la correlación cruzada de kernel es equivariante a cualquier transformación afín, incluidas la traslación, la rotación y la escala, etc.

Explicación

Como ejemplo, considere dos funciones con valores reales y que difieren solo por un desplazamiento desconocido a lo largo del eje x. Se puede usar la correlación cruzada para encontrar cuánto se debe desplazar a lo largo del eje x para que sea idéntica a . La fórmula esencialmente desliza la función a lo largo del eje x, calculando la integral de su producto en cada posición. Cuando las funciones coinciden, el valor de se maximiza. Esto se debe a que cuando los picos (áreas positivas) están alineados, hacen una gran contribución a la integral. De manera similar, cuando los valles (áreas negativas) se alinean, también hacen una contribución positiva a la integral porque el producto de dos números negativos es positivo.

Animación de cómo se calcula la correlación cruzada. El gráfico de la izquierda muestra una función verde G que está desfasada con respecto a la función F por un desplazamiento temporal de 𝜏. El gráfico del medio muestra la función F y la G desfasada representadas juntas como una curva de Lissajous . Al integrar F multiplicada por la G desfasada se obtiene el gráfico de la derecha, la correlación cruzada en todos los valores de 𝜏.

Con funciones de valores complejos y , tomar el conjugado de garantiza que los picos alineados (o valles alineados) con componentes imaginarios contribuirán positivamente a la integral.

En econometría , la correlación cruzada rezagada a veces se denomina autocorrelación cruzada. [8] : pág. 74 

Propiedades

Correlación cruzada de vectores aleatorios

Definición

Para vectores aleatorios y , cada uno de los cuales contiene elementos aleatorios cuyo valor esperado y varianza existen, la matriz de correlación cruzada de y se define por [10] : p.337  y tiene dimensiones . Escrito por componentes: Los vectores aleatorios y no necesitan tener la misma dimensión, y cualquiera de ellos puede ser un valor escalar. Donde es el valor esperado .

Ejemplo

Por ejemplo, si y son vectores aleatorios, entonces es una matriz cuya entrada -ésima es .

Definición de vectores aleatorios complejos

Si y son vectores aleatorios complejos , cada uno de los cuales contiene variables aleatorias cuyo valor esperado y varianza existen, la matriz de correlación cruzada de y se define por donde denota la transposición hermítica .

Correlación cruzada de procesos estocásticos

En el análisis de series de tiempo y las estadísticas , la correlación cruzada de un par de procesos aleatorios es la correlación entre los valores de los procesos en diferentes momentos, como una función de los dos momentos. Sea un par de procesos aleatorios y cualquier momento en el tiempo ( puede ser un entero para un proceso de tiempo discreto o un número real para un proceso de tiempo continuo ). Entonces es el valor (o realización ) producido por una ejecución dada del proceso en el momento .

Función de correlación cruzada

Supóngase que el proceso tiene medias y y varianzas y en el tiempo , para cada . Entonces la definición de la correlación cruzada entre los tiempos y es [10] : p.392  donde es el operador de valor esperado . Nótese que esta expresión puede no estar definida.

Función de covarianza cruzada

Restando la media antes de la multiplicación se obtiene la covarianza cruzada entre los tiempos y : [10] : p.392  Nótese que esta expresión no está bien definida para todas las series de tiempo o procesos, porque la media o la varianza pueden no existir.

Definición de proceso estocástico estacionario de sentido amplio

Sea un par de procesos estocásticos que son estacionarios en sentido amplio . Entonces, la función de covarianza cruzada y la función de correlación cruzada se dan de la siguiente manera.

Función de correlación cruzada

o equivalentemente

Función de covarianza cruzada

o equivalentemente donde y son la media y la desviación estándar del proceso , que son constantes en el tiempo debido a la estacionariedad; y de manera similar para , respectivamente. indica el valor esperado . Que la covarianza cruzada y la correlación cruzada sean independientes de es precisamente la información adicional (más allá de ser estacionarios individualmente en sentido amplio) transmitida por el requisito de que sean estacionarios en sentido amplio en conjunto .

La correlación cruzada de un par de procesos estocásticos estacionarios de sentido amplio puede estimarse promediando el producto de las muestras medidas de un proceso y las muestras medidas del otro (y sus desplazamientos temporales). Las muestras incluidas en el promedio pueden ser un subconjunto arbitrario de todas las muestras de la señal (por ejemplo, muestras dentro de una ventana temporal finita o un submuestreo [ ¿cuál? ] de una de las señales). Para una gran cantidad de muestras, el promedio converge a la correlación cruzada verdadera.

Normalización

En algunas disciplinas (por ejemplo, estadística y análisis de series temporales ) es una práctica habitual normalizar la función de correlación cruzada para obtener un coeficiente de correlación de Pearson dependiente del tiempo . Sin embargo, en otras disciplinas (por ejemplo, ingeniería), la normalización suele descartarse y los términos "correlación cruzada" y "covarianza cruzada" se utilizan indistintamente.

La definición de la correlación cruzada normalizada de un proceso estocástico es Si la función está bien definida, su valor debe estar en el rango , donde 1 indica una correlación perfecta y −1 indica una anticorrelación perfecta .

Para los procesos estocásticos estacionarios de sentido amplio conjuntamente, la definición es La normalización es importante tanto porque la interpretación de la autocorrelación como correlación proporciona una medida libre de escala de la fuerza de la dependencia estadística , como porque la normalización tiene un efecto sobre las propiedades estadísticas de las autocorrelaciones estimadas.

Propiedades

Propiedad de simetría

Para procesos estocásticos estacionarios de sentido amplio conjuntamente, la función de correlación cruzada tiene la siguiente propiedad de simetría: [11] : p.173  Respectivamente, para procesos WSS conjuntamente:

Análisis de retardo de tiempo

Las correlaciones cruzadas son útiles para determinar el retardo de tiempo entre dos señales, por ejemplo, para determinar los retardos de tiempo para la propagación de señales acústicas a través de una matriz de micrófonos. [12] [13] [ aclaración necesaria ] Después de calcular la correlación cruzada entre las dos señales, el máximo (o mínimo si las señales están correlacionadas negativamente) de la función de correlación cruzada indica el punto en el tiempo donde las señales están mejor alineadas; es decir, el retardo de tiempo entre las dos señales está determinado por el argumento del máximo, o arg max de la correlación cruzada , como en Terminología en procesamiento de imágenes

Correlación cruzada normalizada a cero (ZNCC)

Para las aplicaciones de procesamiento de imágenes en las que el brillo de la imagen y la plantilla pueden variar debido a las condiciones de iluminación y exposición, las imágenes se pueden normalizar primero. Esto se hace normalmente en cada paso restando la media y dividiendo por la desviación estándar . Es decir, la correlación cruzada de una plantilla con una subimagen es



donde es el número de píxeles en y , es el promedio de y es la desviación estándar de .

En términos de análisis funcional , esto puede considerarse como el producto escalar de dos vectores normalizados . Es decir, si y entonces la suma anterior es igual a donde es el producto interno y es la norma L ² . Cauchy-Schwarz entonces implica que ZNCC tiene un rango de .

Por lo tanto, si y son matrices reales, su correlación cruzada normalizada es igual al coseno del ángulo entre los vectores unitarios y , siendo así si y solo si es igual a multiplicado por un escalar positivo.

La correlación normalizada es uno de los métodos utilizados para la comparación de plantillas , un proceso que se utiliza para encontrar instancias de un patrón u objeto dentro de una imagen. También es la versión bidimensional del coeficiente de correlación producto-momento de Pearson .

Correlación cruzada normalizada (NCC)

El NCC es similar al ZNCC con la única diferencia de no restar el valor medio local de las intensidades:

Sistemas no lineales

Se debe tener cuidado al utilizar la correlación cruzada para sistemas no lineales. En ciertas circunstancias, que dependen de las propiedades de la entrada, la correlación cruzada entre la entrada y la salida de un sistema con dinámica no lineal puede ser completamente ciega a ciertos efectos no lineales. [14] Este problema surge porque algunos momentos cuadráticos pueden ser iguales a cero y esto puede sugerir incorrectamente que hay poca "correlación" (en el sentido de dependencia estadística) entre dos señales, cuando en realidad las dos señales están fuertemente relacionadas por la dinámica no lineal.

Véase también

Referencias

  1. ^ Bracewell, R. "Notación de pentagrama para correlación cruzada". La transformada de Fourier y sus aplicaciones. Nueva York: McGraw-Hill, págs. 46 y 243, 1965.
  2. ^ Papoulis, A. La integral de Fourier y sus aplicaciones. Nueva York: McGraw-Hill, págs. 244-245 y 252-253, 1962.
  3. ^ Weisstein, Eric W. "Correlación cruzada". De MathWorld, un recurso web de Wolfram. http://mathworld.wolfram.com/Cross-Correlation.html
  4. ^ Rabiner, LR; Schafer, RW (1978). Procesamiento digital de señales de voz . Serie de procesamiento de señales. Upper Saddle River, NJ: Prentice Hall. págs. 147–148. ISBN 0132136031.
  5. ^ Rabiner, Lawrence R.; Gold, Bernard (1975). Teoría y aplicación del procesamiento de señales digitales . Englewood Cliffs, NJ: Prentice-Hall. pp. 401. ISBN. 0139141014.
  6. ^ Wang, Chen (2019). Aprendizaje de núcleo para la percepción visual, Capítulo 2.2.1 (Tesis doctoral). Universidad Tecnológica de Nanyang, Singapur. págs. 17-18. doi : 10.32657/10220/47835 . hdl : 10356/105527 .
  7. ^ Wang, Chen; Zhang, Le; Yuan, Junsong; Xie, Lihua (2018). "Correlador cruzado de núcleo". Actas de la Conferencia AAAI sobre Inteligencia Artificial . La trigésima segunda Conferencia AAAI sobre Inteligencia Artificial. 32 . Asociación para el Avance de la Inteligencia Artificial: 4179–4186. doi : 10.1609/aaai.v32i1.11710 . S2CID  3544911.
  8. ^ Campbell; Lo; MacKinlay (1996). La econometría de los mercados financieros . Nueva Jersey: Princeton University Press. ISBN 0691043019.
  9. ^ Kapinchev, Konstantin; Bradu, Adrian; Barnes, Frederick; Podoleanu, Adrian (2015). "Implementación de correlación cruzada en GPU para generación de imágenes en tiempo real". 2015 9.ª Conferencia internacional sobre procesamiento de señales y sistemas de comunicación (ICSPCS) . págs. 1–6. doi :10.1109/ICSPCS.2015.7391783. ISBN . 978-1-4673-8118-5. Número de identificación del sujeto  17108908.
  10. ^ abc Gubner, John A. (2006). Probabilidad y procesos aleatorios para ingenieros eléctricos e informáticos . Cambridge University Press. ISBN 978-0-521-86470-1.
  11. ^ Kun Il Park, Fundamentos de probabilidad y procesos estocásticos con aplicaciones a las comunicaciones, Springer, 2018, 978-3-319-68074-3
  12. ^ Rhudy, Matthew; Brian Bucci; Jeffrey Vipperman; Jeffrey Allanach; Bruce Abraham (noviembre de 2009). Métodos de análisis de arreglos de micrófonos mediante correlaciones cruzadas . Actas del Congreso Internacional de Ingeniería Mecánica de la ASME de 2009, Lake Buena Vista, Florida. págs. 281–288. doi :10.1115/IMECE2009-10798. ISBN 978-0-7918-4388-8.
  13. ^ Rhudy, Matthew (noviembre de 2009). Implementación en tiempo real de un clasificador de impulso militar (tesis de maestría). Universidad de Pittsburgh.
  14. ^ Billings, SA (2013). Identificación de sistemas no lineales: métodos NARMAX en los dominios de tiempo, frecuencia y espacio-temporal . Wiley. ISBN 978-1-118-53556-1.

Lectura adicional

Enlaces externos