En la visión artificial , la disimilitud de Birchfield-Tomasi es una medida de disimilitud de imágenes por píxel que es robusta con respecto a los efectos de muestreo . En la comparación de dos elementos de la imagen, ajusta la intensidad de un píxel a la intensidad interpolada linealmente alrededor de un píxel correspondiente en la otra imagen. [1] Se utiliza como una medida de disimilitud en la correspondencia estéreo, donde se realiza una búsqueda unidimensional de correspondencias para recuperar un mapa de disparidad denso a partir de un par de imágenes estéreo . [2] [3] [4]
Descripción
Al realizar la correspondencia de imágenes píxel por píxel , la medida de disimilitud entre pares de píxeles de diferentes imágenes se ve afectada por diferencias en la adquisición de imágenes, como el sesgo de iluminación y el ruido . Incluso cuando se supone que no hay diferencias en estos aspectos entre un par de imágenes, el proceso de muestreo de píxeles introduce inconsistencias adicionales, porque cada píxel es una muestra obtenida integrando la señal de luz continua sobre una región finita del espacio, y dos píxeles que coinciden con la misma característica del contenido de la imagen pueden corresponder a regiones ligeramente diferentes del objeto real que pueden reflejar la luz de manera diferente y pueden estar sujetas a oclusión parcial, discontinuidad de profundidad o desenfoque de lente diferente, generando así señales de intensidad diferentes. [1]
La medida de Birchfield-Tomasi compensa el efecto de muestreo considerando la interpolación lineal de las muestras. La similitud de píxeles se determina luego encontrando la mejor coincidencia entre la intensidad de una muestra de píxeles en una imagen y la función interpolada en un intervalo alrededor de una ubicación en la otra imagen. [1]
Considerando el problema de correspondencia estéreo para un par estéreo rectificado , donde la búsqueda de correspondencias se realiza en una dimensión, dadas dos columnas y a lo largo de la misma línea de exploración para la imagen izquierda y derecha respectivamente, es posible definir dos funciones simétricas
donde y son las funciones de interpolación lineal de la intensidad de la imagen izquierda y derecha y a lo largo de la línea de exploración. La disimilitud de Birchfield-Tomasi se puede definir como [1]
En la práctica, la medida se puede calcular con solo una pequeña y constante sobrecarga con respecto al cálculo de la diferencia de intensidad simple, porque no es necesario reconstruir la función interpolante. Dado que el interpolante es lineal dentro de cada intervalo unitario centrado alrededor de un píxel, su mínimo se encuentra en uno de sus extremos. Por lo tanto, se puede escribir como
dónde
denotando con y los valores de las intensidades interpoladas en los extremos más a la derecha y más a la izquierda de un intervalo de un píxel centrado alrededor
La otra función se puede reescribir de manera similar, completando la expresión para . [1]
Referencias
- ^ abcde Birchfield y Tomasi (1998)
- ^ Hirschmüller y Scharstein (2007)
- ^ Szeliski y Scharstein (2004)
- ^ Morales y otros (2013)
- Birchfield, Stan; Tomasi, Carlo (1998). "Una medida de disimilitud de píxeles que es insensible al muestreo de imágenes". IEEE Transactions on Pattern Analysis and Machine Intelligence . 20 (4). IEEE: 401–406.
- Hirschmüller, Heiko; Scharstein, Daniel (2007). "Evaluación de funciones de costo para emparejamiento estéreo". Conferencia IEEE 2007 sobre Visión artificial y reconocimiento de patrones .
- Morales, Nestor; Camellini, Gabriele; Felisa, Mirko; Grisleri, Paolo; Zani, Paolo (2013). Análisis de desempeño de algoritmos de reconstrucción estéreo . 16.ª Conferencia Internacional IEEE sobre Sistemas Inteligentes de Transporte. págs. 1298–1303.
- Szeliski, Richard; Scharstein, Daniel (2004). "Muestreo de la imagen del espacio de disparidad". IEEE Transactions on Pattern Analysis and Machine Intelligence . 26 (3): 419–425.