La adaptación de forma afín es una metodología para adaptar iterativamente la forma de los núcleos de suavizado en un grupo afín de núcleos de suavizado a la estructura de la imagen local en la región vecina de un punto de imagen específico. De manera equivalente, la adaptación de forma afín se puede lograr deformando iterativamente un parche de imagen local con transformaciones afines mientras se aplica un filtro simétrico rotacional a los parches de imagen deformados. Siempre que este proceso iterativo converja, el punto fijo resultante será invariante afín . En el área de visión por computadora , esta idea se ha utilizado para definir operadores de puntos de interés invariantes afines, así como métodos de análisis de textura invariantes afines.
Los puntos de interés obtenidos a partir del detector de manchas laplaciano adaptado a la escala o del detector de esquinas de Harris multiescala con selección automática de escala son invariantes a las traslaciones, rotaciones y reescalamientos uniformes en el dominio espacial. Sin embargo, las imágenes que constituyen la entrada a un sistema de visión por computadora también están sujetas a distorsiones de perspectiva. Para obtener puntos de interés que sean más robustos a las transformaciones de perspectiva, un enfoque natural es diseñar un detector de características que sea invariante a las transformaciones afines .
La invariancia afín se puede lograr a partir de mediciones de la misma matriz de segundo momento en ventana multiescala que se utiliza en el operador multiescala de Harris, siempre que ampliemos el concepto de espacio de escala regular obtenido por convolución con núcleos gaussianos rotacionalmente simétricos a un espacio de escala gaussiano afín obtenido por núcleos gaussianos adaptados a la forma (Lindeberg 1994, sección 15.3; Lindeberg y Garding 1997). Para una imagen bidimensional , sea y sea una matriz 2×2 definida positiva. Entonces, un núcleo gaussiano no uniforme se puede definir como
y dada cualquier imagen de entrada, el espacio de escala gaussiano afín es el espacio de escala de tres parámetros definido como
A continuación, introduzca una transformación afín donde es una matriz 2×2 y defina una imagen transformada como
Entonces, las representaciones afines del espacio de escala y de y , respectivamente, están relacionadas de acuerdo con
siempre que las matrices de forma afín y estén relacionadas de acuerdo con
Dejando de lado los detalles matemáticos, que lamentablemente se vuelven algo técnicos si uno busca una descripción precisa de lo que está sucediendo, el mensaje importante es que el espacio de escala gaussiano afín está cerrado bajo transformaciones afines .
Si, dada la notación así como la matriz de forma local y una matriz de forma de integración , introducimos una matriz de segundo momento multiescala adaptada afín de acuerdo con
Se puede demostrar que bajo cualquier transformación afín, la matriz de segundo momento multiescala adaptada afín se transforma de acuerdo con
Nuevamente, dejando de lado detalles técnicos un tanto confusos, el mensaje importante aquí es que, dada una correspondencia entre los puntos de la imagen y , la transformación afín se puede estimar a partir de mediciones de las matrices de segundo momento de múltiples escalas y en los dos dominios.
Una consecuencia importante de este estudio es que si podemos encontrar una transformación afín tal que sea una constante multiplicada por la matriz unitaria, entonces obtenemos un punto fijo que es invariante a las transformaciones afines (Lindeberg 1994, sección 15.4; Lindeberg y Garding 1997). Para fines de implementación práctica, esta propiedad a menudo se puede alcanzar de dos maneras principales. El primer enfoque se basa en transformaciones de los filtros de suavizado y consiste en:
El segundo enfoque se basa en deformaciones en el dominio de la imagen e implica:
Este proceso general se conoce como adaptación de forma afín (Lindeberg y Garding, 1997; Baumberg, 2000; Mikolajczyk y Schmid, 2004; Tuytelaars y van Gool, 2004; Ravela, 2004; Lindeberg, 2008). En el caso continuo ideal, los dos enfoques son matemáticamente equivalentes. Sin embargo, en las implementaciones prácticas, el primer enfoque basado en filtros suele ser más preciso en presencia de ruido, mientras que el segundo enfoque basado en deformación suele ser más rápido.
En la práctica, el proceso de adaptación de forma afín descrito aquí se combina a menudo con la selección automática de escala de detección de puntos de interés, como se describe en los artículos sobre detección de manchas y detección de esquinas , para obtener puntos de interés que sean invariantes con respecto al grupo afín completo, incluidos los cambios de escala. Además del operador de Harris multiescala de uso común, esta adaptación de forma afín también se puede aplicar a otros tipos de operadores de puntos de interés, como el operador de manchas laplaciano/diferencia de gaussiano y el determinante del hessiano (Lindeberg 2008). La adaptación de forma afín también se puede utilizar para el reconocimiento de texturas invariantes afines y la segmentación de texturas invariantes afines.
Estrechamente relacionada con la noción de adaptación de forma afín está la noción de normalización afín , que define un marco de referencia invariante afín como se describe con más detalle en Lindeberg (2013a,b, 2021:Apéndice I.3), de modo que cualquier medición de imagen realizada en el marco de referencia invariante afín es invariante afín.
Integración del operador multiescala de Harris con la metodología para la selección automática de escala, así como con la adaptación afín de forma.