En el campo de la visión informática, el reconocimiento de regiones se refiere a las técnicas cuyo objetivo es detectar puntos o regiones más claras o más oscuras de la imagen.
Hay dos clases principales de detectores de regiones (i) métodos diferenciales y (ii) métodos basados en extremos locales.
El estudio y desarrollo de estos detectores es importante por varias razones.
La principal es dar información complementaria sobre regiones que no se puede obtener mediante detectores de bordes o detectores de esquinas.
, esa imagen está convuelta por un kernel Gaussiano:
Y normalmente da una fuerte respuesta positiva para regiones oscuras de extensión
y negativa para regiones claras de tamaño similar.
El principal problema al aplicar este operador a escala única es que su respuesta es muy dependiente de la relación entre el tamaño de la región y el tamaño del kernel Gaussiano usado para preparar la imagen.
Para detectar automáticamente regiones de tamaño desconocido es necesaria una aproximación a varias escalas.
con respecto tanto a espacio como escala (Lindeberg 1994, 1998).
se forma una imagen 3D discreta escala-espacio de volumen
, y un punto se considera como una región clara si el valor en ese punto es mayor que el valor en sus 24 vecinos (y menor para regiones oscuras).
se llevan a cabo conforme a Esta interpretación de la región proporciona una definición matemática precisa de lo que entendemos por "región", que nos lleva a un algoritmo eficiente y robusto para la detección de regiones.
Algunas propiedades básicas de estas regiones son que las respuestas son covariantes con su traslado, rotación y re-escalado en el dominio de la imagen.
Así pues, si un máximo de la escala-espacio se encuentra en el punto
entonces al redimensionar la imagen bajo una escala de factor
se puede obtener como el límite de la diferencia entre dos imágenes suavizadas Gaussianamente En la visión informática, a esto se le denomina Diferencia de Gauss.
Salvando las diferencias, este operador es muy similar al Laplaciano, y se puede ver como una aproximación del operador Laplaciano.
Si consideramos el determinante del Hessiano a escala normalizada, también llamado operador Monge–Ampère, donde
vienen también definidos por una operación geométrica diferencial que nos conduce a descriptores de regiones covariantes al traslado, rotado y reescalado de la imagen.
Se ha propuesto un operador híbrido entre el Laplaciano y el determinante del Hessiano, que realiza la selección espacial mediante el determinante del Hessiano y la escala mediante el Laplaciano (Mikolajczyk and Schmid 2004): Este operador ha sido usado para detección de imágenes, reconocimiento de objetos y análisis de texturas.
Para obtener descriptores de regiones más robustos a estas distorsiones, es necesario crear detectores invariantes a transformaciones afines.
En la práctica, puntos invariantes afines se pueden obtener aplicando una adaptación de forma afín a un descriptor de región, donde la forma del kernel de alisado es deformada reiteradamente para ajustarse a la estructura de la imagen, o lo que es lo mismo, una imagen de ajuste se va deformando mientras la forma del kernel de alisado se mantiene rotacionalmente simétrica (Lindeberg and Garding 1997; Baumberg 2000; Mikolajczyk and Schmid 2004, Lindeberg 2008/2009 ).
De esta forma, podemos definir una versión adaptada a transformaciones afines del operador Laplaciano/Diferencia de Gauss, el determinante del Hessiano y el operador Hessiano-Laplaciano (ver Harris-Affine[2] y Hessian-Affine[3]).
El inconveniente de esto es que los extremos locales son muy sensibles al ruido.
Para solventar esto, Lindeberg (1993, 1994) estudió el problema de detectar máximos locales con extensión a múltiples escalas.
Una región con extensión espacial se asocia con cada máximo local.
Estudiando cómo evolucionan estas estructuras a escalas crecientes, aparece la idea de regiones escala-espacio.
Lindeberg desarrolló un algoritmo para detectar regiones en escala de grises que se sigue usando y puede ser consultado aquí,[4] así como algoritmos derivados del mismo.