En la ciencia de la imagen , la diferencia de gaussianos ( DoG ) es un algoritmo de mejora de características que implica la resta de una versión borrosa gaussiana de una imagen original de otra versión menos borrosa del original. En el caso simple de imágenes en escala de grises , las imágenes borrosas se obtienen convolucionando las imágenes originales en escala de grises con núcleos gaussianos que tienen diferentes anchos (desviaciones estándar). Desenfocar una imagen utilizando un núcleo gaussiano suprime sólo la información espacial de alta frecuencia . Restar una imagen de la otra conserva la información espacial que se encuentra entre el rango de frecuencias que se conservan en las dos imágenes borrosas. Por lo tanto, el DoG es un filtro de paso de banda espacial que atenúa las frecuencias en la imagen original en escala de grises que están lejos del centro de la banda. [1]
Dada una imagen en escala de grises de n dimensiones , la diferencia de gaussianas (DoG) de la imagen es la función que se obtiene restando la imagen convolucionada con la gaussiana de desviación estándar de la imagen convolucionada con una gaussiana de desviación estándar más estrecha :
donde es un gaussiano con desviación estándar :
De manera equivalente se puede escribir
que representa una imagen convolucionada por la diferencia de dos gaussianas, que se aproxima a una función de sombrero mexicano .
La relación entre la diferencia del operador gaussiano y el laplaciano del operador gaussiano (la wavelet del sombrero mexicano ) se explica en el apéndice A en Lindeberg (2015). [2]
Como algoritmo de mejora de características , la diferencia de gaussianas se puede utilizar para aumentar la visibilidad de los bordes y otros detalles presentes en una imagen digital. Una amplia variedad de filtros de nitidez de bordes alternativos funcionan mejorando los detalles de alta frecuencia, pero debido a que el ruido aleatorio también tiene una frecuencia espacial alta, muchos de estos filtros de nitidez tienden a mejorar el ruido, lo que puede ser un artefacto indeseable. La diferencia del algoritmo gaussiano elimina los detalles de alta frecuencia que a menudo incluyen ruido aleatorio, lo que convierte a este enfoque en uno de los más adecuados para procesar imágenes con un alto grado de ruido. Un inconveniente importante de la aplicación del algoritmo es una reducción inherente en el contraste general de la imagen producida por la operación. [1]
Cuando se utiliza para mejorar la imagen, la diferencia del algoritmo gaussiano se aplica normalmente cuando la relación de tamaño del núcleo (2) al núcleo (1) es 4:1 o 5:1. En las imágenes de ejemplo de la derecha, los tamaños de los núcleos gaussianos empleados para suavizar la imagen de muestra fueron 10 píxeles y 5 píxeles.
El algoritmo también se puede utilizar para obtener una aproximación del laplaciano de Gauss cuando la relación entre el tamaño 2 y el tamaño 1 es aproximadamente igual a 1,6. [3] El Laplaciano de Gauss es útil para detectar bordes que aparecen en varias escalas de imagen o grados de enfoque de la imagen. Los valores exactos de los tamaños de los dos núcleos que se utilizan para aproximar el laplaciano de Gauss determinarán la escala de la imagen de diferencia, que como resultado puede aparecer borrosa.
Las diferencias de gaussianas también se han utilizado para la detección de manchas en la transformación de características invariantes de escala . De hecho, DoG como diferencia de dos distribuciones normales multivariadas siempre tiene una suma nula total y su convolución con una señal uniforme no genera respuesta. Se aproxima bien a un segundo derivado del gaussiano ( laplaciano del gaussiano ) con K~1,6 y a los campos receptivos de las células ganglionares de la retina con K~5. Puede usarse fácilmente en esquemas recursivos y se usa como operador en algoritmos en tiempo real para la detección de blobs y la selección automática de escala.
En su funcionamiento, se cree que la diferencia del algoritmo gaussiano imita cómo el procesamiento neuronal en la retina del ojo extrae detalles de las imágenes destinadas a ser transmitidas al cerebro. [4] [5] [6]