Diferencia de gaussianos

En la ciencia de la imagen , la diferencia de gaussianos ( DoG ) es un algoritmo de mejora de características que implica la resta de una versión borrosa gaussiana de una imagen original de otra versión menos borrosa del original. En el caso simple de imágenes en escala de grises , las imágenes borrosas se obtienen convolucionando las imágenes originales en escala de grises con núcleos gaussianos que tienen diferentes anchos (desviaciones estándar). Desenfocar una imagen utilizando un núcleo gaussiano suprime sólo la información espacial de alta frecuencia . Restar una imagen de la otra conserva la información espacial que se encuentra entre el rango de frecuencias que se conservan en las dos imágenes borrosas. Por lo tanto, el DoG es un filtro de paso de banda espacial que atenúa las frecuencias en la imagen original en escala de grises que están lejos del centro de la banda. ^[1]

Matemáticas de la diferencia de gaussianos.

Dada una imagen en escala de grises de n dimensiones , la diferencia de gaussianas (DoG) de la imagen es la función que se obtiene restando la imagen convolucionada con la gaussiana de desviación estándar de la imagen convolucionada con una gaussiana de desviación estándar más estrecha : $I:\mathbb {R} ^{n}\rightarrow \mathbb {R}$ $I$ $\Gamma _{\sigma _{1},\sigma _{2}}:\mathbb {R} ^{n}\rightarrow \mathbb {R}$ $I$ $\sigma _{2}$ $I$ $\sigma _{1}<\sigma _{2}$

\Gamma _{\sigma _{1},\sigma _{2}}=I*G_{\sigma _{1}}-I*G_{\sigma _{2}},

donde es un gaussiano con desviación estándar : $G_{\sigma }:\mathbb {R} ^{n}\rightarrow \mathbb {R}$ $\sigma$

G_{\sigma }(x)={\frac {1}{(\sigma ^{2}2\pi )^{n/2}}}e^{-{\frac {\|x\ |^{2}}{2\sigma ^{2}}}}.

De manera equivalente se puede escribir

\Gamma _{\sigma _{1},\sigma _{2}}=I*(G_{\sigma _{1}}-G_{\sigma _{2}})

que representa una imagen convolucionada por la diferencia de dos gaussianas, que se aproxima a una función de sombrero mexicano .

La relación entre la diferencia del operador gaussiano y el laplaciano del operador gaussiano (la wavelet del sombrero mexicano ) se explica en el apéndice A en Lindeberg (2015). ^[2]

Detalles y aplicaciones

Como algoritmo de mejora de características , la diferencia de gaussianas se puede utilizar para aumentar la visibilidad de los bordes y otros detalles presentes en una imagen digital. Una amplia variedad de filtros de nitidez de bordes alternativos funcionan mejorando los detalles de alta frecuencia, pero debido a que el ruido aleatorio también tiene una frecuencia espacial alta, muchos de estos filtros de nitidez tienden a mejorar el ruido, lo que puede ser un artefacto indeseable. La diferencia del algoritmo gaussiano elimina los detalles de alta frecuencia que a menudo incluyen ruido aleatorio, lo que convierte a este enfoque en uno de los más adecuados para procesar imágenes con un alto grado de ruido. Un inconveniente importante de la aplicación del algoritmo es una reducción inherente en el contraste general de la imagen producida por la operación. ^[1]

Cuando se utiliza para mejorar la imagen, la diferencia del algoritmo gaussiano se aplica normalmente cuando la relación de tamaño del núcleo (2) al núcleo (1) es 4:1 o 5:1. En las imágenes de ejemplo de la derecha, los tamaños de los núcleos gaussianos empleados para suavizar la imagen de muestra fueron 10 píxeles y 5 píxeles.

El algoritmo también se puede utilizar para obtener una aproximación del laplaciano de Gauss cuando la relación entre el tamaño 2 y el tamaño 1 es aproximadamente igual a 1,6. ^[3] El Laplaciano de Gauss es útil para detectar bordes que aparecen en varias escalas de imagen o grados de enfoque de la imagen. Los valores exactos de los tamaños de los dos núcleos que se utilizan para aproximar el laplaciano de Gauss determinarán la escala de la imagen de diferencia, que como resultado puede aparecer borrosa.

Las diferencias de gaussianas también se han utilizado para la detección de manchas en la transformación de características invariantes de escala . De hecho, DoG como diferencia de dos distribuciones normales multivariadas siempre tiene una suma nula total y su convolución con una señal uniforme no genera respuesta. Se aproxima bien a un segundo derivado del gaussiano ( laplaciano del gaussiano ) con K~1,6 y a los campos receptivos de las células ganglionares de la retina con K~5. Puede usarse fácilmente en esquemas recursivos y se usa como operador en algoritmos en tiempo real para la detección de blobs y la selección automática de escala.

Más información

En su funcionamiento, se cree que la diferencia del algoritmo gaussiano imita cómo el procesamiento neuronal en la retina del ojo extrae detalles de las imágenes destinadas a ser transmitidas al cerebro. ^[4]^[5]^[6]

Ver también

Algoritmo de Marr-Hildreth
Tratamiento de la diferencia del enfoque gaussiano en la detección de blobs.
Detección de manchas
pirámide gaussiana
Espacio de escala
Transformación de características invariantes de escala

Referencias

^ ab "Manual de microscopía de expresiones moleculares: procesamiento de imágenes digitales: diferencia del algoritmo de mejora de bordes gaussianos", Olympus America Inc. y Universidad Estatal de Florida Michael W. Davidson, Mortimer Abramowitz
^ Lindeberg, Tony (2015). "Coincidencia de imágenes utilizando puntos de interés de espacio de escala generalizado". Revista de visión y imágenes matemáticas . 52 : 3–36. doi : 10.1007/s10851-014-0541-0 . S2CID 254657377.
^ D. Marr; E. Hildreth (29 de febrero de 1980). "Teoría de la detección de bordes". Actas de la Royal Society de Londres. Serie B, Ciencias Biológicas . 207 (1167): 215–217. Código Bib : 1980RSPSB.207..187M. doi :10.1098/rspb.1980.0020. JSTOR 35407. PMID 6102765. S2CID 2150419.— Una diferencia de gaussianos de cualquier escala es una aproximación al laplaciano del gaussiano (consulte la entrada para la diferencia de gaussianos en Detección de blobs ). Sin embargo, Marr y Hildreth recomiendan la relación de 1,6 debido a consideraciones de diseño que equilibran el ancho de banda y la sensibilidad. Es posible que la URL de esta referencia solo esté disponible la primera página y el resumen del artículo dependiendo de si se está conectando a través de una institución académica o no.
^ C. Enroth-Cugell; JG Robson (1966). "La sensibilidad al contraste de las células ganglionares de la retina del gato". Revista de fisiología . 187 (3): 517–23. doi :10.1113/jphysiol.1966.sp008107. PMC 1395960 . PMID 16783910.
^ Mateo J. McMahon; Orin S. Packer; Dennis M. Dacey (14 de abril de 2004). "El campo receptivo clásico circundante de las células ganglionares del parasol de primates está mediado principalmente por una vía no GABAérgica" (PDF) . Revista de Neurociencia . 24 (15): 3736–3745. doi :10.1523/JNEUROSCI.5252-03.2004. PMC 6729348 . PMID 15084653.
^ Joven, Richard (1987). "El modelo derivado de Gauss para la visión espacial: I. Mecanismos de la retina". Visión Espacial . 2 (4): 273–293(21). doi :10.1163/156856887X00222. PMID 3154952.

Otras lecturas

Notas de Melisa Durmuş sobre detección de bordes y matemáticas relacionadas con Gauss de la Universidad de Edimburgo.