desenfoque gaussiano

En el procesamiento de imágenes , un desenfoque gaussiano (también conocido como suavizado gaussiano ) es el resultado de desenfocar una imagen mediante una función gaussiana (llamada así en honor al matemático y científico Carl Friedrich Gauss ).

Es un efecto muy utilizado en el software de gráficos, normalmente para reducir el ruido de la imagen y los detalles. El efecto visual de esta técnica de desenfoque es un desenfoque suave que se asemeja al de ver la imagen a través de una pantalla translúcida, claramente diferente del efecto bokeh producido por una lente desenfocada o la sombra de un objeto bajo iluminación habitual.

El suavizado gaussiano también se utiliza como etapa de preprocesamiento en algoritmos de visión por computadora para mejorar las estructuras de imágenes en diferentes escalas; consulte representación del espacio a escala e implementación del espacio a escala .

Matemáticas

Matemáticamente, aplicar un desenfoque gaussiano a una imagen es lo mismo que convolucionar la imagen con una función gaussiana . Esto también se conoce como transformada de Weierstrass bidimensional . Por el contrario, la convolución mediante un círculo (es decir, un desenfoque de cuadro circular ) reproduciría con mayor precisión el efecto bokeh .

Dado que la transformada de Fourier de una gaussiana es otra gaussiana, la aplicación de un desenfoque gaussiano tiene el efecto de reducir los componentes de alta frecuencia de la imagen; un desenfoque gaussiano es, por tanto, un filtro de paso bajo .

El desenfoque gaussiano es un tipo de filtro de desenfoque de imagen que utiliza una función gaussiana (que también expresa la distribución normal en estadística) para calcular la transformación que se aplicará a cada píxel de la imagen. La fórmula de una función gaussiana en una dimensión es

G(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {x^{2}}{2\sigma ^{ 2}}}}

En dos dimensiones, es el producto de dos funciones gaussianas, una en cada dimensión: ^[1]^[2]^[3]

G(x,y)={\frac {1}{2\pi \sigma ^{2}}}e^{-{\frac {x^{2}+y^{2}}{2 \sigma^{2}}}}

xyσdesviación estándar círculos concéntricos

Los valores de esta distribución se utilizan para construir una matriz de convolución que se aplica a la imagen original. Este proceso de convolución se ilustra visualmente en la figura de la derecha. El nuevo valor de cada píxel se establece en un promedio ponderado de la vecindad de ese píxel. El valor del píxel original recibe el peso más alto (tiene el valor gaussiano más alto) y los píxeles vecinos reciben pesos más pequeños a medida que aumenta su distancia al píxel original. Esto da como resultado un desenfoque que conserva los límites y los bordes mejor que otros filtros de desenfoque más uniformes; ver también implementación de espacio a escala .

En teoría, la función gaussiana en cada punto de la imagen será distinta de cero, lo que significa que sería necesario incluir la imagen completa en los cálculos para cada píxel. En la práctica, cuando se calcula una aproximación discreta de la función gaussiana, los píxeles a una distancia de más de 3 σ tienen una influencia lo suficientemente pequeña como para considerarse efectivamente cero. Por lo tanto, se pueden ignorar las contribuciones de píxeles fuera de ese rango. Normalmente, un programa de procesamiento de imágenes sólo necesita calcular una matriz con dimensiones × (donde está la función techo ) para garantizar un resultado suficientemente cercano al obtenido por toda la distribución gaussiana. $\lceil 6\sigma \rceil$ $\lceil 6\sigma \rceil$ $\lceil \cdot \rceil$

Además de ser circularmente simétrico, el desenfoque gaussiano se puede aplicar a una imagen bidimensional como dos cálculos unidimensionales independientes, por lo que se denomina filtro separable . Es decir, el efecto de aplicar la matriz bidimensional también se puede lograr aplicando una serie de matrices gaussianas unidimensionales en dirección horizontal y luego repitiendo el proceso en dirección vertical. En términos computacionales, esta es una propiedad útil, ya que el cálculo se puede realizar en el tiempo (donde h es la altura y w es el ancho; consulte la notación O grande ), a diferencia de lo que ocurre con un núcleo no separable. $O\left(w_{\text{kernel}}w_{\text{image}}h_{\text{image}}\right)+O\left(h_{\text{kernel}}w_{\ texto{imagen}}h_{\text{imagen}}\right)$ $O\left(w_{\text{kernel}}h_{\text{kernel}}w_{\text{image}}h_{\text{image}}\right)$

Aplicar sucesivos desenfoques gaussianos a una imagen tiene el mismo efecto que aplicar un único desenfoque gaussiano más grande, cuyo radio es la raíz cuadrada de la suma de los cuadrados de los radios de desenfoque que realmente se aplicaron. Por ejemplo, aplicar sucesivos desenfoques gaussianos con radios de 6 y 8 da los mismos resultados que aplicar un único desenfoque gaussiano de radio 10, ya que . Debido a esta relación, no se puede ahorrar tiempo de procesamiento simulando un desenfoque gaussiano con desenfoques sucesivos más pequeños; el tiempo requerido será al menos tan grande como el de realizar un único desenfoque grande. ${\sqrt {6^{2}+8^{2}}}=10$

Dos imágenes reducidas de la Bandera de la Commonwealth of Nations . Antes de reducir la escala, se aplicó un desenfoque gaussiano a la imagen inferior pero no a la superior. El desenfoque hace que la imagen sea menos nítida, pero evita la formación de artefactos de alias de patrones muaré .

El desenfoque gaussiano se utiliza habitualmente para reducir el tamaño de una imagen. Al reducir la resolución de una imagen, es común aplicar un filtro de paso bajo a la imagen antes de volver a muestrearla. Esto es para garantizar que no aparezca información falsa de alta frecuencia en la imagen reducida ( aliasing ). Los desenfoques gaussianos tienen buenas propiedades, como no tener bordes nítidos y, por lo tanto, no introducen zumbidos en la imagen filtrada.

Filtro de paso bajo

El desenfoque gaussiano es un filtro de paso bajo que atenúa las señales de alta frecuencia. ^[3]

Su diagrama de Bode de amplitud (la escala logarítmica en el dominio de la frecuencia ) es una parábola .

Reducción de varianza

¿Cuánto suaviza la imagen un filtro gaussiano con desviación estándar? En otras palabras, ¿cuánto reduce la desviación estándar de los valores de píxeles de la imagen? Supongamos que los valores de píxeles en escala de grises tienen una desviación estándar , luego de aplicar el filtro, la desviación estándar reducida se puede aproximar como ^[^{cita necesaria}^] $\sigma _{f}$ $\sigma _{X}$ $\sigma _{r}$

\sigma _{r}\approx {\frac {\sigma _{X}}{\sigma _{f}2{\sqrt {\pi }}}}.

Muestra de matriz gaussiana

Esta matriz de muestra se produce muestreando el núcleo del filtro gaussiano (con σ = 0,84089642) en los puntos medios de cada píxel y luego normalizándolo. El elemento central (en [0, 0]) tiene el valor más grande y disminuye simétricamente a medida que aumenta la distancia desde el centro. Dado que el origen del núcleo del filtro está en el centro, la matriz comienza y termina donde R es igual al radio del núcleo. ${\textstyle G(-R,-R)}$ ${\textstyle G(R,R)}$

{\begin{bmatrix}0.00000067&0.00002292&{\textbf {0.00019117}}&0.00038771&{\textbf {0.00019117}}&0.00002292&0.00000067\\0.00002292&0.00078633&0.00655965&0.01330373&0.00655965&0.00078633&0.00002292\\{\textbf {0.00019117}}&0.00655965&0.05472157&0.11098164&0.05472157&0.00655965&{\textbf {0.00019117}}\\0.00038771&0.01330373&0.11098164&{\textbf {0.22508352}}&0.11098164&0.01330373&0.00038771\\{\textbf {0.00019117}}&0.00655965&0.05472157&0.11098164&0.05472157&0.00655965&{\textbf {0.00019117}}\\0.00002292&0.00078633&0.00655965&0.01330373&0.00655965&0.00078633&0.00002292\\0.00000067&0.00002292&{\textbf {0.00019117}}&0.00038771&{\textbf {0.00019117}}&0.00002292&0.00000067\end{bmatrix}}

El elemento 0,22508352 (el central) es 1177 veces mayor que 0,00019117, que está justo fuera de 3σ.

Implementación

Un efecto de desenfoque gaussiano normalmente se genera al convolucionar una imagen con un núcleo FIR de valores gaussianos.

En la práctica, es mejor aprovechar la propiedad separable del desenfoque gaussiano dividiendo el proceso en dos pasadas. En la primera pasada, se utiliza un núcleo unidimensional para desenfocar la imagen sólo en la dirección horizontal o vertical. En la segunda pasada, se utiliza el mismo núcleo unidimensional para desenfocar en la dirección restante. El efecto resultante es el mismo que el de convolucionar con un núcleo bidimensional en una sola pasada, pero requiere menos cálculos.

La discretización normalmente se logra muestreando el núcleo del filtro gaussiano en puntos discretos, normalmente en posiciones correspondientes a los puntos medios de cada píxel. Esto reduce el costo computacional pero, para núcleos de filtro muy pequeños, el muestreo puntual de la función gaussiana con muy pocas muestras genera un gran error. En estos casos, la precisión se mantiene (con un ligero costo computacional) mediante la integración de la función gaussiana sobre el área de cada píxel. ^[4]

Al convertir los valores continuos de Gauss en valores discretos necesarios para un núcleo, la suma de los valores será diferente de 1. Esto provocará un oscurecimiento o brillo de la imagen. Para remediar esto, los valores se pueden normalizar dividiendo cada término del núcleo por la suma de todos los términos del núcleo.

Un enfoque mucho mejor y teóricamente más fundamentado es realizar el suavizado con el análogo discreto del núcleo gaussiano , ^[5] que posee propiedades similares en un dominio discreto a las que hace que el núcleo gaussiano continuo sea especial en un dominio continuo, por ejemplo , el núcleo correspondiente a la solución de una ecuación de difusión que describe un proceso de suavizado espacial, que obedece a una propiedad de semigrupo sobre las sumas de la varianza del núcleo, o que describe el efecto del movimiento browniano sobre un dominio espacial, y con la suma de sus los valores son exactamente iguales a 1. Para obtener una descripción más detallada sobre el análogo discreto del núcleo gaussiano, consulte el artículo sobre implementación de espacio de escala y. ^[5]

La eficiencia de FIR se descompone para sigmas altos. Existen alternativas al filtro FIR. Estos incluyen los muy rápidos desenfoques de cuadros múltiples , el rápido y preciso detector de bordes IIR Deriche , un "desenfoque de pila" basado en el desenfoque de cuadros, y más. ^[6]

Suavizado temporal causal en el tiempo

Para procesar señales temporales o vídeo pregrabados, el núcleo gaussiano también se puede utilizar para suavizar el dominio temporal, ya que los datos están pregrabados y disponibles en todas las direcciones. Sin embargo, al procesar señales temporales o vídeo en situaciones de tiempo real, el núcleo gaussiano no se puede utilizar para el suavizado temporal, ya que accedería a datos del futuro que obviamente no pueden estar disponibles. Para el suavizado temporal en situaciones de tiempo real, se puede utilizar en su lugar el núcleo temporal denominado núcleo de límite causal de tiempo, ^[7] que posee propiedades similares en una situación causal de tiempo (no creación de nuevas estructuras hacia una escala creciente y covarianza de escala temporal) ya que el núcleo gaussiano obedece en el caso no causal. El núcleo de límite causal de tiempo corresponde a una convolución con un número infinito de núcleos exponenciales truncados acoplados en cascada, con constantes de tiempo específicamente elegidas. Para datos discretos, este núcleo a menudo puede aproximarse numéricamente mediante un pequeño conjunto de filtros recursivos de primer orden acoplados en cascada; consulte ^[7] para obtener más detalles.

Usos comunes

Detección de bordes

El suavizado gaussiano se utiliza habitualmente con la detección de bordes . La mayoría de los algoritmos de detección de bordes son sensibles al ruido; El filtro laplaciano 2-D, construido a partir de una discretización del operador de Laplace , es muy sensible a entornos ruidosos.

El uso de un filtro de Desenfoque Gaussiano antes de la detección de bordes tiene como objetivo reducir el nivel de ruido en la imagen, lo que mejora el resultado del siguiente algoritmo de detección de bordes. Este enfoque se conoce comúnmente como filtrado Laplaciano de Gauss o LoG. ^[8]

Fotografía

Las cámaras digitales de gama baja , incluidas muchas cámaras de teléfonos móviles , suelen utilizar el desenfoque gaussiano ^{[ cita requerida ]} para oscurecer el ruido de la imagen causado por sensibilidades de luz ISO más altas .

El desenfoque gaussiano se aplica automáticamente como parte del posprocesamiento de la imagen por parte del software de la cámara, lo que provoca una pérdida irreversible de detalles. ^[9]^{[ se necesita una mejor fuente ]}

Ver también

notas y referencias

^ Shapiro, LG y Stockman, G. C: "Computer Vision", páginas 137, 150. Prentice Hall, 2001
^ Mark S. Nixon y Alberto S. Aguado. Extracción de características y procesamiento de imágenes . Prensa académica, 2008, pág. 88.
^ ab RA Haddad y AN Akansu, "Una clase de filtros binomiales gaussianos rápidos para el procesamiento de imágenes y voz", IEEE Transactions on Acoustics, Speech and Signal Processing, vol. 39, págs. 723-727, marzo de 1991.
^ Erik Reinhard. Imágenes de alto rango dinámico: adquisición, visualización e iluminación basada en imágenes . Morgan Kaufmann, 2006, págs. 233-234.
^ ab Lindeberg, T., "Espacio de escala para señales discretas", PAMI(12), núm. 3, marzo de 1990, págs.
^ Getreuer, Pascal (17 de diciembre de 2013). "Una encuesta de algoritmos de convolución gaussianos". Procesamiento de Imágenes en Línea . 3 : 286–310. doi : 10.5201/ipol.2013.87 .(código doc)
^ ab Lindeberg, T. (23 de enero de 2023). "Una representación de espacio de escala covariante de escala causal y recursiva en el tiempo de señales temporales y tiempo pasado". Cibernética biológica . 117 (1–2): 21–59. doi : 10.1007/s00422-022-00953-6 . PMC 10160219 . PMID 36689001.
^ Fisher, Perkins, Walker y Wolfart (2003). "Filtros espaciales - Laplaciano de Gauss" . Consultado el 13 de septiembre de 2010 .{{cite web}}: CS1 maint: multiple names: authors list (link)
^ Ritter, Frank (24 de octubre de 2013). "Cámaras de teléfonos inteligentes: Warum gute Fotos zu schießen nicht mehr ausreicht [Commentar]". GIGA (en alemán). Televisión GIGA . Archivado desde el original el 18 de julio de 2021 . Consultado el 20 de septiembre de 2020 . Bei Fotos, die in der Nacht entstanden sind, dominiert Pixelmatsch.

enlaces externos

Implementación GLSL de un filtro de desenfoque gaussiano separable.
Ejemplo de desenfoque gaussiano (filtrado de paso bajo) aplicado a una impresión en bloque de madera y un grabado para eliminar detalles para comparar imágenes.
Función de filtro gaussiano de Mathematica

Función de desenfoque gaussiano de OpenCV (C++)