En el procesamiento de imágenes y la visión artificial , la difusión anisotrópica , también llamada difusión Perona-Malik , es una técnica que tiene como objetivo reducir el ruido de la imagen sin eliminar partes significativas del contenido de la imagen, típicamente bordes, líneas u otros detalles que son importantes para la interpretación de la imagen. [1] [2] [3] La difusión anisotrópica se asemeja al proceso que crea un espacio de escala , donde una imagen genera una familia parametrizada de imágenes sucesivamente cada vez más borrosas basadas en un proceso de difusión . Cada una de las imágenes resultantes en esta familia se dan como una convolución entre la imagen y un filtro gaussiano isotrópico 2D , donde el ancho del filtro aumenta con el parámetro. Este proceso de difusión es una transformación lineal e invariante en el espacio de la imagen original. La difusión anisotrópica es una generalización de este proceso de difusión: produce una familia de imágenes parametrizadas, pero cada imagen resultante es una combinación entre la imagen original y un filtro que depende del contenido local de la imagen original. Como consecuencia, la difusión anisotrópica es una transformación no lineal y variante espacial de la imagen original.
En su formulación original, presentada por Perona y Malik en 1987, [1] el filtro variante espacial es de hecho isotrópico pero depende del contenido de la imagen de modo que se aproxima a una función de impulso cerca de los bordes y otras estructuras que deberían conservarse en la imagen en los diferentes niveles del espacio de escala resultante . Perona y Malik se refirieron a esta formulación como difusión anisotrópica a pesar de que el filtro adaptado localmente es isotrópico, pero otros autores también la han denominado difusión no homogénea y no lineal [4] o difusión Perona-Malik [5] . Una formulación más general permite que el filtro adaptado localmente sea verdaderamente anisotrópico cerca de estructuras lineales como bordes o líneas: tiene una orientación dada por la estructura de modo que se alarga a lo largo de la estructura y se estrecha transversalmente. Dichos métodos se denominan suavizado adaptado a la forma [6] [7] o difusión que mejora la coherencia [8] . Como consecuencia, las imágenes resultantes conservan las estructuras lineales mientras que al mismo tiempo se realiza un suavizado a lo largo de estas estructuras. Ambos casos pueden describirse mediante una generalización de la ecuación de difusión habitual , donde el coeficiente de difusión, en lugar de ser un escalar constante, es una función de la posición de la imagen y asume un valor matricial (o tensor ) (véase tensor de estructura ).
Aunque la familia de imágenes resultante puede describirse como una combinación entre la imagen original y filtros variantes en el espacio, el filtro adaptado localmente y su combinación con la imagen no tienen por qué implementarse en la práctica. La difusión anisotrópica se implementa normalmente mediante una aproximación de la ecuación de difusión generalizada: cada nueva imagen de la familia se calcula aplicando esta ecuación a la imagen anterior. En consecuencia, la difusión anisotrópica es un proceso iterativo en el que se utiliza un conjunto relativamente simple de cálculos para calcular cada imagen sucesiva de la familia y este proceso continúa hasta que se obtiene un grado suficiente de suavizado.
Formalmente, denotemos un subconjunto del plano y sea una familia de imágenes en escala de grises. es la imagen de entrada. Entonces la difusión anisotrópica se define como
donde denota el Laplaciano , denota el gradiente , es el operador de divergencia y es el coeficiente de difusión.
Para , la imagen de salida está disponible como , y los valores más grandes producen imágenes más borrosas.
controla la velocidad de difusión y suele elegirse como función del gradiente de la imagen para preservar los bordes de la misma. Pietro Perona y Jitendra Malik fueron pioneros en la idea de la difusión anisotrópica en 1990 y propusieron dos funciones para el coeficiente de difusión:
y
La constante K controla la sensibilidad a los bordes y generalmente se elige experimentalmente o en función del ruido en la imagen.
Sea la variedad de imágenes suaves, entonces las ecuaciones de difusión presentadas anteriormente pueden interpretarse como las ecuaciones de descenso de gradiente para la minimización de la función de energía definida por
donde es una función de valor real que está íntimamente relacionada con el coeficiente de difusión. Entonces, para cualquier función de prueba infinitamente diferenciable con soporte compacto ,
donde la última línea se desprende de la integración multidimensional por partes. Si denotamos el gradiente de E con respecto al producto interno evaluado en I, obtenemos
Por lo tanto, las ecuaciones de descenso de gradiente en la función E se dan por
De esta manera se obtienen las ecuaciones de difusión anisotrópica.
El coeficiente de difusión, , como lo proponen Perona y Malik, puede conducir a inestabilidades cuando . Se puede demostrar que esta condición es equivalente a que el coeficiente de difusión físico (que es diferente del coeficiente de difusión matemático definido por Perona y Malik) se vuelva negativo y conduce a una difusión hacia atrás que mejora los contrastes de intensidad de la imagen en lugar de suavizarlos. Para evitar el problema, es necesaria la regularización y se ha demostrado que las regularizaciones espaciales conducen a una solución de estado estable convergente y constante. [9]
Para este fin, se discutirá uno de los modelos Perona-Malik modificados [10] (que también se conoce como regularización de la ecuación PM). En este enfoque, la incógnita se convoluciona con una gaussiana dentro de la no linealidad para obtener una ecuación Perona-Malik modificada.
dónde .
La regularización permite obtener una ecuación bien planteada, pero también introduce un efecto de desenfoque, que es el principal inconveniente de la regularización. Es necesario conocer previamente el nivel de ruido, ya que la elección del parámetro de regularización depende de él.
La difusión anisotrópica se puede utilizar para eliminar el ruido de las imágenes digitales sin desenfocar los bordes. Con un coeficiente de difusión constante, las ecuaciones de difusión anisotrópica se reducen a la ecuación de calor, que es equivalente al desenfoque gaussiano. Esto es ideal para eliminar el ruido, pero también desenfoca los bordes de forma indiscriminada. Cuando el coeficiente de difusión se elige como una función que evita los bordes, como en Perona-Malik, las ecuaciones resultantes fomentan la difusión (y por lo tanto, la suavización) dentro de las regiones de intensidad de imagen más suave y la suprimen en los bordes fuertes. Por lo tanto, los bordes se conservan mientras se elimina el ruido de la imagen.
En la misma línea que la eliminación de ruido, la difusión anisotrópica se puede utilizar en algoritmos de detección de bordes. Al ejecutar la difusión con un coeficiente de difusión que busca bordes durante una cierta cantidad de iteraciones, la imagen puede evolucionar hacia una imagen constante por partes en la que los límites entre los componentes constantes se detectan como bordes.