El algoritmo de coincidencia de bloques y filtrado 3D (BM3D) es un algoritmo de coincidencia de bloques 3D que se utiliza principalmente para la reducción de ruido en imágenes . [1] Es una de las expansiones de la metodología de medias no locales. [2] Hay dos cascadas en BM3D: una etapa de umbralización estricta y una etapa de filtro de Wiener , ambas involucrando las siguientes partes: agrupamiento, filtrado colaborativo y agregación. Este algoritmo depende de una representación aumentada en el sitio de transformación. [3]
Los fragmentos de imagen se agrupan en función de su similitud, pero a diferencia de la agrupación estándar de k-medias y otros métodos de análisis de agrupaciones , los fragmentos de imagen no son necesariamente disjuntos . Este algoritmo de coincidencia de bloques es menos exigente computacionalmente y es útil más adelante en el paso de agregación. Sin embargo, los fragmentos tienen el mismo tamaño. Un fragmento se agrupa si su disimilitud con un fragmento de referencia cae por debajo de un umbral especificado. Esta técnica de agrupación se denomina coincidencia de bloques y se utiliza normalmente para agrupar grupos similares en diferentes fotogramas de un vídeo digital ; BM3D, por otro lado, puede agrupar macrobloques dentro de un único fotograma. A continuación, todos los fragmentos de imagen de un grupo se apilan para formar formas tridimensionales similares a cilindros.
El filtrado se realiza en cada grupo de fragmentos. Se aplica una transformación lineal dimensional [ aclaración necesaria ] , seguida de una reducción del dominio de transformación, como el filtrado de Wiener , y luego se invierte la transformación lineal para reproducir todos los fragmentos (filtrados).
La imagen se transforma nuevamente a su forma bidimensional. Todos los fragmentos de imagen superpuestos se promedian para garantizar que se filtren para eliminar el ruido y, al mismo tiempo, conserven su señal distintiva.
Las imágenes RGB se pueden procesar de forma muy similar a las de escala de grises. Se debe aplicar una transformación de luminancia-crominancia a la imagen RGB. Luego, la agrupación se completa en el canal de luminancia que contiene la mayor parte de la información útil y una relación señal/ruido más alta. Este enfoque funciona porque el ruido en los canales de crominancia está fuertemente correlacionado con el del canal de luminancia y ahorra aproximadamente un tercio del tiempo de cálculo porque la agrupación ocupa aproximadamente la mitad del tiempo de cálculo requerido.
El algoritmo BM3D se ha ampliado (IDD-BM3D) para realizar desenfoque y eliminación de ruido desacoplados utilizando el equilibrio de Nash de las dos funciones objetivo. [4]
Se ha propuesto un enfoque que integra una red neuronal convolucional y muestra mejores resultados (aunque con un tiempo de ejecución más lento). [5] Se ha publicado el código MATLAB con fines de investigación. [6]