Coincidencia de bloques y filtrado 3D

El algoritmo de coincidencia de bloques y filtrado 3D (BM3D) es un algoritmo de coincidencia de bloques 3D que se utiliza principalmente para la reducción de ruido en imágenes . ^[1] Es una de las expansiones de la metodología de medias no locales. ^[2] Hay dos cascadas en BM3D: una etapa de umbralización estricta y una etapa de filtro de Wiener , ambas involucrando las siguientes partes: agrupamiento, filtrado colaborativo y agregación. Este algoritmo depende de una representación aumentada en el sitio de transformación. ^[3]

Método

Agrupamiento

Los fragmentos de imagen se agrupan en función de su similitud, pero a diferencia de la agrupación estándar de k-medias y otros métodos de análisis de agrupaciones , los fragmentos de imagen no son necesariamente disjuntos . Este algoritmo de coincidencia de bloques es menos exigente computacionalmente y es útil más adelante en el paso de agregación. Sin embargo, los fragmentos tienen el mismo tamaño. Un fragmento se agrupa si su disimilitud con un fragmento de referencia cae por debajo de un umbral especificado. Esta técnica de agrupación se denomina coincidencia de bloques y se utiliza normalmente para agrupar grupos similares en diferentes fotogramas de un vídeo digital ; BM3D, por otro lado, puede agrupar macrobloques dentro de un único fotograma. A continuación, todos los fragmentos de imagen de un grupo se apilan para formar formas tridimensionales similares a cilindros.

Filtrado colaborativo

El filtrado se realiza en cada grupo de fragmentos. Se aplica una transformación lineal dimensional ^[^{aclaración necesaria}^] , seguida de una reducción del dominio de transformación, como el filtrado de Wiener , y luego se invierte la transformación lineal para reproducir todos los fragmentos (filtrados). ${\estilo de visualización d+1}$

Agregación

La imagen se transforma nuevamente a su forma bidimensional. Todos los fragmentos de imagen superpuestos se promedian para garantizar que se filtren para eliminar el ruido y, al mismo tiempo, conserven su señal distintiva.

Extensiones

Imágenes en color

Las imágenes RGB se pueden procesar de forma muy similar a las de escala de grises. Se debe aplicar una transformación de luminancia-crominancia a la imagen RGB. Luego, la agrupación se completa en el canal de luminancia que contiene la mayor parte de la información útil y una relación señal/ruido más alta. Este enfoque funciona porque el ruido en los canales de crominancia está fuertemente correlacionado con el del canal de luminancia y ahorra aproximadamente un tercio del tiempo de cálculo porque la agrupación ocupa aproximadamente la mitad del tiempo de cálculo requerido.

Desenfoque

El algoritmo BM3D se ha ampliado (IDD-BM3D) para realizar desenfoque y eliminación de ruido desacoplados utilizando el equilibrio de Nash de las dos funciones objetivo. ^[4]

Red neuronal convolucional

Se ha propuesto un enfoque que integra una red neuronal convolucional y muestra mejores resultados (aunque con un tiempo de ejecución más lento). ^[5] Se ha publicado el código MATLAB con fines de investigación. ^[6]

Implementaciones

Implementación de referencia en MATLAB y Python publicada bajo una licencia propietaria de código abierto : ^[7] BM3D
Implementación basada en C bien documentada ^[8] publicada bajo la GPLv3 : bm3d
Implementación basada en CUDA y C++ publicada bajo la GPLv3 : bm3d-gpu

Referencias

^ Dabov, Kostadin; Foi, Alessandro; Katkovnik, Vladimir; Egiazarian, Karen (16 de julio de 2007). "Eliminación de ruido de imágenes mediante filtrado colaborativo de dominio de transformación 3D disperso". IEEE Transactions on Image Processing . 16 (8): 2080–2095. Bibcode :2007ITIP...16.2080D. CiteSeerX 10.1.1.219.5398 . doi :10.1109/TIP.2007.901238. PMID 17688213. S2CID 1475121.
^ Manjón, José V.; Carbonell-Caballero, José; Llull, Juan J.; García-Martí, Gracián; Martí-Bonmatí, Luís; Robles, Montserrat (1 de agosto de 2008). "Eliminación de ruido de resonancia magnética mediante medios no locales". Análisis de Imágenes Médicas . 12 (4): 514–523. doi :10.1016/j.media.2008.02.004. ISSN 1361-8415. PMID 18381247.
^ Maggioni, M.; Katkovnik, V.; Egiazarian, K.; Foi, A. (enero de 2013). "Filtro de dominio de transformación no local para la eliminación de ruido y reconstrucción de datos volumétricos". IEEE Transactions on Image Processing . 22 (1): 119–133. doi :10.1109/TIP.2012.2210725. ISSN 1057-7149. PMID 22868570. S2CID 1295558.
^ Danielyan, Aram; Katkovnik, Vladimir; Egiazarian, Karen (30 de junio de 2011). "BM3D Frames and Variational Image Deblurring". IEEE Transactions on Image Processing . 21 (4): 1715–28. arXiv : 1106.6180 . Bibcode :2012ITIP...21.1715D. doi :10.1109/TIP.2011.2176954. PMID 22128008. S2CID 11204616.
^ Ahn, Byeongyong; Ik Cho, Nam (3 de abril de 2017). "Red neuronal convolucional de coincidencia de bloques para la eliminación de ruido de imágenes". arXiv : 1704.00524 [Visión y reconocimiento de patrones Visión por computadora y reconocimiento de patrones].
^ "BMCNN-ISPL". Universidad Nacional de Seúl . Consultado el 3 de enero de 2018 .
^ "LASIP - Aviso legal". Universidad Tecnológica de Tampere (TUT) . Consultado el 2 de enero de 2018 .
^ Lebrun, Marc (8 de agosto de 2012). "Análisis e implementación del método de eliminación de ruido de imágenes BM3D". Procesamiento de imágenes en línea . 2 : 175–213. doi : 10.5201/ipol.2012.l-bm3d .