Relación señal-ruido máxima

La relación señal-ruido de pico ( PSNR ) es un término de ingeniería que designa la relación entre la potencia máxima posible de una señal y la potencia del ruido corruptor que afecta la fidelidad de su representación. Debido a que muchas señales tienen un rango dinámico muy amplio , la PSNR suele expresarse como una cantidad logarítmica utilizando la escala de decibelios .

PSNR se utiliza comúnmente para cuantificar la calidad de reconstrucción de imágenes y vídeos sujetos a compresión con pérdida .

Definición

El PSNR se define más fácilmente a través del error cuadrático medio ( MSE ). Dada una imagen monocromática I m × n sin ruido y su aproximación ruidosa K , el MSE se define como

{\mathit {MSE}}={\frac {1}{m\,n}}\sum _{i=0}^{m-1}\sum _{j=0}^{n-1}[I(i,j)-K(i,j)]^{2}.

El PSNR (en dB ) se define como

{\begin{aligned}{\mathit {PSNR}}&=10\cdot \log _{10}\left({\frac {{\mathit {MAX}}_{I}^{2}}{\mathit {MSE}}}\right)\\&=20\cdot \log _{10}\left({\frac {{\mathit {MAX}}_{I}}{\sqrt {\mathit {MSE}}}}\right)\\&=20\cdot \log _{10}({\mathit {MAX}}_{I})-10\cdot \log _{10}({\mathit {MSE}}).\end{aligned}}

Aquí, MAX _I es el valor máximo posible de píxel de la imagen. Cuando los píxeles se representan utilizando 8 bits por muestra, esto es 255. De manera más general, cuando las muestras se representan utilizando PCM lineal con B bits por muestra, MAX _I es 2 ^B − 1.

Aplicación en imágenes en color

Para imágenes en color con tres valores RGB por píxel, la definición de PSNR es la misma, excepto que el MSE es la suma de todas las diferencias de valores al cuadrado (ahora para cada color, es decir, tres veces más diferencias que en una imagen monocromática) dividida por el tamaño de la imagen y por tres. Alternativamente, para imágenes en color, la imagen se convierte a un espacio de color diferente y se informa PSNR para cada canal de ese espacio de color, por ejemplo, YCbCr o HSL . ^[1]^[2]

Estimación de calidad con PSNR

El PSNR se utiliza con mayor frecuencia para medir la calidad de reconstrucción de los códecs de compresión con pérdida (por ejemplo, para la compresión de imágenes ). En este caso, la señal son los datos originales y el ruido es el error introducido por la compresión. Al comparar los códecs de compresión, el PSNR es una aproximación a la percepción humana de la calidad de reconstrucción.

Los valores típicos de PSNR en la compresión de imágenes y vídeos con pérdida se encuentran entre 30 y 50 dB, siempre que la profundidad de bits sea de 8 bits , donde cuanto mayor sea, mejor. La calidad de procesamiento de imágenes de 12 bits se considera alta cuando el valor de PSNR es de 60 dB o superior. ^[3]^[4] Para datos de 16 bits, los valores típicos de PSNR se encuentran entre 60 y 80 dB. ^[5]^[6] Se considera que los valores aceptables para la pérdida de calidad de transmisión inalámbrica son de aproximadamente 20 dB a 25 dB. ^[7]^[8]

En ausencia de ruido, las dos imágenes I y K son idénticas y, por lo tanto, el MSE es cero. En este caso, la PSNR es infinita (o indefinida, véase División por cero ). ^[9]

Ejemplo de valores PSNR de luminancia para una imagen comprimida en cjpeg en varios niveles de calidad.

Comparación de rendimiento

Aunque una PSNR más alta generalmente se correlaciona con una reconstrucción de mayor calidad, en muchos casos puede que no sea así. Hay que ser extremadamente cuidadoso con el rango de validez de esta métrica; solo es concluyentemente válida cuando se utiliza para comparar resultados del mismo códec (o tipo de códec) y el mismo contenido. ^[10]

En general, cuando se trata de estimar la calidad de imágenes y videos tal como los perciben los humanos, se ha demostrado que PSNR tiene un desempeño muy pobre en comparación con otras métricas de calidad. ^[10]^[11]

Variantes

PSNR-HVS ^[12] es una extensión de PSNR que incorpora propiedades del sistema visual humano como la percepción del contraste .

PSNR-HVS-M mejora a PSNR-HVS al tener en cuenta además el enmascaramiento visual . ^[13] En un estudio de 2007, proporcionó mejores aproximaciones de los juicios de calidad visual humana que PSNR y SSIM por un amplio margen. También se demostró que tiene una clara ventaja sobre DCTune y PSNR-HVS. ^[14]

Véase también

Referencias

^ Oriani, Emanuele. "qpsnr: un analizador rápido de PSNR/SSIM para Linux" . Consultado el 6 de abril de 2011 .
^ "Manual del usuario de pnmpsnr" . Consultado el 6 de abril de 2011 .
^ Faragallah, Osama S.; El-Hoseny, Heba; El-Shafai, Walid; El-Rahman, Wael Abd; El-Sayed, Hala S.; El-Rabaie, El-Sayed M.; El-Samie, Fathi E. Abd; Geweid, Gamal GN (2021). "Un análisis de encuesta integral para las soluciones actuales de fusión de imágenes médicas y direcciones futuras". IEEE Access . 9 : 11358–11371. Bibcode :2021IEEEA...911358F. doi : 10.1109/ACCESS.2020.3048315 . ISSN 2169-3536. Este artículo presenta un estudio de encuesta sobre las modalidades de imágenes médicas y sus características. Además, se presentan diferentes enfoques de fusión de imágenes médicas y sus métricas de calidad apropiadas.
^ Chervyakov, Nikolay; Lyakhov, Pavel; Nagornov, Nikolay (11 de febrero de 2020). "Análisis del ruido de cuantificación en filtros de transformada wavelet discreta para imágenes médicas en 3D". Applied Sciences . 10 (4): 1223. doi : 10.3390/app10041223 . ISSN 2076-3417. La calidad del procesamiento de imágenes se considera alta si el valor PSNR es mayor a 60 dB para imágenes con 12 bits por color.
^ Welstead, Stephen T. (1999). Técnicas de compresión de imágenes fractales y wavelet. Publicación SPIE. pp. 155–156. ISBN 978-0-8194-3503-3.
^ Raouf Hamzaoui, Dietmar Saupe (mayo de 2006). Barni, Mauro (ed.). Compresión de imágenes fractales. vol. 968. Prensa CRC. págs. 168-169. ISBN 9780849335563. Recuperado el 5 de abril de 2011 . {{cite book}}: |journal=ignorado ( ayuda )
^ Thomos, N., Boulgouris, NV y Strintzis, MG (enero de 2006). Transmisión optimizada de secuencias JPEG2000 a través de canales inalámbricos. IEEE Transactions on Image Processing, 15 (1).
^ Xiangjun, L., y Jianfei, C. Transmisión robusta de imágenes codificadas JPEG2000 a través de canales de pérdida de paquetes. ICME 2007 (pp. 947-950). Facultad de Ingeniería Informática, Universidad Tecnológica de Nanyang .
^ Salomon, David (2007). Compresión de datos: la referencia completa (4.ª ed.). Springer. pág. 281. ISBN 978-1846286025. Recuperado el 26 de julio de 2012 .
^ ab Huynh-Thu, Q.; Ghanbari, M. (2008). "Alcance de validez de PSNR en la evaluación de la calidad de imagen/vídeo". Electronics Letters . 44 (13): 800. Bibcode :2008ElL....44..800H. doi :10.1049/el:20080522.
^ Huynh-Thu, Quan; Ghanbari, Mohammed (1 de enero de 2012). "La precisión de PSNR en la predicción de la calidad de vídeo para diferentes escenas de vídeo y velocidades de cuadro". Sistemas de telecomunicaciones . 49 (1): 35–48. doi :10.1007/s11235-010-9351-x. ISSN 1018-4864. S2CID 43713764.
^ Egiazarian, Karen, Jaakko Astola, Nikolay Ponomarenko, Vladimir Lukin, Federica Battisti y Marco Carli (2006). "Nuevas métricas de calidad de referencia completa basadas en HVS". En Actas del Segundo Taller Internacional sobre Procesamiento de Vídeo y Métricas de Calidad, vol. 4.
^ Ponomarenko, N.; Ieremeiev, O.; Lukin, V.; Egiazarian, K.; Carli, M. (febrero de 2011). "Métricas de calidad visual de imagen modificadas para la contabilidad del cambio de contraste y del desplazamiento medio". 2011 11.ª Conferencia internacional sobre la experiencia en el diseño y la aplicación de sistemas CAD en microelectrónica (CADSM) : 305–311.
^ Nikolay Ponomarenko; Flavia Silvestri; Karen Egiazarian; Marco Carli; Jaakko Astola; Vladimir Lukin, "Sobre el enmascaramiento de contraste entre coeficientes de las funciones base de DCT" (PDF) , CD-ROM Actas del Tercer Taller Internacional sobre Procesamiento de Vídeo y Métricas de Calidad para Electrónica de Consumo VPQM-07, 25.–26. Enero de 2007 (en alemán), Scottsdale AZ