stringtranslate.com

Relación máxima señal-ruido

La relación señal-ruido máxima ( PSNR ) es un término de ingeniería para la relación entre la potencia máxima posible de una señal y la potencia del ruido corruptor que afecta la fidelidad de su representación. Debido a que muchas señales tienen un rango dinámico muy amplio , la PSNR generalmente se expresa como una cantidad logarítmica usando la escala de decibeles .

PSNR se usa comúnmente para cuantificar la calidad de reconstrucción de imágenes y videos sujetos a compresión con pérdidas .

Definición

PSNR se define más fácilmente mediante el error cuadrático medio ( MSE ). Dada una imagen monocromática I libre de ruido de m × n y su aproximación ruidosa K , MSE se define como

El PSNR (en dB ) se define como

Aquí, MAX I es el valor máximo de píxeles de la imagen original.

Aplicación en imágenes en color.

Para imágenes en color con tres valores RGB por píxel, la definición de PSNR es la misma excepto que el MSE es la suma de todas las diferencias de valores al cuadrado (ahora para cada color, es decir, tres veces más diferencias que en una imagen monocromática) dividida por la imagen. tamaño y por tres. Alternativamente, para imágenes en color, la imagen se convierte a un espacio de color diferente y se informa PSNR contra cada canal de ese espacio de color, por ejemplo, YCbCr o HSL . [1] [2]

Estimación de calidad con PSNR

PSNR se usa más comúnmente para medir la calidad de reconstrucción de códecs de compresión con pérdida (por ejemplo, para compresión de imágenes ). La señal en este caso son los datos originales y el ruido es el error introducido por la compresión. Al comparar códecs de compresión, PSNR es una aproximación a la percepción humana de la calidad de la reconstrucción.

Los valores típicos de PSNR en compresión de imágenes y vídeo con pérdida están entre 30 y 50 dB, siempre que la profundidad de bits sea de 8  bits , donde cuanto más alto, mejor. La calidad de procesamiento de imágenes de 12 bits se considera alta cuando el valor PSNR es de 60 dB o superior. [3] [4] Para datos de 16 bits, los valores típicos de PSNR están entre 60 y 80 dB. [5] [6] Se considera que los valores aceptables para la pérdida de calidad de la transmisión inalámbrica son de aproximadamente 20 dB a 25 dB. [7] [8]

En ausencia de ruido, las dos imágenes I y K son idénticas y, por tanto, el MSE es cero. En este caso, el PSNR es infinito (o indefinido, consulte División por cero ). [9]

Ejemplo de valores de luma PSNR para una imagen comprimida cjpeg en varios niveles de calidad.

Comparación de rendimiento

Aunque una PSNR más alta generalmente se correlaciona con una reconstrucción de mayor calidad, en muchos casos puede que no sea así. Hay que tener mucho cuidado con el rango de validez de esta métrica; sólo es concluyentemente válido cuando se utiliza para comparar resultados del mismo códec (o tipo de códec) y el mismo contenido. [10]

En general, cuando se trata de estimar la calidad de imágenes y vídeos percibidos por los humanos, se ha demostrado que PSNR funciona muy mal en comparación con otras métricas de calidad. [10] [11]

Variantes

PSNR-HVS [12] es una extensión de PSNR que incorpora propiedades del sistema visual humano como la percepción de contraste .

PSNR-HVS-M mejora PSNR-HVS al tener en cuenta además el enmascaramiento visual . [13] En un estudio de 2007, entregó mejores aproximaciones de los juicios de calidad visual humana que PSNR y SSIM por un amplio margen. También demostró tener una clara ventaja sobre DCTune y PSNR-HVS. [14]

Ver también

Referencias

  1. ^ Oriani, Emanuele. "qpsnr: un analizador rápido de PSNR/SSIM para Linux" . Consultado el 6 de abril de 2011 .
  2. ^ "Manual de usuario de pnmpsnr" . Consultado el 6 de abril de 2011 .
  3. ^ Faragallah, Osama S.; El-Hoseny, Heba; El-Shafai, Walid; El-Rahman, Wael Abd; El-Sayed, Hala S.; El-Rabaie, El-Sayed M.; El-Samie, Fathi E. Abd; Geweid, Gamal GN (2021). "Un análisis de encuesta completo para las soluciones actuales de fusión de imágenes médicas y direcciones futuras". Acceso IEEE . 9 : 11358–11371. Código Bib : 2021IEEEA...911358F. doi : 10.1109/ACCESS.2020.3048315 . ISSN  2169-3536. Este artículo presenta un estudio de encuesta sobre las modalidades de imágenes médicas y sus características. Además, se presentan diferentes enfoques de fusión de imágenes médicas y sus métricas de calidad adecuadas.
  4. ^ Chervyakov, Nikolay; Lyakhov, Pavel; Nagornov, Nikolay (11 de febrero de 2020). "Análisis del ruido de cuantificación en filtros de transformada Wavelet discreta para imágenes médicas 3D". Ciencias Aplicadas . 10 (4): 1223. doi : 10.3390/app10041223 . ISSN  2076-3417. La calidad del procesamiento de imágenes se considera alta si el valor PSNR es superior a 60 dB para imágenes con 12 bits por color.
  5. ^ Welstead, Stephen T. (1999). Técnicas de compresión de imágenes fractales y wavelets. Publicación SPIE. págs. 155-156. ISBN 978-0-8194-3503-3.
  6. ^ Raouf Hamzaoui, Dietmar Saupe (mayo de 2006). Barni, Mauro (ed.). Compresión de imágenes fractales. vol. 968. Prensa CRC. págs. 168-169. ISBN 9780849335563. Consultado el 5 de abril de 2011 . {{cite book}}: |journal=ignorado ( ayuda )
  7. ^ Thomos, N., Boulgouris, NV y Strintzis, MG (2006, enero). Transmisión optimizada de transmisiones JPEG2000 a través de canales inalámbricos. Transacciones IEEE sobre procesamiento de imágenes, 15 (1).
  8. ^ Xiangjun, L. y Jianfei, C. Transmisión robusta de imágenes codificadas en JPEG2000 a través de canales de pérdida de paquetes. ICME 2007 (págs. 947-950). Escuela de Ingeniería Informática, Universidad Tecnológica de Nanyang .
  9. ^ Salomón, David (2007). Compresión de datos: la referencia completa (4 ed.). Saltador. pag. 281.ISBN 978-1846286025. Consultado el 26 de julio de 2012 .
  10. ^ ab Huynh-Thu, Q.; Ghanbari, M. (2008). "Alcance de validez de PSNR en la evaluación de la calidad de imagen/vídeo". Letras de Electrónica . 44 (13): 800. Código Bib :2008ElL....44..800H. doi :10.1049/el:20080522.
  11. ^ Huynh-Jueves, Quan; Ghanbari, Mohammed (1 de enero de 2012). "La precisión de PSNR para predecir la calidad del vídeo para diferentes escenas de vídeo y velocidades de fotogramas". Sistemas de Telecomunicaciones . 49 (1): 35–48. doi :10.1007/s11235-010-9351-x. ISSN  1018-4864. S2CID  43713764.
  12. ^ Egiazarian, Karen, Jaakko Astola, Nikolay Ponomarenko, Vladimir Lukin, Federica Battisti y Marco Carli (2006). "Nuevas métricas de calidad de referencia completa basadas en HVS". En Actas del Segundo Taller Internacional sobre Procesamiento de Vídeo y Métricas de Calidad, vol. 4.
  13. ^ Ponomarenko, N.; Ieremeiev, O.; Lukin, V.; Egiazarian, K.; Carli, M. (febrero de 2011). "Métricas de calidad visual de imagen modificadas para cambio de contraste y contabilidad de cambio medio". 2011 XI Conferencia Internacional sobre la experiencia de diseño y aplicación de sistemas CAD en microelectrónica (CADSM) : 305–311.
  14. ^ Nikolai Ponomarenko; Flavia Silvestri; Karen Egiazarian; Marco Carli; Jaakko Astola; Vladimir Lukin, "Sobre el enmascaramiento de contraste entre coeficientes de funciones básicas DCT" (PDF) , Actas en CD-ROM del Tercer Taller Internacional sobre Procesamiento de Video y Métricas de Calidad para Electrónica de Consumo VPQM-07, 25.–26. Enero de 2007 (en alemán), Scottsdale AZ