Norma ITU-T
La evaluación perceptual de la calidad del habla ( PESQ ) es una familia de normas que comprende una metodología de prueba para la evaluación automatizada de la calidad del habla que experimenta un usuario de un sistema de telefonía . Se estandarizó como Recomendación UIT-T P.862 [1] en 2001. La PESQ se utiliza para pruebas objetivas de calidad de voz por parte de fabricantes de teléfonos, proveedores de equipos de red y operadores de telecomunicaciones. Su uso requiere una licencia. La primera edición de la sucesora de la PESQ, POLQA (Recomendación UIT-T P.863 [2] ), entró en vigor en 2011.
Alcance de la medición
El PESQ fue desarrollado para modelar pruebas subjetivas comúnmente utilizadas en telecomunicaciones (por ejemplo, Recomendación UIT-T P.800) para evaluar la calidad de voz percibida por los seres humanos. En consecuencia, emplea muestras de voz reales como señales de prueba. Para caracterizar la calidad de escucha percibida por los usuarios, es de suma importancia cargar los equipos de telecomunicaciones modernos con señales similares al habla. Muchos sistemas están optimizados para el habla y responderían de manera impredecible a señales que no sean de habla (por ejemplo, tonos, ruido). Las pautas para las aplicaciones adecuadas de las muestras de prueba de voz se definen en la guía de aplicación del PESQ contenida en la Recomendación UIT-T P.862.3. [3]
Genealogía de normas relacionadas
La familia de mediciones objetivas de calidad de voz de referencia completa de la UIT-T comenzó en 1997 con la Recomendación UIT-T P.861 (PSQM), que fue reemplazada por la UIT-T P.862 (PESQ) [1] en 2001. La P.862 se complementó posteriormente con las Recomendaciones UIT-T P.862.1 [4] (mapeo de las puntuaciones PESQ a una escala MOS), UIT-T P.862.2 [5] (mediciones de banda ancha) y UIT-T P.862.3 [3] (guía de aplicación). La primera edición de la UIT-T P.863 ( POLQA ) [2] entró en vigor en 2011. En 2019 se aprobó una guía de aplicación para la Recomendación UIT-T P.863 y se publicó como UIT-T P.863.1. [6]
Además de los métodos de referencia completos enumerados anteriormente, la lista de normas objetivas de medición de la calidad de voz de la UIT-T también incluye la UIT-T P.563 [7] (algoritmo sin referencia).
Tipología de pruebas
Dependiendo de la información que se pone a disposición de un algoritmo, los algoritmos de prueba de calidad de voz se pueden dividir en dos categorías principales:
- Un algoritmo de "referencia completa" (FR) tiene acceso a la señal de referencia original y la utiliza para realizar una comparación (es decir, un análisis de diferencias). Puede comparar cada muestra de la señal de referencia (lado del emisor) con cada muestra correspondiente de la señal degradada (lado del receptor). Las mediciones de FR ofrecen la mayor precisión y repetibilidad, pero solo se pueden aplicar para pruebas dedicadas en redes en vivo (por ejemplo, herramientas de prueba de manejo para evaluaciones comparativas de redes móviles).
- Un algoritmo "sin referencia" (NR) sólo utiliza la señal degradada para la estimación de la calidad y no tiene información de la señal de referencia original. Los algoritmos NR (por ejemplo, la Recomendación ITU-T P.563 [7] ) son sólo estimaciones de baja precisión, ya que las características de la voz de origen (por ejemplo, hablante masculino o femenino, ruido de fondo, no voz) de la referencia de origen son completamente desconocidas. Una variante común de los algoritmos NR ni siquiera analiza la señal de audio decodificada, sino que trabaja en un análisis del flujo de bits digitales a nivel de paquete IP. La medición se limita, en consecuencia, a un análisis del flujo de transporte.
PESQ es un algoritmo de referencia completa que analiza la señal de voz muestra por muestra después de una alineación temporal de los extractos correspondientes de la señal de referencia y de prueba. PESQ se puede aplicar para proporcionar una evaluación de calidad de extremo a extremo (E2E) para una red o para caracterizar componentes de red individuales.
Los resultados de PESQ modelan principalmente puntuaciones de opinión medias (MOS) que cubren una escala de 1 (malo) a 5 (excelente). En la Recomendación UIT-T P.862.1 se describe una función de mapeo a MOS-LQO. [4]
Véase también
Referencias
- ^ ab "P.862: Evaluación perceptual de la calidad de la voz (PESQ): Un método objetivo para la evaluación de la calidad de la voz de extremo a extremo de redes telefónicas de banda estrecha y códecs de voz". www.itu.int . Consultado el 20 de abril de 2021 .
- ^ ab "P.863: Predicción de la calidad de escucha objetiva perceptual". www.itu.int . Consultado el 11 de abril de 2021 .
- ^ ab "P.862.3: Guía de aplicación para la medición objetiva de la calidad basada en las Recomendaciones P.862, P.862.1 y P.862.2". www.itu.int . Consultado el 20 de abril de 2021 .
- ^ ab "P.862.1: Función de mapeo para transformar las puntuaciones de resultados brutos de P.862 en MOS-LQO". www.itu.int . Consultado el 11 de abril de 2021 .
- ^ "P.862.2: Extensión de banda ancha de la Recomendación P.862 para la evaluación de redes telefónicas de banda ancha y códecs de voz". www.itu.int . Consultado el 11 de abril de 2021 .
- ^ "P.863.1: Guía de aplicación de la Recomendación UIT-T P.863". www.itu.int . Consultado el 11 de abril de 2021 .
- ^ ab "P.563: Método de un solo extremo para la evaluación objetiva de la calidad de la voz en aplicaciones de telefonía de banda estrecha". www.itu.int . Consultado el 11 de abril de 2021 .
- Rix, Antony W.; Hollier, Michael P.; Hekstra, Andries P.; Beerends, John G. (15 de octubre de 2002). "Evaluación perceptual de la calidad del habla (PESQ) La nueva norma de la UIT para la evaluación de la calidad del habla de extremo a extremo Parte I - Compensación de retardo de tiempo". Revista de la Sociedad de Ingeniería de Audio . 50 (10): 755–764.
- Beerends, John G.; Hekstra, Andries P.; Rix, Antony W.; Hollier, Michael P. (15 de octubre de 2002). "Evaluación perceptual de la calidad del habla (PESQ) El nuevo estándar de la UIT para la evaluación de la calidad del habla de extremo a extremo Parte II: Modelo psicoacústico". Revista de la Sociedad de Ingeniería de Audio . 50 (10): 765–778.
Enlaces externos
- Nota de aplicación 1GA49: Mediciones de calidad de audio psicoacústico con el analizador de audio R&S UPV
- Nota de aplicación 1MA119: Medición PESQ para GSM con R&SCMUgo
- Nota de aplicación 1MA136: Medición PESQ para CDMA2000 con R&SCMUgo
- Nota de aplicación 1MA137: Medición PESQ para WCDMA con R&SCMUgo
- Nota de aplicación 1MA149: Mediciones de VoIP para WiMAX