Optimización de velocidad-distorsión

La optimización de la distorsión de velocidad ( RDO ) es un método para mejorar la calidad del video en la compresión de video . El nombre se refiere a la optimización de la cantidad de distorsión (pérdida de calidad del video) frente a la cantidad de datos necesarios para codificar el video, la velocidad . Si bien la utilizan principalmente los codificadores de video, la optimización de la tasa de distorsión se puede usar para mejorar la calidad en cualquier situación de codificación (imagen, video, audio u otro) donde se deben tomar decisiones que afectan tanto el tamaño como la calidad del archivo simultáneamente.

Fondo

El método clásico para tomar decisiones de codificación es que el codificador de vídeo elija el resultado que produzca la imagen de salida de mayor calidad. Sin embargo, esto tiene la desventaja de que la elección que haga puede requerir más bits y, al mismo tiempo, ofrecer un beneficio de calidad comparativamente pequeño. Un ejemplo común de este problema es la estimación del movimiento , ^[1] y, en particular, el uso de la estimación del movimiento con precisión de un cuarto de píxel . Agregar precisión adicional al movimiento de un bloque durante la estimación del movimiento puede aumentar la calidad, pero en algunos casos esa calidad adicional no vale los bits adicionales necesarios para codificar el vector de movimiento con una mayor precisión.

Cómo funciona

La optimización de la distorsión de la velocidad resuelve el problema antes mencionado al actuar como una métrica de calidad de video, midiendo tanto la desviación del material fuente como el costo de bits para cada posible resultado de decisión. Los bits se miden matemáticamente multiplicando el costo del bit por el lagrangiano , un valor que representa la relación entre el costo del bit y la calidad para un nivel de calidad particular. La desviación de la fuente generalmente se mide como el error cuadrático medio , para maximizar la métrica de calidad de video PSNR .

Los codificadores de entropía de los códecs de vídeo modernos dificultan el cálculo del coste de bits , ya que requieren que el algoritmo de optimización de la distorsión de velocidad pase cada bloque de vídeo que se va a probar al codificador de entropía para medir su coste de bits real. En los códecs MPEG , el proceso completo consiste en una transformada de coseno discreta , seguida de una cuantificación y codificación de entropía. Debido a esto, la optimización de la distorsión de la tasa es mucho más lenta que la mayoría de las otras métricas de coincidencia de bloques, como la suma simple de diferencias absolutas (SAD) y la suma de diferencias absolutas transformadas (SATD). Como tal, normalmente se utiliza sólo para los pasos finales del proceso de estimación de movimiento , como decidir entre diferentes tipos de partición en H.264/AVC .

Lista de codificadores que admiten RDO

Codificador Ateme H.264
Codificadores Grass Valley ViBE (SD y HD MPEG-2/MPEG-4)
Codificador armónico Electra 8000 (SD y HD MPEG-2/MPEG-4)
libavcodec
Codificador MainConcept H.264
Codificador Microsoft VC-1
Tandberg Televisión SD MPEG-2 EN8100
Tandberg Televisión HD MPEG-4 EN8190
Tandberg Televisión SD y HD MPEG-4 iPlex
Theora 1.1-alpha1 y posteriores (la rama "Thusnelda")
Codificador x264 H.264
Codificador x265 H.265
Codificador Xvid MPEG-4 ASP
Software de referencia H.264/AVC JM (modelo conjunto)
Software de referencia HEVC HM (modelo de prueba HEVC)
Kvazaar (parcial) ^[2]

Referencias

^ Hoang, DT; Largo, PM; Vitter, Jeffrey (agosto de 1998). "Optimizaciones de distorsión de velocidad para la estimación de movimiento en codificación de vídeo de baja velocidad de bits" (PDF) . Transacciones IEEE sobre circuitos y sistemas para tecnología de vídeo . 8 (4): 488–500. doi : 10.1109/76.709413.Aparece una versión más breve en Hoang, DT; Largo, PM; Vitter, JS (marzo de 1996). "Optimizaciones de distorsión de velocidad para la estimación de movimiento en codificación de vídeo de baja velocidad de bits". Compresión de vídeo digital: algoritmos y tecnologías 1996 . vol. 2668. ESPÍA. págs. 18-27. doi :10.1117/12.235433.
^ "Grupo Ultra Vídeo".