La codificación aritmética binaria adaptativa al contexto ( CABAC ) es una forma de codificación de entropía utilizada en los estándares H.264/MPEG-4 AVC [1] [2] y High Efficiency Video Coding (HEVC). Es una técnica de compresión sin pérdidas , aunque los estándares de codificación de vídeo en los que se utiliza suelen ser para aplicaciones de compresión con pérdidas . CABAC se destaca por proporcionar una compresión mucho mejor que la mayoría de los otros algoritmos de codificación de entropía utilizados en la codificación de vídeo, y es uno de los elementos clave que proporciona al esquema de codificación H.264/AVC una mejor capacidad de compresión que sus predecesores. [3]
En H.264/MPEG-4 AVC , CABAC solo se admite en los perfiles principal y superior (pero no en el perfil extendido) del estándar, ya que requiere una mayor cantidad de procesamiento para decodificar que el esquema más simple conocido como adaptable al contexto. codificación de longitud variable (CAVLC) que se utiliza en el perfil de referencia del estándar. CABAC también es difícil de paralelizar y vectorizar, por lo que se pueden combinar otras formas de paralelismo (como el paralelismo de regiones espaciales) con su uso. En HEVC, CABAC se utiliza en todos los perfiles del estándar.
CABAC se basa en codificación aritmética , con algunas innovaciones y cambios para adaptarla a las necesidades de los estándares de codificación de vídeo: [4]
CABAC tiene múltiples modos de probabilidad para diferentes contextos. Primero convierte todos los símbolos no binarios a binarios. Luego, para cada bit, el codificador selecciona qué modelo de probabilidad usar y luego usa información de elementos cercanos para optimizar la estimación de probabilidad. Finalmente se aplica la codificación aritmética para comprimir los datos.
El modelado de contexto proporciona estimaciones de probabilidades condicionales de los símbolos de codificación. Utilizando modelos de contexto adecuados, se puede explotar una redundancia entre símbolos determinada cambiando entre diferentes modelos de probabilidad según los símbolos ya codificados en la vecindad del símbolo actual a codificar. El modelado de contexto es responsable de la mayor parte del ahorro aproximado del 10% de CABAC en velocidad de bits respecto al método de codificación de entropía CAVLC .
Codificar un símbolo de datos implica las siguientes etapas.
1. Binarice el valor MVDx, la diferencia del vector de movimiento en la dirección x .
El primer bit de la palabra clave binarizada es bin 1; el segundo bit es el contenedor 2; etcétera.
2. Elija un modelo de contexto para cada contenedor. Se selecciona uno de los 3 modelos para el contenedor 1, según los valores MVD codificados anteriormente. Se calcula la norma L1 de dos valores previamente codificados, e k ,:
Si e k es pequeño, entonces existe una alta probabilidad de que el MVD actual tenga una magnitud pequeña; por el contrario, si e k es grande, entonces es más probable que el MVD actual tenga una magnitud grande. Seleccionamos una tabla de probabilidad (modelo de contexto) en consecuencia. Los contenedores restantes se codifican utilizando uno de los 4 modelos de contexto adicionales:
3. Codifique cada contenedor. El modelo de contexto seleccionado proporciona dos estimaciones de probabilidad: la probabilidad de que el contenedor contenga "1" y la probabilidad de que el contenedor contenga "0". Estas estimaciones determinan los dos subrangos que utiliza el codificador aritmético para codificar el contenedor.
4. Actualizar los modelos de contexto. Por ejemplo, si se seleccionó el modelo de contexto 2 para el contenedor 1 y el valor del contenedor 1 era "0", se incrementa el recuento de frecuencia de "0". Esto significa que la próxima vez que se seleccione este modelo, la probabilidad de obtener un “0” será ligeramente mayor. Cuando el número total de ocurrencias de un modelo excede un valor umbral, los recuentos de frecuencia para “0” y “1” se reducirán, lo que de hecho otorga mayor prioridad a las observaciones recientes.
El decodificador aritmético se describe con cierto detalle en la Norma. Tiene tres propiedades distintas:
La definición del proceso de decodificación está diseñada para facilitar implementaciones de baja complejidad de codificación y decodificación aritmética. En general, CABAC proporciona una eficiencia de codificación mejorada en comparación con la codificación basada en CAVLC, a expensas de una mayor complejidad computacional.
En 1986, los investigadores de IBM Kottappuram MA Mohiuddin y Jorma Johannen Rissanen presentaron una patente para un algoritmo de codificación aritmética binaria sin multiplicación. [5] [6] En 1988, un equipo de investigación de IBM que incluía a RB Arps, TK Truong, DJ Lu, WB Pennebaker, L. Mitchell y GG Langdon presentaron un algoritmo de codificación aritmética binaria adaptativa (ABAC) llamado Q-Coder. [7] [8]
Las patentes y artículos de investigación mencionados anteriormente, junto con varios otros de IBM y Mitsubishi Electric , fueron citados posteriormente por el CCITT y el Joint Photographic Experts Group como base para el algoritmo de codificación aritmética binaria adaptativa del formato de compresión de imágenes JPEG en 1992. [5] Sin embargo, los codificadores y los decodificadores del formato de archivo JPEG, que tiene opciones tanto para codificación Huffman como para codificación aritmética, generalmente solo admiten la opción de codificación Huffman, que originalmente se debió a problemas de patentes, aunque las patentes de codificación aritmética de JPEG [9] han expirado desde entonces debido a la antigüedad. del estándar JPEG. [10] El primer uso informado de codificación aritmética binaria adaptativa en la compresión de video en movimiento fue en una propuesta de investigadores de IBM al grupo MPEG en 1989. [11] [12] Esta propuesta amplió el uso de codificación aritmética desde JPEG intracuadro a video intercuadro. codificación.
En 1999, Youngjun Yoo ( Texas Instruments ), Young Gap Kwon y Antonio Ortega ( Universidad del Sur de California ) presentaron una forma de codificación aritmética binaria que se adapta al contexto. [13] El algoritmo moderno de codificación aritmética binaria adaptativa al contexto (CABAC) se introdujo comercialmente con el formato H.264/MPEG-4 AVC en 2003. [14] La mayoría de las patentes para el formato AVC están en manos de Panasonic , Godo Kaisha. Puente IP y LG Electronics . [15]