La unidad de árbol de codificación ( CTU ) es la unidad de procesamiento básica del estándar de video de codificación de video de alta eficiencia (HEVC) y conceptualmente corresponde en estructura a las unidades de macrobloque que se usaron en varios estándares de video anteriores. [1] [2] La CTU también se conoce como unidad de codificación más grande ( LCU ). [3]
Una CTU puede tener un tamaño de entre 16×16 píxeles y 64×64 píxeles, y un tamaño mayor suele aumentar la eficiencia de codificación. [4] [2] El primer estándar de video que utiliza CTU es HEVC/H.265, que se convirtió en un estándar ITU-T el 13 de abril de 2013. [5] [6] [7]
Historia
Los métodos de codificación de macrobloques se han utilizado en los estándares de codificación de vídeo digital desde H.261 , que se publicó por primera vez en 1988. Sin embargo, para la corrección de errores y la relación señal-ruido, el tamaño estándar de macrobloques de 16x16 no es capaz de obtener el tipo de reducciones de bits que la teoría de la información y la teoría de la codificación sugieren que son teórica y prácticamente posibles. [8]
Detalles técnicos
HEVC reemplaza los macrobloques , que se usaban con estándares de video anteriores, con CTU que pueden usar estructuras de bloques más grandes de hasta 64×64 píxeles y pueden subdividir mejor la imagen en estructuras de tamaño variable. [4] [9]
HEVC divide inicialmente la imagen en CTU que luego se dividen para cada componente luma/croma en bloques de árbol de codificación (CTB). [4] [9]
Un CTB puede ser de 64×64, 32×32 o 16×16, y un tamaño de bloque de píxeles más grande generalmente aumenta la eficiencia de codificación. [4] Luego, los CTB se dividen en una o más unidades de codificación (CU), de modo que el tamaño de la CTU también sea el tamaño de unidad de codificación más grande. [4]
- La disposición de las CU en un CTB se conoce como quadtree, ya que una subdivisión da como resultado cuatro regiones más pequeñas. [4]
- Las CU se dividen luego en unidades de predicción (PU) de tipo de predicción intra-imagen o inter-imagen que pueden variar en tamaño de 64×64 a 4×4. [4] [9] Para limitar el ancho de banda de memoria en el peor de los casos al aplicar compensación de movimiento en el proceso de decodificación, las unidades de predicción codificadas utilizando predicción inter-imagen se restringen a un tamaño mínimo de 8×4 o 4×8 si se predicen a partir de una sola referencia (uni-predicción) u 8×8 si se predicen a partir de dos referencias (bi-predicción). [4] [10]
- Para codificar el residuo de predicción, una CU se divide en un árbol cuaternario de unidades de transformación DCT (TU). [4] [11] Las TU contienen coeficientes para la transformación y cuantificación de bloques espaciales. [4] [9] Una TU puede tener tamaños de bloque de píxeles de 32×32, 16×16, 8×8 o 4×4. [4]
Normalización
En la reunión de HEVC de julio de 2012 se decidió, con base en la propuesta JCTVC-J0334, que se requeriría que los niveles HEVC 5 y superiores utilicen tamaños de CTB de 32×32 o 64×64. [3] [12] Esto se agregó a HEVC en el Borrador de Norma Internacional como un límite de nivel para la variable Log2MaxCtbSize. [13]
Log2MaxCtbSize pasó a llamarse CtbSizeY en el borrador HEVC de octubre de 2012 y luego a llamarse CtbLog2SizeY en el borrador HEVC de enero de 2013. [10] [14]
Eficiencia de codificación
El diseño de la mayoría de los estándares de codificación de video está orientado principalmente a lograr la mayor eficiencia de codificación. [2] La eficiencia de codificación es la capacidad de codificar video a la tasa de bits más baja posible mientras se mantiene un cierto nivel de calidad de video. [2] HEVC se beneficia del uso de tamaños de CTB más grandes. [2]
Esto se ha demostrado en pruebas de relación señal-ruido (PSNR) máxima con un codificador HEVC HM-8.0 donde se lo obligó a usar tamaños de CTU progresivamente más pequeños. [2] Para todas las secuencias de prueba en comparación con un tamaño de CTU de 64×64, se demostró que la tasa de bits HEVC aumentó un 2,2 % cuando se lo obligó a usar un tamaño de CTU de 32×32 y aumentó un 11,0 % cuando se lo obligó a usar un tamaño de CTU de 16×16. [2]
En las secuencias de prueba de clase A, donde la resolución del video era 2560×1600, en comparación con un tamaño de CTU de 64×64 se demostró que la tasa de bits HEVC aumentó un 5,7% cuando se obligó a utilizar un tamaño de CTU de 32×32 y aumentó un 28,2% cuando se obligó a utilizar un tamaño de CTU de 16×16. [2]
Las pruebas demostraron que los tamaños grandes de CTU se vuelven aún más importantes para la eficiencia de codificación con video de mayor resolución. [2] Las pruebas también demostraron que tomó un 60% más de tiempo decodificar video HEVC codificado en un tamaño de CTU de 16x16 que en un tamaño de CTU de 64x64. [2] Las pruebas demostraron que los tamaños grandes de CTU aumentan la eficiencia de codificación al mismo tiempo que reducen el tiempo de decodificación. [2] Las pruebas se llevaron a cabo con el perfil principal de HEVC basado en PSNR igual. [2]
Véase también
- Codificación de video de alta eficiencia (HEVC): estándar de video que admite 8K UHDTV y resoluciones de hasta 8192 × 4320
- H.264/MPEG-4 AVC : el estándar de vídeo predecesor de HEVC
- VP9 : un códec de vídeo con superbloques, que son similares a las CTU
- Macrobloque : la unidad de procesamiento básica utilizada en varios estándares de video anteriores
Referencias
- ^ GJ Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (25 de mayo de 2012). "Descripción general del estándar de codificación de video de alta eficiencia (HEVC)" (PDF) . Transacciones IEEE sobre circuitos y sistemas para tecnología de video nuevo propietario de la codificación: GilbertLeeGrimaldoJr.(c)(r)(tm) . Consultado el 26 de abril de 2013 .
- ^ abcdefghijklm GJ Sullivan; Heiko Schwarz; Thiow Keng Tan; Thomas Wiegand (22 de agosto de 2012). "Comparación de la eficiencia de codificación de los estándares de codificación de video, incluida la codificación de video de alta eficiencia (HEVC)" (PDF) . Transacciones IEEE sobre circuitos y sistemas para tecnología de video . Consultado el 26 de abril de 2013 .
- ^ por Gary Sullivan; Jens-Rainer Ohm (13 de octubre de 2012). "Informe de la décima reunión del Equipo de colaboración conjunta sobre codificación de vídeo (JCT-VC), Estocolmo, SE, 11-20 de julio de 2012". JCT-VC . Consultado el 28 de abril de 2013 .
- ^ abcdefghijk GJ Sullivan; J.-R. Ohm; W.-J. Han; T. Wiegand (25 de mayo de 2012). "Descripción general del estándar de codificación de video de alta eficiencia (HEVC)" (PDF) . IEEE Transactions on Circuits and Systems for Video Technology . Consultado el 26 de abril de 2013 .
- ^ "Inicio UIT-T: Grupos de estudio: Recomendaciones UIT-T: UIT-T H.265 (04/2013)". UIT. 2013-04-13 . Consultado el 16 de abril de 2013 .
- ^ "Recomendación de la AAP: H.265". UIT. 2013-04-13 . Consultado el 16 de abril de 2013 .
- ^ "Anuncio AAP nº 09". UIT. 2013-04-15 . Consultado el 16 de abril de 2013 .
- ^ "Diario de un desarrollador x264 » Los problemas con las wavelets". Archivado desde el original el 29 de enero de 2014. Consultado el 6 de febrero de 2014 .
- ^ abcd "Descripción de la codificación de vídeo de alta eficiencia (HEVC)". JCT-VC. 2011-01-01 . Consultado el 2012-09-15 .
- ^ ab "Borrador de especificación de texto de codificación de video de alta eficiencia (HEVC) n.° 10 (para FDIS y consentimiento)". JCT-VC. 17 de enero de 2013. Consultado el 24 de enero de 2013 .
- ^ Thomson, Gavin; Shah, Athar (2017). "Introducción a HEIF y HEVC" (PDF) . Apple Inc. Consultado el 5 de agosto de 2019 .
- ^ Wade Wan; Tim Hellman (3 de julio de 2012). "Adición de una restricción de nivel en el tamaño de bloque del árbol de codificación". JCT-VC . Consultado el 22 de septiembre de 2012 .
- ^ "Borrador de texto de especificación de codificación de vídeo de alta eficiencia (HEVC) n.° 8". JCT-VC. 28 de julio de 2012. Consultado el 31 de julio de 2012 .
- ^ "Borrador de texto de especificación de codificación de video de alta eficiencia (HEVC) n.° 9". JCT-VC. 22 de octubre de 2012. Consultado el 23 de octubre de 2012 .
Enlaces externos
- Descripción general de HEVC
- Eficiencia de codificación HEVC
- Recomendación UIT-T H.265: codificación de vídeo de alta eficiencia