La codificación de vídeo de alta eficiencia ( HEVC ), también conocida como H.265 y MPEG-H Parte 2 , es un estándar de compresión de vídeo diseñado como parte del proyecto MPEG-H como sucesor de la ampliamente utilizada codificación de vídeo avanzada (AVC, H. 264 o MPEG-4 parte 10). En comparación con AVC, HEVC ofrece entre un 25 % y un 50 % mejor compresión de datos con el mismo nivel de calidad de vídeo , o una calidad de vídeo sustancialmente mejorada con la misma velocidad de bits . Admite resoluciones de hasta 8192 × 4320, incluido 8K UHD y, a diferencia del AVC principalmente de 8 bits, el perfil Main 10 de mayor fidelidad de HEVC se ha incorporado en casi todo el hardware compatible.
Mientras que AVC utiliza la transformada de coseno discreta entera (DCT) con tamaños de bloque de 4×4 y 8×8, HEVC utiliza tanto DCT entera como transformada de seno discreta (DST) con tamaños de bloque variados entre 4×4 y 32×32. El formato de imagen de alta eficiencia (HEIF) se basa en HEVC. [2]
En la mayoría de los casos, HEVC es una extensión de los conceptos de H.264/MPEG-4 AVC. Ambos funcionan comparando diferentes partes de un cuadro de video para encontrar áreas redundantes, tanto dentro de un solo cuadro como entre cuadros consecutivos. Luego, estas áreas redundantes se reemplazan con una breve descripción en lugar de los píxeles originales. Los principales cambios para HEVC incluyen la expansión de la comparación de patrones y las áreas de codificación de diferencias de 16 × 16 píxeles a tamaños de hasta 64 × 64, segmentación mejorada de tamaño de bloque variable , predicción "intra" mejorada dentro de la misma imagen, movimiento mejorado predicción de vectores y fusión de regiones de movimiento, filtrado de compensación de movimiento mejorado y un paso de filtrado adicional llamado filtrado de compensación adaptativo de muestra. El uso eficaz de estas mejoras requiere mucha más capacidad de procesamiento de señales para comprimir el vídeo, pero tiene menos impacto en la cantidad de cálculo necesario para la descompresión.
HEVC fue estandarizado por el Equipo Colaborativo Conjunto sobre Codificación de Video (JCT-VC), una colaboración entre ISO / IEC MPEG y el Grupo de Estudio 16 VCEG de ITU-T . El grupo ISO/IEC se refiere a él como MPEG-H Parte 2 y el ITU-T como H.265. La primera versión del estándar HEVC fue ratificada en enero de 2013 y publicada en junio de 2013. La segunda versión, con extensiones multivista (MV-HEVC), extensiones de rango (RExt) y extensiones de escalabilidad (SHVC), se completó y aprobó en 2014. y se publicó a principios de 2015. Las extensiones para video 3D (3D-HEVC) se completaron a principios de 2015, y las extensiones para codificación de contenido de pantalla (SCC) se completaron a principios de 2016 y se publicaron a principios de 2017, cubriendo videos que contienen gráficos, texto o animación, así como (o en lugar de) escenas de vídeo capturadas por la cámara. En octubre de 2017, el estándar fue reconocido con un premio Primetime Emmy Engineering Award por haber tenido un efecto material en la tecnología de la televisión. [3] [4] [5] [6] [7]
HEVC contiene tecnologías cubiertas por patentes propiedad de las organizaciones que participaron en el JCT-VC. La implementación de un dispositivo o aplicación de software que utilice HEVC puede requerir una licencia de los titulares de patentes de HEVC. La ISO/IEC y la UIT exigen que las empresas que pertenecen a sus organizaciones ofrezcan sus patentes en condiciones de licencia razonables y no discriminatorias (RAND). Las licencias de patentes se pueden obtener directamente de cada titular de patente o a través de organismos de concesión de licencias de patentes, como MPEG LA , Access Advance y Velos Media.
Las tarifas de licencia combinadas que ofrecen actualmente todos los organismos de concesión de licencias de patentes son más altas que las de AVC. Las tarifas de licencia son una de las principales razones por las que la adopción de HEVC ha sido baja en la web y es la razón por la que algunas de las empresas tecnológicas más grandes ( Amazon , AMD , Apple , ARM , Cisco , Google , Intel , Microsoft , Mozilla , Netflix , Nvidia y más) se han unido a la Alliance for Open Media , [8] que finalizó el formato de codificación de video alternativo libre de regalías AV1 el 28 de marzo de 2018. [9]
El formato HEVC fue desarrollado conjuntamente por más de una docena de organizaciones en todo el mundo. La mayoría de las contribuciones de patentes activas para el desarrollo del formato HEVC provinieron de cinco organizaciones: Samsung Electronics (4249 patentes), General Electric (1127 patentes), [10] M&K Holdings (907 patentes), NTT (878 patentes) y JVC. Kenwood (628 patentes). [11] Otros titulares de patentes incluyen Fujitsu , Apple , Canon , la Universidad de Columbia , KAIST , la Universidad de Kwangwoon , el MIT , la Universidad de Sungkyunkwan , Funai , Hikvision , KBS , KT y NEC . [12]
En 2004, el Grupo de Expertos en Codificación de Vídeo (VCEG) del UIT-T inició un importante estudio de los avances tecnológicos que podrían permitir la creación de un nuevo estándar de compresión de vídeo (o mejoras sustanciales orientadas a la compresión del estándar H.264/MPEG-4 AVC). ). [13] En octubre de 2004, se estudiaron varias técnicas para mejorar potencialmente el estándar H.264/MPEG-4 AVC. En enero de 2005, en la siguiente reunión del VCEG, el VCEG comenzó a designar ciertos temas como "Áreas Técnicas Clave" (KTA) para una mayor investigación. Se estableció una base de código de software llamada base de código KTA para evaluar tales propuestas. [14] El software KTA se basó en el software de referencia Joint Model (JM) desarrollado por MPEG & VCEG Joint Video Team para H.264/MPEG-4 AVC. Se integraron tecnologías propuestas adicionales en el software KTA y se probaron en evaluaciones experimentales durante los siguientes cuatro años. [15] [13] [16] [17]
Se consideraron dos enfoques para estandarizar la tecnología de compresión mejorada: crear un nuevo estándar o crear extensiones de H.264/MPEG-4 AVC. El proyecto tenía nombres provisionales H.265 y H.NGVC (Codificación de vídeo de próxima generación) y fue una parte importante del trabajo de VCEG hasta que evolucionó hasta convertirse en el proyecto conjunto HEVC con MPEG en 2010. [18] [19] [ 20]
Los requisitos preliminares para NGVC eran la capacidad de tener una reducción de la velocidad de bits del 50% con la misma calidad de imagen subjetiva en comparación con el perfil alto H.264/MPEG-4 AVC, y una complejidad computacional que oscilaba entre 1/2 y 3 veces la de NGVC. el Alto perfil. [20] NGVC podría proporcionar una reducción de la tasa de bits del 25% junto con una reducción del 50% en la complejidad con la misma calidad de video percibida que el perfil alto, o proporcionar una mayor reducción de la tasa de bits con una complejidad algo mayor. [20] [21]
El Grupo de Expertos en Imágenes en Movimiento (MPEG) de ISO / IEC inició un proyecto similar en 2007, denominado provisionalmente Codificación de vídeo de alto rendimiento . [22] [23] Se había decidido alcanzar un acuerdo para obtener una reducción de la tasa de bits del 50% como objetivo del proyecto en julio de 2007. [22] Las primeras evaluaciones se realizaron con modificaciones del codificador de software de referencia KTA desarrollado por VCEG. [13] En julio de 2009, los resultados experimentales mostraron una reducción promedio de bits de alrededor del 20% en comparación con AVC High Profile; Estos resultados llevaron a MPEG a iniciar su esfuerzo de estandarización en colaboración con VCEG. [23]
MPEG y VCEG establecieron un equipo colaborativo conjunto sobre codificación de vídeo ( JCT-VC ) para desarrollar el estándar HEVC. [13] [24] [25] [26]
En enero de 2010, VCEG y MPEG publicaron una convocatoria de propuestas conjunta formal sobre tecnología de compresión de vídeo, y las propuestas se evaluaron en la primera reunión del Equipo Colaborativo Conjunto de MPEG y VCEG sobre Codificación de Vídeo (JCT-VC), que tuvo lugar en abril. 2010. Se presentaron un total de 27 propuestas completas. [18] [27] Las evaluaciones mostraron que algunas propuestas podían alcanzar la misma calidad visual que AVC con solo la mitad de la velocidad de bits en muchos de los casos de prueba, a costa de un aumento de 2 a 10 veces en la complejidad computacional, y algunas propuestas lograron buenos resultados. Resultados de calidad subjetiva y velocidad de bits con menor complejidad computacional que las codificaciones de alto perfil AVC de referencia. En esa reunión se adoptó el nombre de Codificación de vídeo de alta eficiencia (HEVC) para el proyecto conjunto. [13] [18] A partir de esa reunión, el JCT-VC integró características de algunas de las mejores propuestas en una única base de código de software y un "Modelo de prueba bajo consideración", y realizó más experimentos para evaluar varias características propuestas. [13] [28] El primer borrador de trabajo de especificación de HEVC se produjo en la tercera reunión de JCT-VC en octubre de 2010. En reuniones posteriores de JCT-VC se realizaron muchos cambios en las herramientas de codificación y la configuración de HEVC. [13]
El 25 de enero de 2013, la UIT anunció que HEVC había recibido la aprobación (consentimiento) de la primera etapa en el Proceso de Aprobación Alternativa (AAP) del UIT-T . [29] [30] [31] El mismo día, MPEG anunció que HEVC había sido ascendido al estado de Borrador final de estándar internacional (FDIS) en el proceso de estandarización de MPEG . [32] [33]
El 13 de abril de 2013, se aprobó HEVC/H.265 como estándar ITU-T. [34] [35] [36] El estándar fue publicado formalmente por el UIT-T el 7 de junio de 2013 y por la ISO/IEC el 25 de noviembre de 2013. [24] [17]
El 11 de julio de 2014, MPEG anunció que la segunda edición de HEVC contendrá tres extensiones recientemente completadas que son las extensiones multivista (MV-HEVC), las extensiones de rango (RExt) y las extensiones de escalabilidad (SHVC). [37]
El 29 de octubre de 2014, se aprobó HEVC/H.265 versión 2 como estándar ITU-T. [38] [39] [40] Luego se publicó formalmente el 12 de enero de 2015. [24]
El 29 de abril de 2015, se aprobó la versión 3 de HEVC/H.265 como estándar ITU-T. [41] [42] [43]
El 3 de junio de 2016, la versión 4 de HEVC/H.265 fue aprobada en el UIT-T y no fue aprobada durante una votación en octubre de 2016. [44] [45]
El 22 de diciembre de 2016, se aprobó HEVC/H.265 versión 4 como estándar ITU-T. [46] [47]
El 29 de septiembre de 2014, MPEG LA anunció su licencia HEVC que cubre las patentes esenciales de 23 empresas. [48] Los primeros 100.000 "dispositivos" (que incluyen implementaciones de software) están libres de regalías y, después de eso, la tarifa es de 0,20 dólares por dispositivo hasta un límite anual de 25 millones de dólares. [49] Esto es significativamente más caro que las tarifas de AVC, que eran de 0,10 dólares por dispositivo, con la misma exención de 100.000 y un límite anual de 6,5 millones de dólares. MPEG LA no cobra ninguna tarifa por el contenido en sí, algo que habían intentado inicialmente cuando concedieron la licencia AVC, pero que posteriormente abandonaron cuando los productores de contenido se negaron a pagarlo. [50] La licencia se ha ampliado para incluir los perfiles de la versión 2 del estándar HEVC. [51]
Cuando se anunciaron los términos de MPEG LA, los comentaristas señalaron que varios titulares de patentes destacados no formaban parte del grupo. Entre ellos se encontraban AT&T , Microsoft , Nokia y Motorola . En ese momento se especulaba que estas empresas formarían su propio grupo de licencias para competir con el grupo MPEG LA o sumarse a él. Dicho grupo se anunció formalmente el 26 de marzo de 2015 como HEVC Advance. [52] Los términos, que cubren 500 patentes esenciales, se anunciaron el 22 de julio de 2015, con tarifas que dependen del país de venta, el tipo de dispositivo, el perfil HEVC, las extensiones HEVC y las características opcionales HEVC. A diferencia de los términos de MPEG LA, HEVC Advance reintrodujo tarifas de licencia sobre contenido codificado con HEVC, a través de una tarifa de reparto de ingresos. [53]
La licencia inicial de HEVC Advance tenía una tasa de regalías máxima de 2,60 dólares estadounidenses por dispositivo para los países de la Región 1 y una tasa de regalías de contenido del 0,5% de los ingresos generados por los servicios de video HEVC. Los países de la Región 1 en la licencia HEVC Advance incluyen Estados Unidos, Canadá, Unión Europea, Japón, Corea del Sur, Australia, Nueva Zelanda y otros. Los países de la Región 2 son países que no figuran en la lista de países de la Región 1. La licencia HEVC Advance tenía una tasa de regalías máxima de 1,30 dólares estadounidenses por dispositivo para los países de la Región 2. A diferencia de MPEG LA, no había un límite anual. Además de esto, HEVC Advance también cobró una tasa de regalías del 0,5% de los ingresos generados por los servicios de vídeo que codifican contenido en HEVC. [53]
Cuando se anunciaron, hubo una reacción considerable por parte de los observadores de la industria sobre las tarifas "irrazonables y codiciosas" de los dispositivos, que eran aproximadamente siete veces mayores que las tarifas de MPEG LA. En conjunto, un dispositivo requeriría licencias que costarían 2,80 dólares, veintiocho veces más caras que AVC, así como tarifas de licencia sobre el contenido. Esto llevó a llamados para que "los propietarios de contenido se unan y acuerden no otorgar licencias a HEVC Advance". [54] Otros argumentaron que las tarifas podrían hacer que las empresas cambiaran a estándares competitivos como Daala y VP9 . [55]
El 18 de diciembre de 2015, HEVC Advance anunció cambios en las tasas de regalías. Los cambios incluyen una reducción en la tasa máxima de regalías para los países de la Región 1 a 2,03 dólares estadounidenses por dispositivo, la creación de límites anuales de regalías y una exención de regalías sobre el contenido que es gratuito para los usuarios finales. El límite anual de regalías para una empresa es de 40 millones de dólares para dispositivos, 5 millones de dólares para contenido y 2 millones de dólares para funciones opcionales. [56]
El 3 de febrero de 2016, Technicolor SA anunció que se había retirado del grupo de patentes HEVC Advance [57] y que otorgaría licencias directas sobre sus patentes HEVC. [58] HEVC Advance enumeró anteriormente 12 patentes de Technicolor. [59] Technicolor anunció que se habían reincorporado el 22 de octubre de 2019. [60]
El 22 de noviembre de 2016, HEVC Advance anunció una importante iniciativa, revisando su política para permitir que las implementaciones de software de HEVC se distribuyan directamente a dispositivos móviles de consumo y computadoras personales libres de regalías, sin requerir una licencia de patente. [61]
El 31 de marzo de 2017, Velos Media anunció su licencia HEVC que cubre las patentes esenciales de Ericsson, Panasonic, Qualcomm Incorporated, Sharp y Sony. [62]
En abril de 2019, [actualizar]la lista de patentes de MPEG LA HEVC tiene 164 páginas. [63] [64]
Las siguientes organizaciones poseen actualmente las patentes más activas en los grupos de patentes HEVC enumerados por MPEG LA y HEVC Advance:
Versiones del estándar HEVC/H.265 utilizando las fechas de aprobación del ITU-T. [24]
El 29 de febrero de 2012, en el Mobile World Congress de 2012 , Qualcomm demostró un decodificador HEVC ejecutándose en una tableta Android, con un procesador Qualcomm Snapdragon S4 de doble núcleo funcionando a 1,5 GHz, mostrando versiones H.264/MPEG-4 AVC y HEVC. del mismo contenido de vídeo reproduciéndose uno al lado del otro. En esta demostración, HEVC supuestamente mostró una reducción de la tasa de bits de casi el 50 % en comparación con H.264/MPEG-4 AVC. [73]
El 11 de febrero de 2013, investigadores del MIT demostraron el primer decodificador HEVC ASIC publicado en el mundo en la Conferencia Internacional de Circuitos de Estado Sólido (ISSCC) de 2013. [74] Su chip era capaz de decodificar una transmisión de video de 3840 × 2160p a 30 fps en tiempo real. tiempo, consumiendo menos de 0,1 W de potencia. [75] [76]
El 3 de abril de 2013, Ateme anunció la disponibilidad de la primera implementación de código abierto de un reproductor de software HEVC basado en el decodificador OpenHEVC y el reproductor de video GPAC , ambos con licencia LGPL . El decodificador OpenHEVC admite el perfil principal de HEVC y puede decodificar video de 1080p a 30 fps usando una CPU de un solo núcleo. [77] En el stand de ATEME en la feria NAB en abril de 2013 se mostró un transcodificador en vivo que admite HEVC y se usa en combinación con el reproductor de video GPAC. [77] [78]
El 23 de julio de 2013, MulticoreWare anunció y puso a disposición el código fuente para la biblioteca de codificadores HEVC x265 bajo la licencia GPL v2 . [79] [80]
El 8 de agosto de 2013, Nippon Telegraph and Telephone anunció el lanzamiento de su codificador de software HEVC-1000 SDK que admite el perfil Main 10, resoluciones de hasta 7680 × 4320 y velocidades de cuadros de hasta 120 fps. [81]
El 14 de noviembre de 2013, los desarrolladores de DivX publicaron información sobre el rendimiento de decodificación HEVC utilizando una CPU Intel i7 a 3,5 GHz con 4 núcleos y 8 subprocesos. [82] El decodificador DivX 10.1 Beta era capaz de alcanzar 210,9 fps a 720p, 101,5 fps a 1080p y 29,6 fps a 4K. [82]
El 18 de diciembre de 2013, ViXS Systems anunció los envíos de su SoC XCode (que no debe confundirse con el Xcode IDE de Apple para MacOS) 6400, que fue el primer SoC que admitió el perfil Main 10 de HEVC. [83]
El 5 de abril de 2014, en la feria NAB, eBrisk Video, Inc. y Altera Corporation demostraron un codificador HEVC Main10 acelerado por FPGA que codificaba vídeo 4Kp60/10 bits en tiempo real, utilizando un Xeon E5-2697-v2 dual. plataforma. [84] [85]
El 13 de agosto de 2014, Ittiam Systems anunció la disponibilidad de su códec H.265/HEVC de tercera generación con soporte 4:2:2 de 12 bits. [86]
El 5 de septiembre de 2014, la Blu-ray Disc Association anunció que la especificación 4K Blu-ray Disc admitiría vídeo 4K codificado con HEVC a 60 fps, la Rec. Espacio de color 2020 , alto rango dinámico ( PQ y HLG ) y profundidad de color de 10 bits . [87] [88] Los discos Blu-ray 4K tienen una velocidad de datos de al menos 50 Mbit/s y una capacidad de disco de hasta 100 GB. [87] [88] Los reproductores y discos Blu-ray 4K estuvieron disponibles para su compra en 2015 o 2016. [87] [88]
El 9 de septiembre de 2014, Apple anunció el iPhone 6 y el iPhone 6 Plus que son compatibles con HEVC/H.265 para FaceTime a través de celular. [89]
El 18 de septiembre de 2014, Nvidia lanzó GeForce GTX 980 (GM204) y GTX 970 (GM204), que incluye Nvidia NVENC , el primer codificador de hardware HEVC del mundo en una tarjeta gráfica discreta. [90]
El 31 de octubre de 2014, Microsoft confirmó que Windows 10 admitirá HEVC de fábrica , según una declaración de Gabriel Aul, líder del equipo de fundamentos y datos del grupo de sistemas operativos de Microsoft. [91] [92] Windows 10 Technical Preview Build 9860 agregó soporte a nivel de plataforma para HEVC y Matroska . [93] [94]
El 3 de noviembre de 2014, se lanzó Android Lollipop con soporte listo para usar para HEVC utilizando el software de Ittiam Systems . [95]
El 5 de enero de 2015, ViXS Systems anunció el XCode 6800, que es el primer SoC que admite el perfil Main 12 de HEVC. [96]
El 5 de enero de 2015, Nvidia anunció oficialmente el SoC Tegra X1 con decodificación de hardware HEVC de función fija completa. [97] [98]
El 22 de enero de 2015, Nvidia lanzó la GeForce GTX 960 (GM206), que incluye el primer decodificador de hardware HEVC Main/Main10 con función fija completa del mundo en una tarjeta gráfica discreta. [99]
El 23 de febrero de 2015, Advanced Micro Devices (AMD) anunció que su UVD ASIC que se encuentra en las APU Carrizo sería la primera CPU basada en x86 en tener un decodificador de hardware HEVC. [100]
El 27 de febrero de 2015, se lanzó la versión 2.2.0 del reproductor multimedia VLC con un sólido soporte para la reproducción HEVC. Las versiones correspondientes en Android e iOS también pueden reproducir HEVC.
El 31 de marzo de 2015, VITEC anunció el MGW Ace, que fue el primer codificador HEVC portátil 100% basado en hardware que proporciona codificación HEVC móvil. [101]
El 5 de agosto de 2015, Intel lanzó productos Skylake con función fija completa de decodificación/codificación principal/8 bits y decodificación principal híbrida/parcial de 10/10 bits.
El 9 de septiembre de 2015, Apple anunció el chip Apple A9 , utilizado por primera vez en el iPhone 6S , su primer procesador con un decodificador HEVC de hardware compatible con Main 8 y 10. Esta característica no se desbloquearía hasta el lanzamiento de iOS 11 en 2017. [102 ]
El 11 de abril de 2016, se anunció la compatibilidad total con HEVC (H.265) en la versión más reciente de MythTV (0.28). [103]
El 30 de agosto de 2016, Intel anunció oficialmente los productos de CPU Core de séptima generación ( Kaby Lake ) con soporte completo de decodificación de hardware HEVC Main10 con función fija. [104]
El 7 de septiembre de 2016, Apple anunció el chip Apple A10 , utilizado por primera vez en el iPhone 7 , que incluía un codificador HEVC de hardware compatible con Main 8 y 10. Esta función no se desbloquearía hasta el lanzamiento de iOS 11 en 2017. [102]
El 25 de octubre de 2016, Nvidia lanzó GeForce GTX 1050Ti (GP107) y GeForce GTX 1050 (GP107), que incluyen un codificador de hardware HEVC Main10/Main12 con función fija completa.
El 5 de junio de 2017, Apple anunció la compatibilidad con HEVC H.265 en macOS High Sierra , iOS 11 , tvOS , [105] HTTP Live Streaming [106] y Safari . [107] [108]
El 25 de junio de 2017, Microsoft lanzó una extensión de aplicación HEVC gratuita para Windows 10 , que permite que algunos dispositivos Windows 10 con hardware de decodificación HEVC reproduzcan videos usando el formato HEVC dentro de cualquier aplicación. [109]
El 19 de septiembre de 2017, Apple lanzó iOS 11 y tvOS 11 con soporte de codificación y decodificación HEVC. [110] [105]
El 25 de septiembre de 2017, Apple lanzó macOS High Sierra con soporte de codificación y decodificación HEVC.
El 28 de septiembre de 2017, GoPro lanzó la cámara de acción Hero6 Black, con codificación de video HEVC 4K60P. [111]
El 17 de octubre de 2017, Microsoft eliminó la compatibilidad con la decodificación HEVC de Windows 10 con la versión 1709 Fall Creators Update, lo que hizo que HEVC estuviera disponible como una descarga separada y paga desde Microsoft Store. [112]
El 2 de noviembre de 2017, Nvidia lanzó la GeForce GTX 1070 Ti (GP104), que incluye un decodificador de hardware HEVC Main10/Main12 con función fija completa.
El 20 de septiembre de 2018, Nvidia lanzó la GeForce RTX 2080 (TU104), que incluye un decodificador de hardware HEVC Main 4:4:4 12 con función fija completa.
El 25 de octubre de 2022, Chrome lanzó la versión 107, que comienza a admitir la decodificación de hardware HEVC para todas las plataformas "listas para usar", si el hardware es compatible.
HEVC se implementa en estos navegadores web:
En junio de 2023, se estima que el 88,31 % de los navegadores utilizados en sistemas móviles y de escritorio podían reproducir vídeos HEVC en páginas web HTML5, según datos de Can I Use. [117]
La mayoría de los estándares de codificación de vídeo están diseñados principalmente para lograr la mayor eficiencia de codificación. La eficiencia de codificación es la capacidad de codificar video a la velocidad de bits más baja posible manteniendo un cierto nivel de calidad de video. Hay dos formas estándar de medir la eficiencia de codificación de un estándar de codificación de vídeo: utilizar una métrica objetiva, como la relación señal-ruido máxima (PSNR), o utilizar una evaluación subjetiva de la calidad del vídeo. La evaluación subjetiva de la calidad del vídeo se considera la forma más importante de medir un estándar de codificación de vídeo, ya que los humanos perciben la calidad del vídeo de forma subjetiva. [121]
HEVC se beneficia del uso de tamaños de unidades de árbol de codificación (CTU) más grandes. Esto se ha demostrado en pruebas PSNR con un codificador HEVC HM-8.0, donde se vio obligado a utilizar tamaños de CTU progresivamente más pequeños. Para todas las secuencias de prueba, en comparación con un tamaño de CTU de 64×64, se demostró que la velocidad de bits HEVC aumentó en un 2,2% cuando se obligó a usar un tamaño de CTU de 32×32, y aumentó en un 11,0% cuando se obligó a usar un tamaño de CTU de 16×. Tamaño de 16 unidades. En las secuencias de prueba de Clase A, donde la resolución del vídeo era de 2560×1600, en comparación con un tamaño de CTU de 64×64, se demostró que la tasa de bits HEVC aumentó en un 5,7 % cuando se obligó a utilizar un tamaño de CTU de 32×32. , y aumentó un 28,2% cuando se vio obligado a utilizar un tamaño de CTU de 16×16. Las pruebas demostraron que los tamaños grandes de CTU aumentan la eficiencia de la codificación y al mismo tiempo reducen el tiempo de decodificación. [121]
El perfil principal HEVC (MP) se ha comparado en eficiencia de codificación con H.264/MPEG-4 AVC High Profile (HP), MPEG-4 Advanced Simple Profile (ASP), H.263 High Latency Profile (HLP) y H. Perfil principal .262/MPEG-2 (MP). La codificación de vídeo se realizó para aplicaciones de entretenimiento y se crearon doce velocidades de bits diferentes para las nueve secuencias de prueba de vídeo utilizando un codificador HEVC HM-8.0. De las nueve secuencias de prueba de video, cinco estaban en resolución HD, mientras que cuatro estaban en resolución WVGA (800×480). Las reducciones de la velocidad de bits para HEVC se determinaron en función de PSNR; HEVC tuvo una reducción de la velocidad de bits del 35,4 % en comparación con H.264/MPEG-4 AVC HP, del 63,7 % en comparación con MPEG-4 ASP y del 65,1 % en comparación con H.263 HLP. y 70,8% en comparación con H.262/MPEG-2 MP. [121]
HEVC MP también se ha comparado con H.264/MPEG-4 AVC HP en cuanto a calidad de vídeo subjetiva. La codificación de vídeo se realizó para aplicaciones de entretenimiento y se crearon cuatro velocidades de bits diferentes para nueve secuencias de prueba de vídeo utilizando un codificador HEVC HM-5.0. La evaluación subjetiva se realizó en una fecha anterior a la comparación PSNR, por lo que utilizó una versión anterior del codificador HEVC que tenía un rendimiento ligeramente inferior. Las reducciones de la velocidad de bits se determinaron basándose en una evaluación subjetiva utilizando valores medios de puntuación de opinión . La reducción general subjetiva de la tasa de bits para HEVC MP en comparación con H.264/MPEG-4 AVC HP fue del 49,3 %. [121]
La École Polytechnique Fédérale de Lausanne (EPFL) realizó un estudio para evaluar la calidad de vídeo subjetiva de HEVC en resoluciones superiores a la HDTV. El estudio se realizó con tres vídeos con resoluciones de 3840×1744 a 24 fps, 3840×2048 a 30 fps y 3840×2160 a 30 fps. Las secuencias de vídeo de cinco segundos mostraban personas en una calle, tráfico y una escena de la película animada por computadora de código abierto Sintel . Las secuencias de vídeo se codificaron a cinco velocidades de bits diferentes utilizando el codificador HEVC HM-6.1.1 y el codificador AVC JM-18.3 H.264/MPEG-4. Las reducciones subjetivas de la velocidad de bits se determinaron basándose en una evaluación subjetiva utilizando valores medios de puntuación de opinión. El estudio comparó HEVC MP con H.264/MPEG-4 AVC HP y mostró que, para HEVC MP, la reducción promedio de la tasa de bits basada en PSNR fue del 44,4%, mientras que la reducción promedio de la tasa de bits basada en la calidad de video subjetiva fue del 66,5%. [122] [123] [124] [125]
En una comparación de rendimiento de HEVC publicada en abril de 2013, HEVC MP y Main 10 Profile (M10P) se compararon con H.264/MPEG-4 AVC HP y High 10 Profile (H10P) utilizando secuencias de vídeo de 3840×2160. Las secuencias de vídeo se codificaron utilizando el codificador HM-10.0 HEVC y el codificador JM-18.4 H.264/MPEG-4 AVC. La reducción promedio de la tasa de bits basada en PSNR fue del 45 % para el video entre cuadros .
En una comparación de codificadores de video publicada en diciembre de 2013, se comparó el codificador HEVC HM-10.0 con el codificador x264 (versión r2334) y el codificador VP9 (versión v1.2.0-3088-ga81bd12). La comparación utilizó el método de medición de velocidad de bits de Bjøntegaard-Delta (BD-BR), en el que los valores negativos indican cuánto se reduce la velocidad de bits y los valores positivos indican cuánto aumenta la velocidad de bits para el mismo PSNR. En la comparación, el codificador HEVC HM-10.0 tuvo la mayor eficiencia de codificación y, en promedio, para obtener la misma calidad objetiva, el codificador x264 necesitaba aumentar la velocidad de bits en un 66,4%, mientras que el codificador VP9 necesitaba aumentar la velocidad de bits. en un 79,4%. [126]
En una comparación subjetiva del rendimiento de vídeo publicada en mayo de 2014, JCT-VC comparó el perfil principal HEVC con el perfil alto H.264/MPEG-4 AVC. La comparación utilizó valores medios de puntuación de opinión y fue realizada por la BBC y la Universidad del Oeste de Escocia . Las secuencias de vídeo se codificaron utilizando el codificador HM-12.1 HEVC y el codificador JM-18.5 H.264/MPEG-4 AVC. La comparación utilizó una variedad de resoluciones y la reducción promedio de la tasa de bits para HEVC fue del 59%. La reducción promedio de la tasa de bits para HEVC fue del 52% para 480p, 56% para 720p, 62% para 1080p y 64% para 4K UHD. [127]
En una comparación subjetiva de códecs de vídeo publicada en agosto de 2014 por la EPFL, se comparó el codificador HEVC HM-15.0 con el codificador VP9 1.2.0–5183 y el codificador AVC JM-18.8 H.264/MPEG-4. Se codificaron cuatro secuencias con resoluciones 4K a cinco velocidades de bits diferentes con los codificadores configurados para utilizar un período intra de un segundo. En la comparación, el codificador HEVC HM-15.0 tuvo la mayor eficiencia de codificación y, en promedio, para la misma calidad subjetiva, la velocidad de bits se pudo reducir en un 49,4% en comparación con el codificador VP9 1.2.0–5183, y se pudo reducir. en un 52,6 % en comparación con el codificador JM-18.8 H.264/MPEG-4 AVC. [128] [129] [130]
En agosto de 2016, Netflix publicó los resultados de un estudio a gran escala que comparaba el codificador HEVC de código abierto líder, x265 , con el codificador AVC de código abierto líder, x264 y el codificador VP9 de referencia , libvpx. [131] Utilizando su avanzada herramienta de medición de calidad de video Video Multimethod Assessment Fusion (VMAF), Netflix descubrió que x265 ofrecía una calidad idéntica a velocidades de bits que oscilaban entre un 35,4% y un 53,3% menos que x264, y entre un 17,8% y un 21,8% menos que VP9. [132]
HEVC fue diseñado para mejorar sustancialmente la eficiencia de codificación en comparación con H.264/MPEG-4 AVC HP, es decir, para reducir los requisitos de velocidad de bits a la mitad con una calidad de imagen comparable , a expensas de una mayor complejidad computacional. [13] HEVC fue diseñado con el objetivo de permitir que el contenido de video tenga una relación de compresión de datos de hasta 1000:1. [133] Dependiendo de los requisitos de la aplicación, los codificadores HEVC pueden compensar la complejidad computacional, la tasa de compresión, la solidez a los errores y el tiempo de retraso de codificación. [13] Dos de las características clave en las que se mejoró HEVC en comparación con H.264/MPEG-4 AVC fueron la compatibilidad con vídeo de mayor resolución y métodos de procesamiento paralelo mejorados. [13]
HEVC está dirigido a pantallas HDTV y sistemas de captura de contenido de próxima generación que presentan velocidades de cuadros escaneadas progresivas y resoluciones de pantalla desde QVGA (320×240) a 4320p (7680×4320), así como una calidad de imagen mejorada en términos de nivel de ruido y color . espacios y rango dinámico . [21] [134] [135] [136]
La capa de codificación de vídeo HEVC utiliza el mismo enfoque "híbrido" utilizado en todos los estándares de vídeo modernos, empezando por H.261 , en el sentido de que utiliza predicción entre/intra-imagen y codificación de transformación 2D. [13] Un codificador HEVC primero divide una imagen en regiones en forma de bloque para la primera imagen, o la primera imagen de un punto de acceso aleatorio, que utiliza predicción intraimagen. [13] La predicción dentro de la imagen es cuando la predicción de los bloques en la imagen se basa únicamente en la información de esa imagen. [13] Para todas las demás imágenes, se utiliza la predicción entre imágenes, en la que se utiliza información de predicción de otras imágenes. [13] Una vez finalizados los métodos de predicción y la imagen pasa por los filtros de bucle, la representación final de la imagen se almacena en el búfer de imágenes decodificadas. [13] Las imágenes almacenadas en el búfer de imágenes decodificadas se pueden utilizar para la predicción de otras imágenes. [13]
HEVC se diseñó con la idea de que se utilizaría vídeo de escaneo progresivo y no se agregaron herramientas de codificación específicamente para vídeo entrelazado . [13] Las herramientas de codificación específicas de entrelazado, como MBAFF y PAFF, no son compatibles con HEVC. [137] En cambio, HEVC envía metadatos que indican cómo se envió el video entrelazado. [13] El vídeo entrelazado puede enviarse codificando cada cuadro como una imagen independiente o codificando cada campo como una imagen independiente. [13] Para video entrelazado, HEVC puede cambiar entre codificación de cuadro y codificación de campo utilizando el campo de cuadro adaptativo de secuencia (SAFF), que permite cambiar el modo de codificación para cada secuencia de video. [138] Esto permite enviar vídeo entrelazado con HEVC sin necesidad de agregar procesos especiales de decodificación entrelazada a los decodificadores HEVC. [13]
El estándar HEVC admite espacios de color como películas genéricas, NTSC , PAL , Rec. 601 , Rec. 709 , Rec. 2020 , Rec. 2100 , SMPTE 170M, SMPTE 240M, sRGB , sYCC , xvYCC , XYZ y espacios de color especificados externamente. [24] HEVC admite representaciones de codificación de colores como RGB , YCbCr y YCoCg . [24]
HEVC reemplaza los macrobloques de 16 × 16 píxeles , que se usaban con estándares anteriores, con unidades de árbol de codificación (CTU) que pueden usar estructuras de bloques más grandes de hasta 64 × 64 muestras y pueden subdividir mejor la imagen en estructuras de tamaño variable. [13] [139] HEVC inicialmente divide la imagen en CTU que pueden ser 64 × 64, 32 × 32 o 16 × 16 con un tamaño de bloque de píxeles más grande que generalmente aumenta la eficiencia de codificación. [13]
HEVC especifica cuatro tamaños de unidades de transformación (TU) de 4 × 4, 8 × 8, 16 × 16 y 32 × 32 para codificar el residual de predicción. [13] Un CTB puede dividirse recursivamente en 4 o más TU. [13] Las TU utilizan funciones de base entera basadas en la transformada de coseno discreto (DCT). [13] [2] Además, los bloques de transformación luma 4 × 4 que pertenecen a una región intracodificada se transforman utilizando una transformación entera que se deriva de la transformación sinusoidal discreta (DST). [13] Esto proporciona una reducción de la tasa de bits del 1%, pero se limitó a bloques de transformación luma 4×4 debido a beneficios marginales para los otros casos de transformación. [13] Chroma usa los mismos tamaños de TU que luma, por lo que no hay transformación 2×2 para croma. [13]
HEVC utiliza un algoritmo de codificación aritmética binaria adaptativa al contexto (CABAC) que es fundamentalmente similar a CABAC en H.264/MPEG-4 AVC. [13] CABAC es el único método de codificación de entropía permitido en HEVC, mientras que hay dos métodos de codificación de entropía permitidos en H.264/MPEG-4 AVC. [13] CABAC y la codificación de entropía de los coeficientes de transformación en HEVC se diseñaron para un mayor rendimiento que H.264/MPEG-4 AVC, [140] manteniendo al mismo tiempo una mayor eficiencia de compresión para tamaños de bloques de transformación más grandes en relación con extensiones simples. [141] Por ejemplo, el número de contenedores codificados por contexto se ha reducido en 8 veces y el modo de derivación CABAC se ha mejorado en términos de su diseño para aumentar el rendimiento. [13] [140] [142] Otra mejora con HEVC es que las dependencias entre los datos codificados se han cambiado para aumentar aún más el rendimiento. [13] [140] El modelado de contexto en HEVC también se ha mejorado para que CABAC pueda seleccionar mejor un contexto que aumente la eficiencia en comparación con H.264/MPEG-4 AVC. [13]
HEVC especifica 33 modos direccionales para predicción intra en comparación con los 8 modos direccionales para predicción intra especificados por H.264/MPEG-4 AVC. [13] HEVC también especifica los modos de intrapredicción DC y predicción planar. [13] El modo de intra predicción de CC genera un valor medio promediando muestras de referencia y se puede utilizar para superficies planas. [13] El modo de predicción planar en HEVC admite todos los tamaños de bloque definidos en HEVC, mientras que el modo de predicción planar en H.264/MPEG-4 AVC está limitado a un tamaño de bloque de 16×16 píxeles. [13] Los modos de intra predicción utilizan datos de bloques de predicción vecinos que han sido previamente decodificados dentro de la misma imagen. [13]
Para la interpolación de posiciones de muestra de luma fraccionaria, HEVC utiliza una aplicación separable de interpolación unidimensional de media muestra con un filtro de 8 tomas o interpolación de un cuarto de muestra con un filtro de 7 tomas mientras, en comparación, H.264/MPEG-4 AVC utiliza un proceso de dos etapas que primero deriva valores en posiciones de media muestra usando una interpolación unidimensional separable de 6 toques seguida de redondeo de enteros y luego aplica una interpolación lineal entre valores en posiciones de media muestra cercanas para generar valores en posiciones de un cuarto de muestra. [13] HEVC ha mejorado la precisión debido al filtro de interpolación más largo y la eliminación del error de redondeo intermedio. [13] Para vídeo 4:2:0, las muestras de croma se interpolan con un filtrado unidimensional separable de 4 toques para generar una precisión de octava muestra, mientras que en comparación H.264/MPEG-4 AVC utiliza solo un filtrado bilineal de 2 toques. filtro (también con precisión de octava muestra). [13]
Al igual que en H.264/MPEG-4 AVC, la predicción ponderada en HEVC se puede utilizar con unipredicción (en la que se utiliza un único valor de predicción) o bipredicción (en la que se combinan los valores de predicción de dos bloques de predicción). . [13]
HEVC define un rango de 16 bits con signo para vectores de movimiento (MV) tanto horizontales como verticales. [24] [143] [144] [145] Esto se agregó a HEVC en la reunión de HEVC de julio de 2012 con las variables mvLX. [24] [143] [144] [145] Los MV horizontales/verticales de HEVC tienen un rango de −32768 a 32767, lo que, dada la precisión de un cuarto de píxel utilizada por HEVC, permite un rango de MV de −8192 a 8191,75 muestras de luma. [24] [143] [144] [145] Esto se compara con H.264/MPEG-4 AVC, que permite un rango de MV horizontal de −2048 a 2047,75 muestras de luma y un rango de MV vertical de −512 a 511,75 muestras de luma. [144]
HEVC permite dos modos MV que son Predicción avanzada de vectores de movimiento (AMVP) y modo de fusión. [13] AMVP utiliza datos de la imagen de referencia y también puede utilizar datos de bloques de predicción adyacentes. [13] El modo de fusión permite que los MV se hereden de bloques de predicción vecinos. [13] El modo de fusión en HEVC es similar a los modos de inferencia de movimiento "omitido" y "directo" en H.264/MPEG-4 AVC, pero con dos mejoras. [13] La primera mejora es que HEVC utiliza información de índice para seleccionar uno de varios candidatos disponibles. [13] La segunda mejora es que HEVC utiliza información de la lista de imágenes de referencia y el índice de imágenes de referencia. [13]
HEVC especifica dos filtros de bucle que se aplican secuencialmente: el filtro de desbloqueo (DBF) se aplica primero y el filtro de compensación adaptativa de muestra (SAO) se aplica después. [13] Ambos filtros de bucle se aplican en el bucle de predicción entre imágenes, es decir, la imagen filtrada se almacena en el buffer de imágenes decodificadas (DPB) como referencia para la predicción entre imágenes. [13]
El DBF es similar al utilizado por H.264/MPEG-4 AVC pero con un diseño más simple y mejor soporte para procesamiento paralelo. [13] En HEVC, el DBF solo se aplica a una cuadrícula de muestra de 8×8, mientras que con H.264/MPEG-4 AVC el DBF se aplica a una cuadrícula de muestra de 4×4. [13] DBF utiliza una cuadrícula de muestra de 8 × 8, ya que no causa ninguna degradación notable y mejora significativamente el procesamiento paralelo porque el DBF ya no causa interacciones en cascada con otras operaciones. [13] Otro cambio es que HEVC solo permite tres intensidades de DBF de 0 a 2. [13] HEVC también requiere que DBF primero aplique filtrado horizontal para bordes verticales a la imagen y solo después aplique filtrado vertical para bordes horizontales. a la imagen. [13] Esto permite el uso de múltiples subprocesos paralelos para el DBF. [13]
El filtro SAO se aplica después del DBF y está diseñado para permitir una mejor reconstrucción de las amplitudes de la señal original mediante la aplicación de compensaciones almacenadas en una tabla de búsqueda en el flujo de bits. [13] [146] Por CTB, el filtro SAO se puede desactivar o aplicar en uno de dos modos: modo de compensación de borde o modo de compensación de banda. [13] [146] El modo de compensación de borde opera comparando el valor de una muestra con dos de sus ocho vecinos usando uno de los cuatro patrones de gradiente direccionales. [13] [146] Basado en una comparación con estos dos vecinos, la muestra se clasifica en una de cinco categorías: mínimo, máximo, un borde con la muestra que tiene el valor más bajo, un borde con la muestra que tiene el valor más alto, o monótono. [13] [146] Para cada una de las primeras cuatro categorías se aplica una compensación. [13] [146] El modo de compensación de banda aplica una compensación basada en la amplitud de una sola muestra. [13] [146] Una muestra se clasifica por su amplitud en una de 32 bandas ( contenedores de histograma ). [13] [146] Se especifican compensaciones para cuatro bandas consecutivas de las 32, porque en áreas planas que son propensas a artefactos de bandas, las amplitudes de las muestras tienden a agruparse en un rango pequeño. [13] [146] El filtro SAO fue diseñado para aumentar la calidad de la imagen, reducir los artefactos de bandas y reducir los artefactos de timbre . [13] [146]
Las extensiones de rango en MPEG son perfiles, niveles y técnicas adicionales que respaldan necesidades más allá de la reproducción de video para el consumidor: [24]
Dentro de estos nuevos perfiles se incluyen funciones de codificación mejoradas, muchas de las cuales admiten codificación de pantalla eficiente o procesamiento de alta velocidad:
La versión 2 de HEVC agrega varios mensajes de información de mejora suplementaria (SEI):
Se agregaron opciones adicionales de herramientas de codificación en el borrador de marzo de 2016 de las extensiones de codificación de contenido de pantalla (SCC): [150]
La versión ITU-T del estándar que agregó las extensiones SCC (aprobada en diciembre de 2016 y publicada en marzo de 2017) agregó soporte para la función de transferencia híbrida log-gamma (HLG) y la matriz de color ICtCp . [65] Esto permite que la cuarta versión de HEVC admita ambas funciones de transferencia HDR definidas en la Rec. 2100 . [65]
La cuarta versión de HEVC agrega varios mensajes de información de mejora suplementaria (SEI) que incluyen:
La versión 1 del estándar HEVC define tres perfiles: Principal , Principal 10 y Imagen fija principal . [24] La versión 2 de HEVC agrega 21 perfiles de extensiones de rango, dos perfiles de extensiones escalables y un perfil de vista múltiple. [24] HEVC también contiene disposiciones para perfiles adicionales. [24] Las extensiones que se agregaron a HEVC incluyen mayor profundidad de bits , muestreo de croma 4:2:2/4:4:4 , codificación de video multivista (MVC) y codificación de video escalable (SVC). [13] [153] Las extensiones de rango HEVC, las extensiones escalables HEVC y las extensiones multivista HEVC se completaron en julio de 2014. [154] [155] [156] En julio de 2014 se publicó un borrador de la segunda versión de HEVC. [154] Se estaban desarrollando extensiones de codificación de contenido de pantalla (SCC) para video de contenido de pantalla, que contiene texto y gráficos, con una fecha de lanzamiento del borrador final prevista para 2015. [157] [158]
Un perfil es un conjunto definido de herramientas de codificación que se pueden utilizar para crear un flujo de bits que se ajuste a ese perfil. [13] Un codificador para un perfil puede elegir qué herramientas de codificación usar siempre que genere un flujo de bits conforme, mientras que un decodificador para un perfil debe admitir todas las herramientas de codificación que se pueden usar en ese perfil. [13]
El perfil principal permite una profundidad de bits de 8 bits por muestra con muestreo cromático 4:2:0, que es el tipo de vídeo más común utilizado con dispositivos de consumo. [13] [24] [155]
El perfil Main 10 ( Main10
) se agregó en la reunión HEVC de octubre de 2012 según la propuesta JCTVC-K0109 que proponía agregar un perfil de 10 bits a HEVC para aplicaciones de consumo. La propuesta decía que esto era para permitir una mejor calidad de video y respaldar la Rec. 2020 que se ha utilizado ampliamente en sistemas UHDTV y para poder ofrecer un mayor rango dinámico y fidelidad de color evitando los artefactos de bandas. Una variedad de empresas apoyaron la propuesta, entre las que se encontraban Ateme , BBC , BSkyB , Cisco , DirecTV , Ericsson , Motorola Mobility , NGCodec, NHK , RAI , ST, SVT , Thomson Video Networks , Technicolor y ViXS Systems . [159] El perfil Main 10 permite una profundidad de bits de 8 a 10 bits por muestra con muestreo de croma 4:2:0. Los decodificadores HEVC que se ajustan al perfil Principal 10 deben ser capaces de decodificar flujos de bits elaborados con los siguientes perfiles: Principal y Principal 10. [24] Una mayor profundidad de bits permite una mayor cantidad de colores. 8 bits por muestra permiten 256 tonos por color primario (un total de 16,78 millones de colores), mientras que 10 bits por muestra permiten 1024 tonos por color primario (un total de 1,07 mil millones de colores). Una mayor profundidad de bits permite una transición de color más suave, lo que resuelve el problema conocido como bandas de color . [160] [161]
El perfil Principal 10 permite una calidad de video mejorada, ya que puede admitir video con una profundidad de bits mayor que la que admite el perfil Principal. [159] Además, en el perfil Principal 10 el vídeo de 8 bits se puede codificar con una mayor profundidad de bits de 10 bits, lo que permite una mayor eficiencia de codificación en comparación con el perfil Principal. [162] [163] [164]
Ericsson dijo que el perfil Main 10 traería los beneficios de 10 bits por vídeo de muestra a la televisión de consumo. También dijeron que para resoluciones más altas no hay penalización en la velocidad de bits por codificar vídeo a 10 bits por muestra. [160] Imagination Technologies dijo que 10 bits por vídeo de muestra permitirían espacios de color más grandes y son necesarios para la Rec. Espacio de color 2020 que utilizará UHDTV. También dijeron que el Rec. El espacio de color de 2020 impulsaría la adopción generalizada de vídeo de 10 bits por muestra. [161] [165]
En una comparación de rendimiento basada en PSNR publicada en abril de 2013, se comparó el perfil Main 10 con el perfil Main utilizando un conjunto de secuencias de vídeo de 3840 × 2160 de 10 bits. Las secuencias de vídeo de 10 bits se convirtieron a 8 bits para el perfil Principal y permanecieron en 10 bits para el perfil Principal 10. El PSNR de referencia se basó en las secuencias de vídeo originales de 10 bits. En la comparación de rendimiento, el perfil Principal 10 proporcionó una reducción de la velocidad de bits del 5 % para la codificación de vídeo entre cuadros en comparación con el perfil Principal. La comparación de rendimiento indica que para las secuencias de vídeo probadas, el perfil Main 10 superó al perfil Main. [166]
El perfil Imagen fija principal ( MainStillPicture
) permite codificar una sola imagen fija con las mismas restricciones que el perfil Principal. Como subconjunto del perfil principal, el perfil de imagen fija principal permite una profundidad de bits de 8 bits por muestra con muestreo de croma 4:2:0. [13] [24] [155] En abril de 2012 se realizó una comparación objetiva de rendimiento en la que HEVC redujo la velocidad de bits promedio de las imágenes en un 56 % en comparación con JPEG . [168] En mayo de 2012 se realizó una comparación de rendimiento basada en PSNR para la compresión de imágenes fijas utilizando el codificador HEVC HM 6.0 y los codificadores de software de referencia para los otros estándares. Para imágenes fijas, HEVC redujo la tasa de bits promedio en un 15,8% en comparación con H.264/MPEG-4 AVC, un 22,6% en comparación con JPEG 2000 , un 30,0% en comparación con JPEG XR , un 31,0% en comparación con WebP y un 43,0% en comparación con JPEG. [169]
En enero de 2013 se realizó una comparación de rendimiento para la compresión de imágenes fijas utilizando el codificador HEVC HM 8.0rc2, Kakadu versión 6.0 para JPEG 2000 e IJG versión 6b para JPEG. La comparación de rendimiento utilizó PSNR para la evaluación objetiva y valores de puntuación de opinión media (MOS) para la evaluación subjetiva. La evaluación subjetiva utilizó la misma metodología de prueba e imágenes que las utilizadas por el comité JPEG cuando evaluó JPEG XR. Para imágenes muestreadas con croma 4:2:0, la reducción promedio de la velocidad de bits para HEVC en comparación con JPEG 2000 fue del 20,26 % para PSNR y del 30,96 % para MOS, mientras que en comparación con JPEG fue del 61,63 % para PSNR y del 43,10 % para MOS. [167]
Nokia realizó en abril de 2013 una comparación de rendimiento HEVC basada en PSNR para la compresión de imágenes fijas . HEVC tiene una mayor mejora de rendimiento para imágenes de mayor resolución que para imágenes de menor resolución y una mayor mejora de rendimiento para velocidades de bits más bajas que para velocidades de bits más altas. Para que la compresión con pérdida obtenga el mismo PSNR que HEVC, se necesitaron en promedio 1,4 veces más bits con JPEG 2000, 1,6 veces más bits con JPEG-XR y 2,3 veces más bits con JPEG. [170]
Mozilla realizó un estudio de eficiencia de compresión de HEVC, JPEG, JPEG XR y WebP en octubre de 2013 . El estudio demostró que HEVC era significativamente mejor en compresión que los otros formatos de imagen que se probaron. En el estudio se utilizaron cuatro métodos diferentes para comparar la calidad de la imagen: Y-SSIM, RGB-SSIM, IW-SSIM y PSNR-HVS-M. [171] [172]
La versión 2 de HEVC agrega 21 perfiles de extensiones de rango, dos perfiles de extensiones escalables y un perfil de vista múltiple: Monocromo , Monocromo 12 , Monocromo 16 , Principal 12 , Principal 4:2:2 10 , Principal 4:2:2 12 , Principal 4:4:4 , Principal 4:4:4 10 , Principal 4:4:4 12 , Monocromo 12 Intra , Monocromo 16 Intra , Principal 12 Intra , Principal 4:2:2 10 Intra , Principal 4:2:2 12 Intra , Principal 4:4:4 Intra , Principal 4:4:4 10 Intra , Principal 4:4:4 12 Intra , Principal 4:4:4 16 Intra , Principal 4:4:4 Fotografía , Principal 4:4 :4 16 Imagen fija , Alto rendimiento 4:4:4 16 Intra , Principal escalable , Principal escalable 10 y Principal multivista . [24] [173] Todos los perfiles de extensiones de rango entre marcos tienen un perfil Intra. [24]
HbrFactor
12 veces mayor que otros perfiles HEVC, lo que le permite tener una velocidad de bits máxima 12 veces mayor que el perfil Intra principal 4:4:4 16. [24] [174] El perfil intra de alto rendimiento 4:4:4 16 está diseñado para la creación de contenido profesional de alto nivel y no se requieren decodificadores para este perfil para admitir otros perfiles. [174]La versión 3 de HEVC agregó un perfil 3D: 3D Main . El borrador de febrero de 2016 de las extensiones de codificación de contenido de pantalla agregó siete perfiles de extensiones de codificación de contenido de pantalla, tres perfiles de extensiones de alto rendimiento y cuatro perfiles de extensiones escalables: Screen-Extended Main , Screen-Extended Main 10 , Screen-Extended Main 4:4:4 , Pantalla principal extendida 4:4:4 10 , Pantalla extendida de alto rendimiento 4:4:4 , Pantalla extendida de alto rendimiento 4:4:4 10 , Pantalla extendida de alto rendimiento 4:4:4 14 , Alto rendimiento 4 :4:4 , Alto rendimiento 4:4:4 10 , Alto rendimiento 4:4:4 14 , Monocromo escalable , Monocromo escalable 12 , Monocromo escalable 16 y Principal escalable 4:4:4 . [24] [150]
El estándar HEVC define dos niveles, Principal y Alto, y trece niveles. Un nivel es un conjunto de restricciones para un flujo de bits. Para niveles inferiores al nivel 4, solo se permite el nivel Principal. El nivel principal es un nivel inferior al nivel alto. Los niveles se crearon para abordar aplicaciones que difieren en términos de su velocidad de bits máxima. El nivel principal se diseñó para la mayoría de las aplicaciones, mientras que el nivel alto se diseñó para aplicaciones muy exigentes. Se requiere que un decodificador que se ajuste a un nivel/nivel determinado sea capaz de decodificar todos los flujos de bits codificados para ese nivel/nivel y para todos los niveles/niveles inferiores. [13] [24]
Las imágenes previamente decodificadas se almacenan en un búfer de imágenes decodificadas (DPB) y los codificadores HEVC las utilizan para formar predicciones para imágenes posteriores. La cantidad máxima de imágenes que se pueden almacenar en el DPB, denominada capacidad de DPB, es 6 (incluida la imagen actual) para todos los niveles HEVC cuando se opera con el tamaño de imagen máximo admitido por el nivel. La capacidad DPB (en unidades de imágenes) aumenta de 6 a 8, 12 o 16 a medida que el tamaño de la imagen disminuye desde el tamaño máximo de imagen admitido por el nivel. El codificador selecciona qué imágenes específicas se retienen en el DPB imagen por imagen, de modo que el codificador tiene la flexibilidad de determinar por sí mismo la mejor manera de utilizar la capacidad del DPB al codificar el contenido de vídeo. [24]
MPEG ha publicado una enmienda que agregó compatibilidad con HEVC al flujo de transporte MPEG utilizado por ATSC , DVB y Blu-ray Disc ; MPEG decidió no actualizar la transmisión del programa MPEG utilizado por DVD-Video . [175] [176] MPEG también ha agregado compatibilidad con HEVC al formato de archivo multimedia base ISO . [177] [178] HEVC también es compatible con el estándar de transporte de medios MPEG . [175] [179] Se agregó soporte para HEVC a Matroska a partir del lanzamiento de MKVToolNix v6.8.0 después de que se fusionó un parche de DivX. [180] [181] Se envió un borrador de documento al Grupo de trabajo de ingeniería de Internet que describe un método para agregar soporte HEVC al protocolo de transporte en tiempo real . [182]
Utilizando la codificación intracuadro de HEVC, el programador Fabrice Bellard ha propuesto un formato codificado de imágenes fijas llamado Better Portable Graphics (BPG) . [183] Es esencialmente un contenedor para imágenes codificadas utilizando el perfil HEVC Main 4:4:4 16 Still Picture con hasta 14 bits por muestra, aunque utiliza una sintaxis de encabezado abreviada y agrega soporte explícito para perfiles Exif , ICC y Metadatos XMP . [183] [184]
Términos y tarifas de licencia para patentes HEVC, en comparación con sus principales competidores:
Al igual que su predecesor AVC, los distribuidores de software que implementan HEVC en sus productos deben pagar un precio por copia distribuida. [i] Si bien este modelo de licencia es manejable para el software pago, es un obstáculo para la mayoría del software gratuito y de código abierto , que debe distribuirse libremente. En opinión de MulticoreWare , el desarrollador de x265 , permitir codificadores y decodificadores de software libres de regalías redunda en el interés de acelerar la adopción de HEVC. [191] [195] [196] HEVC Advance hizo una excepción que renuncia específicamente a las regalías sobre implementaciones de software únicamente (tanto decodificadores como codificadores) cuando no están incluidas con el hardware. [197] Sin embargo, el software exento no está libre de las obligaciones de concesión de licencias de otros titulares de patentes (por ejemplo, miembros del grupo MPEG LA).
Si bien el obstáculo al software libre no es motivo de preocupación, por ejemplo en las cadenas de televisión, este problema, combinado con la perspectiva de un futuro bloqueo colectivo en el formato, hace que varias organizaciones como Mozilla (ver OpenH264 ) y la Free Software Foundation Europe [198 ] desconfía de los formatos que generan regalías para su uso en Internet. Los formatos de la competencia destinados al uso de Internet (VP9 y AV1) pretenden evitar estas preocupaciones al estar libres de regalías (siempre que no haya reclamaciones de derechos de patente de terceros).
^i : Independientemente de cómo los autores del software obtengan la licencia del software (ver licencias de software ), si lo que hace está patentado, su uso permanece sujeto a los derechos de los titulares de las patentes a menos que el uso de las patentes haya sido autorizado mediante una licencia.
En octubre de 2015, MPEG y VCEG formaron el Joint Video Exploration Team (JVET) [199] para evaluar las tecnologías de compresión disponibles y estudiar los requisitos para un estándar de compresión de vídeo de próxima generación. El nuevo algoritmo debería tener una tasa de compresión entre un 30% y un 50% mejor para la misma calidad de percepción, con soporte para compresión sin pérdidas y subjetivamente sin pérdidas. También debería admitir YCbCr 4:4:4, 4:2:2 y 4:2:0 con 10 a 16 bits por componente, amplia gama de colores BT.2100 y alto rango dinámico (HDR) de más de 16 pasos (con brillo máximo de 1.000, 4.000 y 10.000 nits), canales auxiliares (para profundidad, transparencia, etc.), velocidades de fotogramas variables y fraccionarias de 0 a 120 Hz, codificación de vídeo escalable para temporal (velocidad de fotogramas), espacial (resolución), SNR , diferencias de gama de colores y rango dinámico, codificación estéreo/multivisión, formatos panorámicos y codificación de imágenes fijas. Se espera una complejidad de codificación 10 veces mayor que la de HEVC. JVET emitió una "Convocatoria de propuestas" final en octubre de 2017, y el primer borrador de trabajo del estándar Versatile Video Coding (VVC) se publicó en abril de 2018. [200] [201] El estándar VVC se finalizó el 6 de julio de 2020. [ 202]
{{cite web}}
: CS1 maint: multiple names: authors list (link){{cite web}}
: CS1 maint: multiple names: authors list (link)Como no lo han hecho, muchos productores suponen que el pool impondrá regalías por el contenido.
Varias empresas importantes con patentes HEVC aún no se han unido a ninguno de los consorcios de patentes. (…) Para acelerar la adopción de HEVC, propongo que los licenciantes de patentes de HEVC acepten los siguientes principios; · El software de decodificación en dispositivos de consumo debe estar libre de regalías. · La codificación de software en dispositivos de consumo debe estar libre de regalías. · La distribución del contenido debe ser libre de regalías.
Las transformaciones son idénticas a H.265/HEVC (Cisco IPR)