High Efficiency Video Coding ( HEVC ), también conocido como H.265 y MPEG-H Part 2 , es un estándar de compresión de vídeo diseñado como parte del proyecto MPEG-H como sucesor del ampliamente utilizado Advanced Video Coding (AVC, H.264 o MPEG-4 Part 10). En comparación con AVC, HEVC ofrece entre un 25% y un 50% mejor compresión de datos con el mismo nivel de calidad de vídeo , o una calidad de vídeo sustancialmente mejorada con la misma tasa de bits . Admite resoluciones de hasta 8192×4320, incluido 8K UHD , y a diferencia del AVC principalmente de 8 bits, el perfil Main 10 de mayor fidelidad de HEVC se ha incorporado a casi todo el hardware compatible.
Mientras que AVC utiliza la transformada discreta del coseno (DCT) con tamaños de bloque de 4×4 y 8×8, HEVC utiliza tanto la DCT entera como la transformada discreta del seno (DST) con tamaños de bloque variados entre 4×4 y 32×32. El formato de imagen de alta eficiencia (HEIF) se basa en HEVC. [2]
En la mayoría de los aspectos, HEVC es una extensión de los conceptos de H.264/MPEG-4 AVC. Ambos funcionan comparando diferentes partes de un fotograma de vídeo para encontrar áreas que son redundantes, tanto dentro de un único fotograma como entre fotogramas consecutivos. Estas áreas redundantes se sustituyen por una breve descripción en lugar de los píxeles originales. Los principales cambios de HEVC incluyen la ampliación de las áreas de comparación de patrones y codificación de diferencias de 16×16 píxeles a tamaños de hasta 64×64, una segmentación de tamaño de bloque variable mejorada , una predicción "intra" mejorada dentro de la misma imagen, una predicción de vector de movimiento mejorada y una fusión de regiones de movimiento, un filtrado de compensación de movimiento mejorado y un paso de filtrado adicional denominado filtrado de desplazamiento adaptativo de muestra. El uso eficaz de estas mejoras requiere una capacidad de procesamiento de señal mucho mayor para comprimir el vídeo, pero tiene un menor impacto en la cantidad de cálculo necesario para la descompresión.
HEVC fue estandarizado por el Equipo de Colaboración Conjunta sobre Codificación de Vídeo (JCT-VC), una colaboración entre el Grupo de Estudio 16 VCEG de ISO / IEC y el Grupo de Estudio 16 de la UIT-T . El grupo ISO/IEC se refiere a él como MPEG-H Parte 2 y el UIT-T como H.265. La primera versión del estándar HEVC fue ratificada en enero de 2013 y publicada en junio de 2013. La segunda versión, con extensiones multivista (MV-HEVC), extensiones de rango (RExt) y extensiones de escalabilidad (SHVC), se completó y aprobó en 2014 y se publicó a principios de 2015. Las extensiones para vídeo 3D (3D-HEVC) se completaron a principios de 2015, y las extensiones para codificación de contenido de pantalla (SCC) se completaron a principios de 2016 y se publicaron a principios de 2017, cubriendo vídeo que contiene gráficos, texto o animación renderizados así como (o en lugar de) escenas de vídeo capturadas por cámara. En octubre de 2017, el estándar fue reconocido con un premio Primetime Emmy Engineering por haber tenido un efecto material en la tecnología de la televisión. [3] [4] [5] [6] [7]
HEVC contiene tecnologías protegidas por patentes propiedad de las organizaciones que participaron en el JCT-VC. La implementación de un dispositivo o una aplicación de software que utilice HEVC puede requerir una licencia de los titulares de patentes de HEVC. La ISO/IEC y la UIT exigen a las empresas que pertenecen a sus organizaciones que ofrezcan sus patentes en condiciones de licencia razonables y no discriminatorias (RAND). Las licencias de patentes se pueden obtener directamente de cada titular de patente o a través de organismos de licencias de patentes, como MPEG LA , Access Advance y Velos Media.
Las tarifas de licencia combinadas que ofrecen actualmente todos los organismos de licencias de patentes son más altas que las de AVC. Las tarifas de licencia son una de las principales razones por las que la adopción de HEVC ha sido baja en la web y es la razón por la que algunas de las empresas de tecnología más grandes ( Amazon , AMD , Apple , ARM , Cisco , Google , Intel , Microsoft , Mozilla , Netflix , Nvidia y más) se han unido a la Alliance for Open Media [8] , que finalizó el formato de codificación de video alternativo libre de regalías AV1 el 28 de marzo de 2018. [9]
El formato HEVC fue desarrollado conjuntamente por más de una docena de organizaciones en todo el mundo. La mayoría de las contribuciones de patentes activas para el desarrollo del formato HEVC provinieron de cinco organizaciones: Samsung Electronics (4249 patentes), General Electric (1127 patentes), [10] M&K Holdings (907 patentes), NTT (878 patentes) y JVC Kenwood (628 patentes). [11] Otros titulares de patentes incluyen a Fujitsu , Apple , Canon , Columbia University , KAIST , Kwangwoon University , MIT , Sungkyunkwan University , Funai , Hikvision , KBS , KT y NEC . [12]
En 2004, el Grupo de expertos en codificación de vídeo (VCEG) de la UIT-T inició un importante estudio de los avances tecnológicos que podrían permitir la creación de un nuevo estándar de compresión de vídeo (o mejoras sustanciales orientadas a la compresión del estándar H.264/MPEG-4 AVC ). [13] En octubre de 2004, se estudiaron diversas técnicas para la posible mejora del estándar H.264/MPEG-4 AVC. En enero de 2005, en la siguiente reunión del VCEG, el VCEG comenzó a designar determinados temas como "áreas técnicas clave" (KTA) para su posterior investigación. Se estableció una base de código de software denominada base de código KTA para evaluar dichas propuestas. [14] El software KTA se basó en el software de referencia Joint Model (JM) desarrollado por el equipo de vídeo conjunto MPEG & VCEG para H.264/MPEG-4 AVC. Se integraron tecnologías propuestas adicionales en el software KTA y se probaron en evaluaciones experimentales durante los cuatro años siguientes. [15] [13] [16] [17]
Se consideraron dos enfoques para estandarizar la tecnología de compresión mejorada: crear un nuevo estándar o crear extensiones de H.264/MPEG-4 AVC. El proyecto tuvo nombres provisionales H.265 y H.NGVC (Next-generation Video Coding), y fue una parte importante del trabajo de VCEG hasta que evolucionó al proyecto conjunto HEVC con MPEG en 2010. [18] [19] [20]
Los requisitos preliminares para NGVC eran la capacidad de tener una reducción de la tasa de bits del 50% con la misma calidad de imagen subjetiva en comparación con el perfil alto H.264/MPEG-4 AVC, y una complejidad computacional que oscila entre 1/2 y 3 veces la del perfil alto. [20] NGVC podría proporcionar una reducción de la tasa de bits del 25% junto con una reducción del 50% en la complejidad con la misma calidad de video percibida que el perfil alto, o proporcionar una mayor reducción de la tasa de bits con una complejidad algo mayor. [20] [21]
El grupo de expertos en imágenes en movimiento ISO / IEC (MPEG) inició un proyecto similar en 2007, denominado provisionalmente Codificación de vídeo de alto rendimiento . [22] [23] En julio de 2007 se había decidido que el objetivo del proyecto era conseguir una reducción de la tasa de bits del 50 %. [22] Las primeras evaluaciones se realizaron con modificaciones del codificador de software de referencia KTA desarrollado por VCEG. [13] En julio de 2009, los resultados experimentales mostraron una reducción de bits media de alrededor del 20% en comparación con AVC High Profile; estos resultados impulsaron a MPEG a iniciar su esfuerzo de estandarización en colaboración con VCEG. [23]
MPEG y VCEG establecieron un Equipo de colaboración conjunto sobre codificación de video ( JCT-VC ) para desarrollar el estándar HEVC. [13] [24] [25] [26]
En enero de 2010, VCEG y MPEG publicaron una convocatoria formal conjunta de propuestas sobre tecnología de compresión de vídeo, y las propuestas se evaluaron en la primera reunión del Equipo de colaboración conjunto de MPEG y VCEG sobre codificación de vídeo (JCT-VC), que tuvo lugar en abril de 2010. Se presentaron 27 propuestas completas. [18] [27] Las evaluaciones mostraron que algunas propuestas podían alcanzar la misma calidad visual que AVC con solo la mitad de la tasa de bits en muchos de los casos de prueba, a costa de un aumento de 2 a 10 veces en la complejidad computacional, y algunas propuestas lograron buenos resultados de calidad subjetiva y tasa de bits con una complejidad computacional menor que las codificaciones de alto perfil AVC de referencia. En esa reunión, se adoptó el nombre de codificación de vídeo de alta eficiencia (HEVC) para el proyecto conjunto. [13] [18] A partir de esa reunión, el JCT-VC integró características de algunas de las mejores propuestas en una única base de código de software y un "modelo de prueba bajo consideración", y realizó más experimentos para evaluar varias características propuestas. [13] [28] El primer borrador de trabajo de la especificación de HEVC se elaboró en la tercera reunión de JCT-VC en octubre de 2010. En reuniones posteriores de JCT-VC se realizaron muchos cambios en las herramientas de codificación y la configuración de HEVC. [13]
El 25 de enero de 2013, la UIT anunció que HEVC había recibido la aprobación de primera etapa (consentimiento) en el Proceso de Aprobación Alternativa (AAP) de la UIT-T . [29] [30] [31] El mismo día, MPEG anunció que HEVC había sido promovido al estado de Borrador Final de Norma Internacional (FDIS) en el proceso de estandarización MPEG . [32] [33]
El 13 de abril de 2013, HEVC/H.265 fue aprobado como estándar ITU-T. [34] [35] [36] El estándar fue publicado formalmente por ITU-T el 7 de junio de 2013 y por ISO/IEC el 25 de noviembre de 2013. [24] [17]
El 11 de julio de 2014, MPEG anunció que la segunda edición de HEVC contendrá tres extensiones recientemente completadas que son las extensiones de vista múltiple (MV-HEVC), las extensiones de rango (RExt) y las extensiones de escalabilidad (SHVC). [37]
El 29 de octubre de 2014, la versión 2 de HEVC/H.265 fue aprobada como estándar ITU-T. [38] [39] [40] Luego se publicó formalmente el 12 de enero de 2015. [24]
El 29 de abril de 2015, la versión 3 de HEVC/H.265 fue aprobada como estándar ITU-T. [41] [42] [43]
El 3 de junio de 2016, la versión 4 de HEVC/H.265 recibió el consentimiento de la UIT-T y no fue aprobada durante una votación en octubre de 2016. [44] [45]
El 22 de diciembre de 2016, la versión 4 de HEVC/H.265 fue aprobada como estándar ITU-T. [46] [47]
El 29 de septiembre de 2014, MPEG LA anunció su licencia HEVC que cubre las patentes esenciales de 23 empresas. [48] Los primeros 100.000 "dispositivos" (que incluyen implementaciones de software) están libres de regalías, y después de eso la tarifa es de $0,20 por dispositivo hasta un límite anual de $25 millones. [49] Esto es significativamente más caro que las tarifas de AVC, que eran de $0,10 por dispositivo, con la misma exención de 100.000 y un límite anual de $6,5 millones. MPEG LA no cobra ninguna tarifa por el contenido en sí, algo que habían intentado cuando inicialmente otorgaron la licencia de AVC, pero que posteriormente abandonaron cuando los productores de contenido se negaron a pagarla. [50] La licencia se ha ampliado para incluir los perfiles en la versión 2 del estándar HEVC. [51]
Cuando se anunciaron los términos de MPEG LA, los comentaristas señalaron que varios titulares de patentes importantes no formaban parte del grupo. Entre ellos se encontraban AT&T , Microsoft , Nokia y Motorola . En ese momento, se especuló que estas empresas formarían su propio grupo de licencias para competir con el grupo MPEG LA o sumarse a él. Dicho grupo se anunció formalmente el 26 de marzo de 2015, como HEVC Advance. [52] Los términos, que cubren 500 patentes esenciales, se anunciaron el 22 de julio de 2015, con tarifas que dependen del país de venta, el tipo de dispositivo, el perfil HEVC, las extensiones HEVC y las características opcionales de HEVC. A diferencia de los términos de MPEG LA, HEVC Advance reintrodujo las tarifas de licencia sobre el contenido codificado con HEVC, a través de una tarifa de participación en los ingresos. [53]
La licencia HEVC Advance inicial tenía una tasa máxima de regalías de US$2,60 por dispositivo para los países de la Región 1 y una tasa de regalías de contenido del 0,5% de los ingresos generados por los servicios de video HEVC. Los países de la Región 1 en la licencia HEVC Advance incluyen Estados Unidos, Canadá, la Unión Europea, Japón, Corea del Sur, Australia, Nueva Zelanda y otros. Los países de la Región 2 son países que no figuran en la lista de países de la Región 1. La licencia HEVC Advance tenía una tasa máxima de regalías de US$1,30 por dispositivo para los países de la Región 2. A diferencia de MPEG LA, no había un límite anual. Además de esto, HEVC Advance también cobraba una tasa de regalías del 0,5% de los ingresos generados por los servicios de video que codificaban contenido en HEVC. [53]
Cuando se anunciaron, hubo una reacción considerable por parte de los observadores de la industria sobre las tarifas "irrazonables y codiciosas" que se cobraban por los dispositivos, que eran aproximadamente siete veces más caras que las tarifas de MPEG LA. En conjunto, un dispositivo requeriría licencias que costarían 2,80 dólares, veintiocho veces más caras que AVC, además de tarifas por licencias sobre el contenido. Esto llevó a que "los propietarios de contenido se unieran y acordaran no obtener licencias de HEVC Advance". [54] Otros argumentaron que las tarifas podrían hacer que las empresas cambiaran a estándares competidores como Daala y VP9 . [55]
El 18 de diciembre de 2015, HEVC Advance anunció cambios en las tasas de regalías. Los cambios incluyen una reducción de la tasa máxima de regalías para los países de la Región 1 a 2,03 dólares estadounidenses por dispositivo, la creación de límites anuales de regalías y una exención de regalías sobre el contenido que es gratuito para los usuarios finales. Los límites anuales de regalías para una empresa son 40 millones de dólares estadounidenses para dispositivos, 5 millones de dólares estadounidenses para contenido y 2 millones de dólares estadounidenses para funciones opcionales. [56]
El 3 de febrero de 2016, Technicolor SA anunció que se había retirado del fondo de patentes HEVC Advance [57] y que licenciaría directamente sus patentes HEVC. [58] HEVC Advance anteriormente incluía 12 patentes de Technicolor. [59] Technicolor anunció que se había reincorporado el 22 de octubre de 2019. [60]
El 22 de noviembre de 2016, HEVC Advance anunció una importante iniciativa: revisar su política para permitir que las implementaciones de software de HEVC se distribuyan directamente a dispositivos móviles y computadoras personales de consumo sin pagar regalías, sin necesidad de una licencia de patente. [61]
El 31 de marzo de 2017, Velos Media anunció su licencia HEVC que cubre las patentes esenciales de Ericsson, Panasonic, Qualcomm Incorporated, Sharp y Sony. [62]
A partir de abril de 2019, [actualizar]la lista de patentes MPEG LA HEVC tiene 164 páginas. [63] [64]
Las siguientes organizaciones poseen actualmente las patentes más activas en los grupos de patentes HEVC enumerados por MPEG LA y HEVC Advance:
Versiones del estándar HEVC/H.265 que utilizan las fechas de aprobación de la UIT-T. [24]
El 29 de febrero de 2012, en el Mobile World Congress de 2012 , Qualcomm demostró un decodificador HEVC que funcionaba en una tableta Android, con un procesador de doble núcleo Qualcomm Snapdragon S4 que funcionaba a 1,5 GHz, mostrando versiones H.264/MPEG-4 AVC y HEVC del mismo contenido de video reproduciéndose en paralelo. En esta demostración, HEVC mostró una reducción de la tasa de bits de casi el 50% en comparación con H.264/MPEG-4 AVC. [73]
El 11 de febrero de 2013, investigadores del MIT demostraron el primer decodificador ASIC HEVC publicado del mundo en la Conferencia Internacional de Circuitos de Estado Sólido (ISSCC) 2013. [74] Su chip era capaz de decodificar una transmisión de video de 3840 × 2160p a 30 fps en tiempo real, consumiendo menos de 0,1 W de energía. [75] [76]
El 3 de abril de 2013, Ateme anunció la disponibilidad de la primera implementación de código abierto de un reproductor de software HEVC basado en el decodificador OpenHEVC y el reproductor de video GPAC , ambos con licencia LGPL . El decodificador OpenHEVC admite el perfil principal de HEVC y puede decodificar video de 1080p a 30 fps utilizando una CPU de un solo núcleo. [77] Un transcodificador en vivo que admite HEVC y se utiliza en combinación con el reproductor de video GPAC se mostró en el stand de ATEME en la feria NAB Show en abril de 2013. [77] [78]
El 23 de julio de 2013, MulticoreWare anunció y puso a disposición el código fuente de la biblioteca de codificador HEVC x265 bajo la licencia GPL v2 . [79] [80]
El 8 de agosto de 2013, Nippon Telegraph and Telephone anunció el lanzamiento de su codificador de software HEVC-1000 SDK que admite el perfil Main 10, resoluciones de hasta 7680×4320 y velocidades de cuadro de hasta 120 fps. [81]
El 14 de noviembre de 2013, los desarrolladores de DivX publicaron información sobre el rendimiento de decodificación HEVC utilizando una CPU Intel i7 a 3,5 GHz con 4 núcleos y 8 subprocesos. [82] El decodificador DivX 10.1 Beta fue capaz de alcanzar 210,9 fps a 720p, 101,5 fps a 1080p y 29,6 fps a 4K. [82]
El 18 de diciembre de 2013, ViXS Systems anunció los envíos de su SoC XCode (que no debe confundirse con el IDE Xcode de Apple para MacOS) 6400, que fue el primer SoC compatible con el perfil Main 10 de HEVC. [83]
El 5 de abril de 2014, en la feria NAB, eBrisk Video, Inc. y Altera Corporation demostraron un codificador HEVC Main10 acelerado por FPGA que codificaba video 4Kp60/10 bits en tiempo real, utilizando una plataforma dual-Xeon E5-2697-v2. [84] [85]
El 13 de agosto de 2014, Ittiam Systems anunció la disponibilidad de su códec H.265/HEVC de tercera generación con soporte para 4:2:2 de 12 bits. [86]
El 5 de septiembre de 2014, la Blu-ray Disc Association anunció que la especificación del disco Blu-ray 4K admitiría video 4K codificado en HEVC a 60 fps, el espacio de color Rec. 2020 , alto rango dinámico ( PQ y HLG ) y profundidad de color de 10 bits . [87] [88] Los discos Blu-ray 4K tienen una velocidad de datos de al menos 50 Mbit/s y una capacidad de disco de hasta 100 GB. [87] [88] Los discos Blu-ray 4K y los reproductores estuvieron disponibles para su compra en 2015 o 2016. [87] [88]
El 9 de septiembre de 2014, Apple anunció el iPhone 6 y el iPhone 6 Plus , que admiten HEVC/H.265 para FaceTime a través de red celular. [89]
El 18 de septiembre de 2014, Nvidia lanzó la GeForce GTX 980 (GM204) y la GTX 970 (GM204), que incluyen Nvidia NVENC , el primer codificador de hardware HEVC del mundo en una tarjeta gráfica discreta. [90]
El 31 de octubre de 2014, Microsoft confirmó que Windows 10 soportará HEVC de fábrica , según una declaración de Gabriel Aul, el líder del Equipo de Datos y Fundamentos del Grupo de Sistemas Operativos de Microsoft. [91] [92] Windows 10 Technical Preview Build 9860 agregó soporte a nivel de plataforma para HEVC y Matroska . [93] [94]
El 3 de noviembre de 2014, se lanzó Android Lollipop con soporte listo para usar para HEVC utilizando el software de Ittiam Systems . [95]
El 5 de enero de 2015, ViXS Systems anunció el XCode 6800, el primer SoC que admite el perfil Main 12 de HEVC. [96]
El 5 de enero de 2015, Nvidia anunció oficialmente el SoC Tegra X1 con decodificación de hardware HEVC de función fija completa. [97] [98]
El 22 de enero de 2015, Nvidia lanzó la GeForce GTX 960 (GM206), que incluye el primer decodificador de hardware HEVC Main/Main10 con función fija completa del mundo en una tarjeta gráfica discreta. [99]
El 23 de febrero de 2015, Advanced Micro Devices (AMD) anunció que su ASIC UVD que se encuentra en las APU Carrizo sería la primera CPU basada en x86 en tener un decodificador de hardware HEVC. [100]
El 27 de febrero de 2015 se lanzó la versión 2.2.0 del reproductor multimedia VLC , que es compatible con la reproducción HEVC. Las versiones correspondientes para Android e iOS también pueden reproducir HEVC.
El 31 de marzo de 2015, VITEC anunció el MGW Ace, el primer codificador HEVC portátil 100 % basado en hardware que proporciona codificación HEVC móvil. [101]
El 5 de agosto de 2015, Intel lanzó los productos Skylake con decodificación/codificación Main/8 bits de función fija completa y decodificación Main10/10 bits híbrida/parcial.
El 9 de septiembre de 2015, Apple anunció el chip Apple A9 , utilizado por primera vez en el iPhone 6S , su primer procesador con un decodificador HEVC de hardware compatible con Main 8 y 10. Esta característica no se desbloquearía hasta el lanzamiento de iOS 11 en 2017. [102]
El 11 de abril de 2016, se anunció la compatibilidad total con HEVC (H.265) en la versión más reciente de MythTV (0.28). [103]
El 30 de agosto de 2016, Intel anunció oficialmente los productos de CPU Core de séptima generación ( Kaby Lake ) con soporte completo de decodificación de hardware HEVC Main10 con función fija. [104]
El 7 de septiembre de 2016, Apple anunció el chip Apple A10 , utilizado por primera vez en el iPhone 7 , que incluía un codificador HEVC de hardware compatible con Main 8 y 10. Esta función no se desbloquearía hasta el lanzamiento de iOS 11 en 2017. [102]
El 25 de octubre de 2016, Nvidia lanzó la GeForce GTX 1050Ti (GP107) y la GeForce GTX 1050 (GP107), que incluyen un codificador de hardware HEVC Main10/Main12 con función fija completa.
El 5 de junio de 2017, Apple anunció la compatibilidad con HEVC H.265 en macOS High Sierra , iOS 11 , tvOS , [105] HTTP Live Streaming [106] y Safari . [107] [108]
El 25 de junio de 2017, Microsoft lanzó una extensión de aplicación HEVC gratuita para Windows 10 , lo que permite que algunos dispositivos Windows 10 con hardware de decodificación HEVC reproduzcan videos usando el formato HEVC dentro de cualquier aplicación. [109]
El 19 de septiembre de 2017, Apple lanzó iOS 11 y tvOS 11 con soporte para codificación y decodificación HEVC. [110] [105]
El 25 de septiembre de 2017, Apple lanzó macOS High Sierra con soporte de codificación y decodificación HEVC.
El 28 de septiembre de 2017, GoPro lanzó la cámara de acción Hero6 Black, con codificación de video HEVC 4K60P. [111]
El 17 de octubre de 2017, Microsoft eliminó la compatibilidad con la decodificación HEVC de Windows 10 con la actualización Fall Creators Update de la versión 1709, y en su lugar hizo que HEVC estuviera disponible como una descarga paga separada desde Microsoft Store. [112]
El 2 de noviembre de 2017, Nvidia lanzó la GeForce GTX 1070 Ti (GP104), que incluye un decodificador de hardware HEVC Main10/Main12 con función fija completa.
El 20 de septiembre de 2018, Nvidia lanzó la GeForce RTX 2080 (TU104), que incluye un decodificador de hardware HEVC Main 4:4:4 12 con función fija completa.
El 25 de octubre de 2022, Chrome lanzó la versión 107, que comienza a admitir la decodificación de hardware HEVC para todas las plataformas "listas para usar", si el hardware es compatible.
HEVC está implementado en estos navegadores web:
En junio de 2023, se estima que el 88,31 % de los navegadores en uso en sistemas de escritorio y móviles podían reproducir videos HEVC en páginas web HTML5, según datos de Can I Use. [117]
La mayoría de los estándares de codificación de vídeo están diseñados principalmente para lograr la máxima eficiencia de codificación. La eficiencia de codificación es la capacidad de codificar vídeo a la menor tasa de bits posible manteniendo un cierto nivel de calidad de vídeo. Hay dos formas estándar de medir la eficiencia de codificación de un estándar de codificación de vídeo: utilizar una métrica objetiva, como la relación señal-ruido máxima (PSNR), o utilizar una evaluación subjetiva de la calidad del vídeo. La evaluación subjetiva de la calidad del vídeo se considera la forma más importante de medir un estándar de codificación de vídeo, ya que los seres humanos perciben la calidad del vídeo de forma subjetiva. [121]
HEVC se beneficia del uso de tamaños de unidad de árbol de codificación (CTU) más grandes. Esto se ha demostrado en pruebas PSNR con un codificador HEVC HM-8.0 donde se lo obligó a usar tamaños de CTU progresivamente más pequeños. Para todas las secuencias de prueba, en comparación con un tamaño de CTU de 64 × 64, se demostró que la tasa de bits HEVC aumentó un 2,2 % cuando se lo obligó a usar un tamaño de CTU de 32 × 32, y aumentó un 11,0 % cuando se lo obligó a usar un tamaño de CTU de 16 × 16. En las secuencias de prueba de Clase A, donde la resolución del video era de 2560 × 1600, en comparación con un tamaño de CTU de 64 × 64, se demostró que la tasa de bits HEVC aumentó un 5,7 % cuando se lo obligó a usar un tamaño de CTU de 32 × 32, y aumentó un 28,2 % cuando se lo obligó a usar un tamaño de CTU de 16 × 16. Las pruebas demostraron que los tamaños grandes de CTU aumentan la eficiencia de codificación y al mismo tiempo reducen el tiempo de decodificación. [121]
Se ha comparado la eficiencia de codificación del perfil principal HEVC (MP) con el perfil alto (HP) H.264/MPEG-4 AVC, el perfil simple avanzado (ASP) MPEG-4 , el perfil de alta latencia (HLP) H.263 y el perfil principal (MP) H.262/MPEG-2 . La codificación de vídeo se realizó para aplicaciones de entretenimiento y se crearon doce velocidades de bits diferentes para las nueve secuencias de prueba de vídeo con un codificador HEVC HM-8.0. De las nueve secuencias de prueba de vídeo, cinco tenían una resolución HD, mientras que cuatro tenían una resolución WVGA (800×480). Las reducciones de la tasa de bits para HEVC se determinaron en función de PSNR, donde HEVC tiene una reducción de la tasa de bits del 35,4 % en comparación con H.264/MPEG-4 AVC HP, del 63,7 % en comparación con MPEG-4 ASP, del 65,1 % en comparación con H.263 HLP y del 70,8 % en comparación con H.262/MPEG-2 MP. [121]
También se ha comparado HEVC MP con H.264/MPEG-4 AVC HP en cuanto a la calidad subjetiva del vídeo. La codificación de vídeo se realizó para aplicaciones de entretenimiento y se realizaron cuatro tasas de bits diferentes para nueve secuencias de prueba de vídeo con un codificador HEVC HM-5.0. La evaluación subjetiva se realizó en una fecha anterior a la comparación PSNR y, por lo tanto, se utilizó una versión anterior del codificador HEVC que tenía un rendimiento ligeramente inferior. Las reducciones de la tasa de bits se determinaron en función de la evaluación subjetiva utilizando valores de puntuación de opinión media . La reducción general de la tasa de bits subjetiva para HEVC MP en comparación con H.264/MPEG-4 AVC HP fue del 49,3 %. [121]
La Escuela Politécnica Federal de Lausana (EPFL) realizó un estudio para evaluar la calidad subjetiva de video de HEVC en resoluciones superiores a la HDTV. El estudio se realizó con tres videos con resoluciones de 3840×1744 a 24 fps, 3840×2048 a 30 fps y 3840×2160 a 30 fps. Las secuencias de video de cinco segundos mostraban personas en una calle, tráfico y una escena de la película animada por computadora de código abierto Sintel . Las secuencias de video se codificaron a cinco velocidades de bits diferentes utilizando el codificador HEVC HM-6.1.1 y el codificador H.264/MPEG-4 AVC JM-18.3. Las reducciones subjetivas de la velocidad de bits se determinaron en función de la evaluación subjetiva utilizando valores de puntuación de opinión promedio. El estudio comparó HEVC MP con H.264/MPEG-4 AVC HP y mostró que, para HEVC MP, la reducción de tasa de bits promedio basada en PSNR fue del 44,4%, mientras que la reducción de tasa de bits promedio basada en la calidad de video subjetiva fue del 66,5%. [122] [123] [124] [125]
En una comparación de rendimiento de HEVC publicada en abril de 2013, se compararon HEVC MP y Main 10 Profile (M10P) con H.264/MPEG-4 AVC HP y High 10 Profile (H10P) utilizando secuencias de video de 3840×2160. Las secuencias de video se codificaron utilizando el codificador HEVC HM-10.0 y el codificador H.264/MPEG-4 AVC JM-18.4. La reducción de la tasa de bits promedio basada en PSNR fue del 45 % para el video entre cuadros .
En una comparación de codificadores de vídeo publicada en diciembre de 2013, se comparó el codificador HEVC HM-10.0 con el codificador x264 (versión r2334) y el codificador VP9 (versión v1.2.0-3088-ga81bd12). La comparación utilizó el método de medición de la tasa de bits Bjøntegaard-Delta (BD-BR), en el que los valores negativos indican cuánto se reduce la tasa de bits y los valores positivos indican cuánto se aumenta la tasa de bits para el mismo PSNR. En la comparación, el codificador HEVC HM-10.0 tuvo la mayor eficiencia de codificación y, en promedio, para obtener la misma calidad objetiva, el codificador x264 necesitaba aumentar la tasa de bits en un 66,4%, mientras que el codificador VP9 necesitaba aumentarla en un 79,4%. [126]
En una comparación subjetiva del rendimiento de video publicada en mayo de 2014, el JCT-VC comparó el perfil HEVC Main con el perfil H.264/MPEG-4 AVC High. La comparación utilizó valores de puntuación de opinión promedio y fue realizada por la BBC y la Universidad del Oeste de Escocia . Las secuencias de video se codificaron utilizando el codificador HM-12.1 HEVC y el codificador JM-18.5 H.264/MPEG-4 AVC. La comparación utilizó un rango de resoluciones y la reducción de tasa de bits promedio para HEVC fue del 59%. La reducción de tasa de bits promedio para HEVC fue del 52% para 480p, 56% para 720p, 62% para 1080p y 64% para 4K UHD. [127]
En una comparación subjetiva de códecs de vídeo publicada en agosto de 2014 por la EPFL, se comparó el codificador HM-15.0 HEVC con el codificador VP9 1.2.0–5183 y el codificador JM-18.8 H.264/MPEG-4 AVC. Se codificaron cuatro secuencias con resoluciones 4K a cinco velocidades de bits diferentes con los codificadores configurados para utilizar un periodo intra de un segundo. En la comparación, el codificador HM-15.0 HEVC tuvo la mayor eficiencia de codificación y, en promedio, para la misma calidad subjetiva, la velocidad de bits se pudo reducir en un 49,4 % en comparación con el codificador VP9 1.2.0–5183, y se pudo reducir en un 52,6 % en comparación con el codificador JM-18.8 H.264/MPEG-4 AVC. [128] [129] [130]
En agosto de 2016, Netflix publicó los resultados de un estudio a gran escala que comparaba el codificador HEVC de código abierto líder, x265 , con el codificador AVC de código abierto líder, x264 , y el codificador VP9 de referencia, libvpx. [131] Utilizando su herramienta avanzada de medición de calidad de video Video Multimethod Assessment Fusion (VMAF), Netflix descubrió que x265 ofrecía una calidad idéntica a velocidades de bits que iban desde un 35,4 % a un 53,3 % más bajas que x264, y desde un 17,8 % a un 21,8 % más bajas que VP9. [132]
HEVC fue diseñado para mejorar sustancialmente la eficiencia de codificación en comparación con H.264/MPEG-4 AVC HP, es decir, para reducir los requisitos de tasa de bits a la mitad con una calidad de imagen comparable , a expensas de una mayor complejidad computacional. [13] HEVC fue diseñado con el objetivo de permitir que el contenido de video tenga una relación de compresión de datos de hasta 1000:1. [133] Dependiendo de los requisitos de la aplicación, los codificadores HEVC pueden equilibrar la complejidad computacional, la tasa de compresión, la robustez a los errores y el tiempo de retardo de codificación. [13] Dos de las características clave en las que HEVC mejoró en comparación con H.264/MPEG-4 AVC fueron el soporte para video de mayor resolución y métodos de procesamiento paralelo mejorados. [13]
HEVC está dirigido a pantallas HDTV de próxima generación y sistemas de captura de contenido que cuentan con velocidades de cuadro escaneadas progresivas y resoluciones de pantalla desde QVGA (320×240) a 4320p (7680×4320), así como una calidad de imagen mejorada en términos de nivel de ruido , espacios de color y rango dinámico . [21] [134] [135] [136]
La capa de codificación de vídeo HEVC utiliza el mismo enfoque "híbrido" utilizado en todos los estándares de vídeo modernos, a partir de H.261 , en el sentido de que utiliza predicción inter/intra-imagen y codificación de transformación 2D. [13] Un codificador HEVC procede primero dividiendo una imagen en regiones con forma de bloque para la primera imagen, o la primera imagen de un punto de acceso aleatorio, que utiliza predicción intra-imagen. [13] La predicción intra-imagen es cuando la predicción de los bloques de la imagen se basa únicamente en la información de esa imagen. [13] Para todas las demás imágenes, se utiliza la predicción inter-imagen, en la que se utiliza información de predicción de otras imágenes. [13] Una vez finalizados los métodos de predicción y la imagen pasa por los filtros de bucle, la representación final de la imagen se almacena en el búfer de imágenes decodificadas. [13] Las imágenes almacenadas en el búfer de imágenes decodificadas se pueden utilizar para la predicción de otras imágenes. [13]
HEVC fue diseñado con la idea de que se utilizaría video de escaneo progresivo y no se agregaron herramientas de codificación específicamente para video entrelazado . [13] Las herramientas de codificación específicas de entrelazado, como MBAFF y PAFF, no son compatibles con HEVC. [137] En cambio, HEVC envía metadatos que indican cómo se envió el video entrelazado. [13] El video entrelazado se puede enviar codificando cada cuadro como una imagen separada o codificando cada campo como una imagen separada. [13] Para el video entrelazado, HEVC puede cambiar entre codificación de cuadros y codificación de campos utilizando Sequence Adaptive Frame Field (SAFF), que permite cambiar el modo de codificación para cada secuencia de video. [138] Esto permite enviar video entrelazado con HEVC sin necesidad de agregar procesos especiales de decodificación entrelazada a los decodificadores HEVC. [13]
El estándar HEVC admite espacios de color como película genérica, NTSC , PAL , Rec. 601 , Rec. 709 , Rec. 2020 , Rec. 2100 , SMPTE 170M, SMPTE 240M, sRGB , sYCC , xvYCC , XYZ y espacios de color especificados externamente. [24] HEVC admite representaciones de codificación de color como RGB , YCbCr y YCoCg . [24]
HEVC reemplaza los macrobloques de 16×16 píxeles , que se usaban con estándares anteriores, con unidades de árbol de codificación (CTU) que pueden usar estructuras de bloques más grandes de hasta 64×64 muestras y pueden subdividir mejor la imagen en estructuras de tamaño variable. [13] [139] HEVC divide inicialmente la imagen en CTU que pueden ser de 64×64, 32×32 o 16×16 con un tamaño de bloque de píxeles más grande que generalmente aumenta la eficiencia de codificación. [13]
HEVC especifica cuatro tamaños de unidades de transformación (TU) de 4×4, 8×8, 16×16 y 32×32 para codificar el residuo de predicción. [13] Un CTB se puede dividir recursivamente en 4 o más TU. [13] Las TU utilizan funciones de base entera basadas en la transformada de coseno discreta (DCT). [13] [2] Además, los bloques de transformación de luma 4×4 que pertenecen a una región intracodificada se transforman utilizando una transformación entera que se deriva de la transformada de seno discreta (DST). [13] Esto proporciona una reducción de la tasa de bits del 1%, pero se restringió a los bloques de transformación de luma 4×4 debido a los beneficios marginales para los otros casos de transformación. [13] Chroma utiliza los mismos tamaños de TU que luma, por lo que no hay una transformación 2×2 para croma. [13]
HEVC utiliza un algoritmo de codificación aritmética binaria adaptativa al contexto (CABAC) que es fundamentalmente similar a CABAC en H.264/MPEG-4 AVC. [13] CABAC es el único método de codificación de entropía permitido en HEVC, mientras que hay dos métodos de codificación de entropía permitidos por H.264/MPEG-4 AVC. [13] CABAC y la codificación de entropía de coeficientes de transformación en HEVC fueron diseñados para un mayor rendimiento que H.264/MPEG-4 AVC, [140] manteniendo al mismo tiempo una mayor eficiencia de compresión para tamaños de bloque de transformación más grandes en relación con extensiones simples. [141] Por ejemplo, el número de bins codificados en contexto se ha reducido en 8× y el modo de derivación de CABAC se ha mejorado en términos de su diseño para aumentar el rendimiento. [13] [140] [142] Otra mejora con HEVC es que las dependencias entre los datos codificados se han cambiado para aumentar aún más el rendimiento. [13] [140] El modelado de contexto en HEVC también se ha mejorado para que CABAC pueda seleccionar mejor un contexto que aumente la eficiencia en comparación con H.264/MPEG-4 AVC. [13]
HEVC especifica 33 modos direccionales para la predicción intra en comparación con los 8 modos direccionales para la predicción intra especificados por H.264/MPEG-4 AVC. [13] HEVC también especifica los modos de predicción intra DC y de predicción planar. [13] El modo de predicción intra DC genera un valor medio promediando muestras de referencia y se puede utilizar para superficies planas. [13] El modo de predicción planar en HEVC admite todos los tamaños de bloque definidos en HEVC, mientras que el modo de predicción planar en H.264/MPEG-4 AVC está limitado a un tamaño de bloque de 16×16 píxeles. [13] Los modos de predicción intra utilizan datos de bloques de predicción vecinos que se han decodificado previamente desde dentro de la misma imagen. [13]
Para la interpolación de posiciones de muestra de luma fraccionaria, HEVC utiliza la aplicación separable de interpolación de media muestra unidimensional con un filtro de 8 toques o interpolación de cuarto de muestra con un filtro de 7 toques mientras que, en comparación, H.264/MPEG-4 AVC utiliza un proceso de dos etapas que primero deriva valores en posiciones de media muestra utilizando interpolación unidimensional separable de 6 toques seguida de redondeo de enteros y luego aplica interpolación lineal entre valores en posiciones de media muestra cercanas para generar valores en posiciones de cuarto de muestra. [13] HEVC ha mejorado la precisión debido al filtro de interpolación más largo y la eliminación del error de redondeo intermedio. [13] Para el video 4:2:0, las muestras de croma se interpolan con filtrado unidimensional separable de 4 toques para generar precisión de octavo de muestra, mientras que en comparación H.264/MPEG-4 AVC utiliza solo un filtro bilineal de 2 toques (también con precisión de octavo de muestra). [13]
Al igual que en H.264/MPEG-4 AVC, la predicción ponderada en HEVC se puede utilizar con uni-predicción (en la que se utiliza un único valor de predicción) o bi-predicción (en la que se combinan los valores de predicción de dos bloques de predicción). [13]
HEVC define un rango de 16 bits con signo para vectores de movimiento (MV) horizontales y verticales. [24] [143] [144] [145] Esto se agregó a HEVC en la reunión HEVC de julio de 2012 con las variables mvLX. [24] [143] [144] [145] Los MV horizontales/verticales HEVC tienen un rango de −32768 a 32767 que, dada la precisión de un cuarto de píxel utilizada por HEVC, permite un rango de MV de −8192 a 8191,75 muestras de luma. [24] [143] [144] [145] Esto se compara con H.264/MPEG-4 AVC, que permite un rango de MV horizontal de −2048 a 2047,75 muestras de luma y un rango de MV vertical de −512 a 511,75 muestras de luma. [144]
HEVC permite dos modos de MV, que son la predicción avanzada de vectores de movimiento (AMVP) y el modo de fusión. [13] AMVP utiliza datos de la imagen de referencia y también puede utilizar datos de bloques de predicción adyacentes. [13] El modo de fusión permite que los MV se hereden de los bloques de predicción vecinos. [13] El modo de fusión en HEVC es similar a los modos de inferencia de movimiento "omitido" y "directo" en H.264/MPEG-4 AVC, pero con dos mejoras. [13] La primera mejora es que HEVC utiliza información de índice para seleccionar uno de varios candidatos disponibles. [13] La segunda mejora es que HEVC utiliza información de la lista de imágenes de referencia y del índice de imágenes de referencia. [13]
HEVC especifica dos filtros de bucle que se aplican secuencialmente, con el filtro de desbloqueo (DBF) aplicado primero y el filtro de desplazamiento adaptativo de muestra (SAO) aplicado después. [13] Ambos filtros de bucle se aplican en el bucle de predicción entre imágenes, es decir, la imagen filtrada se almacena en el búfer de imágenes decodificadas (DPB) como referencia para la predicción entre imágenes. [13]
El DBF es similar al utilizado por H.264/MPEG-4 AVC pero con un diseño más simple y mejor soporte para procesamiento paralelo. [13] En HEVC el DBF solo se aplica a una cuadrícula de muestra de 8×8 mientras que con H.264/MPEG-4 AVC el DBF se aplica a una cuadrícula de muestra de 4×4. [13] DBF utiliza una cuadrícula de muestra de 8×8 ya que no causa degradación notable y mejora significativamente el procesamiento paralelo porque el DBF ya no causa interacciones en cascada con otras operaciones. [13] Otro cambio es que HEVC solo permite tres intensidades de DBF de 0 a 2. [13] HEVC también requiere que el DBF primero aplique filtrado horizontal para bordes verticales a la imagen y solo después aplique filtrado vertical para bordes horizontales a la imagen. [13] Esto permite que se utilicen múltiples subprocesos paralelos para el DBF. [13]
El filtro SAO se aplica después del DBF y está diseñado para permitir una mejor reconstrucción de las amplitudes de la señal original mediante la aplicación de desplazamientos almacenados en una tabla de búsqueda en el flujo de bits. [13] [146] Por CTB, el filtro SAO se puede desactivar o aplicar en uno de dos modos: modo de desplazamiento de borde o modo de desplazamiento de banda. [13] [146] El modo de desplazamiento de borde funciona comparando el valor de una muestra con dos de sus ocho vecinos utilizando uno de cuatro patrones de gradiente direccional. [13] [146] Con base en una comparación con estos dos vecinos, la muestra se clasifica en una de cinco categorías: mínimo, máximo, un borde con la muestra que tiene el valor más bajo, un borde con la muestra que tiene el valor más alto o monótono. [13] [146] Para cada una de las primeras cuatro categorías se aplica un desplazamiento. [13] [146] El modo de desplazamiento de banda aplica un desplazamiento basado en la amplitud de una sola muestra. [13] [146] Una muestra se clasifica por su amplitud en una de 32 bandas ( contenedores de histograma ). [13] [146] Se especifican desplazamientos para cuatro bandas consecutivas de las 32, porque en áreas planas que son propensas a artefactos de bandas, las amplitudes de muestra tienden a agruparse en un rango pequeño. [13] [146] El filtro SAO fue diseñado para aumentar la calidad de la imagen, reducir los artefactos de bandas y reducir los artefactos de timbre . [13] [146]
Las extensiones de rango en MPEG son perfiles, niveles y técnicas adicionales que respaldan necesidades más allá de la reproducción de video del consumidor: [24]
Estos nuevos perfiles incluyen funciones de codificación mejoradas, muchas de las cuales admiten una codificación de pantalla eficiente o un procesamiento de alta velocidad:
La versión 2 de HEVC agrega varios mensajes de información de mejora complementaria (SEI):
Se han agregado opciones de herramientas de codificación adicionales en el borrador de marzo de 2016 de las extensiones de codificación de contenido de pantalla (SCC): [150]
La versión ITU-T del estándar que agregó las extensiones SCC (aprobada en diciembre de 2016 y publicada en marzo de 2017) agregó soporte para la función de transferencia híbrida log-gamma (HLG) y la matriz de color ICtCp . [65] Esto permite que la cuarta versión de HEVC admita ambas funciones de transferencia HDR definidas en la Rec. 2100. [ 65]
La cuarta versión de HEVC agrega varios mensajes de información de mejora complementaria (SEI) que incluyen:
La versión 1 del estándar HEVC define tres perfiles: Main , Main 10 y Main Still Picture . [24] La versión 2 de HEVC agrega 21 perfiles de extensiones de rango, dos perfiles de extensiones escalables y un perfil de vista múltiple. [24] HEVC también contiene disposiciones para perfiles adicionales. [24] Las extensiones que se agregaron a HEVC incluyen mayor profundidad de bits , muestreo de croma 4:2:2/4:4:4 , codificación de video de vista múltiple (MVC) y codificación de video escalable (SVC). [13] [153] Las extensiones de rango HEVC, las extensiones escalables HEVC y las extensiones de vista múltiple HEVC se completaron en julio de 2014. [154] [155] [156] En julio de 2014 se publicó un borrador de la segunda versión de HEVC. [154] Se estaban desarrollando extensiones de codificación de contenido de pantalla (SCC) para videos de contenido de pantalla, que contienen texto y gráficos, y se esperaba que el borrador final se publicara en 2015. [157] [158]
Un perfil es un conjunto definido de herramientas de codificación que se pueden utilizar para crear un flujo de bits que se ajuste a ese perfil. [13] Un codificador de un perfil puede elegir qué herramientas de codificación utilizar siempre que genere un flujo de bits conforme, mientras que un decodificador de un perfil debe admitir todas las herramientas de codificación que se puedan utilizar en ese perfil. [13]
El perfil principal permite una profundidad de bits de 8 bits por muestra con muestreo de croma 4:2:0, que es el tipo de video más común utilizado con dispositivos de consumo. [13] [24] [155]
El Main10
perfil Main 10 ( ) se agregó en la reunión HEVC de octubre de 2012 con base en la propuesta JCTVC-K0109 que proponía que se agregara un perfil de 10 bits a HEVC para aplicaciones de consumo. La propuesta decía que esto era para permitir una calidad de video mejorada y para soportar el espacio de color Rec. 2020 que se ha vuelto ampliamente utilizado en sistemas UHDTV y para poder ofrecer un rango dinámico y fidelidad de color más altos evitando los artefactos de bandas. Una variedad de compañías apoyaron la propuesta que incluyeron Ateme , BBC , BSkyB , Cisco , DirecTV , Ericsson , Motorola Mobility , NGCodec, NHK , RAI , ST, SVT , Thomson Video Networks , Technicolor y ViXS Systems . [159] El perfil Main 10 permite una profundidad de bits de 8 a 10 bits por muestra con muestreo de croma 4:2:0. Los decodificadores HEVC que se ajustan al perfil Main 10 deben ser capaces de decodificar flujos de bits realizados con los siguientes perfiles: Main y Main 10. [24] Una mayor profundidad de bits permite una mayor cantidad de colores. 8 bits por muestra permiten 256 tonos por color primario (un total de 16,78 millones de colores), mientras que 10 bits por muestra permiten 1024 tonos por color primario (un total de 1070 millones de colores). Una mayor profundidad de bits permite una transición de color más suave que resuelve el problema conocido como bandas de color . [160] [161]
El perfil Main 10 permite una calidad de video mejorada ya que puede admitir video con una profundidad de bits mayor que la admitida por el perfil Main. [159] Además, en el perfil Main 10, el video de 8 bits se puede codificar con una profundidad de bits mayor de 10 bits, lo que permite una eficiencia de codificación mejorada en comparación con el perfil Main. [162] [163] [164]
Ericsson afirmó que el perfil Main 10 aportaría los beneficios del vídeo de 10 bits por muestra a la televisión de consumo. También afirmó que para resoluciones más altas no hay penalización de velocidad de bits por codificar vídeo a 10 bits por muestra. [160] Imagination Technologies afirmó que el vídeo de 10 bits por muestra permitiría espacios de color más grandes y es necesario para el espacio de color Rec. 2020 que utilizará la UHDTV. También afirmó que el espacio de color Rec. 2020 impulsaría la adopción generalizada del vídeo de 10 bits por muestra. [161] [165]
En una comparación de rendimiento basada en PSNR publicada en abril de 2013, se comparó el perfil Main 10 con el perfil Main utilizando un conjunto de secuencias de vídeo de 10 bits de 3840 × 2160. Las secuencias de vídeo de 10 bits se convirtieron a 8 bits para el perfil Main y se mantuvieron en 10 bits para el perfil Main 10. El PSNR de referencia se basó en las secuencias de vídeo originales de 10 bits. En la comparación de rendimiento, el perfil Main 10 proporcionó una reducción de la tasa de bits del 5 % para la codificación de vídeo entre fotogramas en comparación con el perfil Main. La comparación de rendimiento indica que, para las secuencias de vídeo probadas, el perfil Main 10 superó al perfil Main. [166]
El MainStillPicture
perfil de imagen fija principal ( ) permite codificar una única imagen fija con las mismas restricciones que el perfil principal. Como subconjunto del perfil principal, el perfil de imagen fija principal permite una profundidad de bits de 8 bits por muestra con un muestreo de croma de 4:2:0. [13] [24] [155] En abril de 2012 se realizó una comparación objetiva del rendimiento en la que HEVC redujo la tasa de bits promedio de las imágenes en un 56 % en comparación con JPEG . [168] En mayo de 2012 se realizó una comparación del rendimiento basada en PSNR para la compresión de imágenes fijas utilizando el codificador HEVC HM 6.0 y los codificadores de software de referencia para los demás estándares. Para imágenes fijas, HEVC redujo la tasa de bits promedio en un 15,8% en comparación con H.264/MPEG-4 AVC, un 22,6% en comparación con JPEG 2000 , un 30,0% en comparación con JPEG XR , un 31,0% en comparación con WebP y un 43,0% en comparación con JPEG. [169]
En enero de 2013 se realizó una comparación de rendimiento para la compresión de imágenes fijas utilizando el codificador HEVC HM 8.0rc2, Kakadu versión 6.0 para JPEG 2000 e IJG versión 6b para JPEG. La comparación de rendimiento utilizó PSNR para la evaluación objetiva y valores de puntuación de opinión media (MOS) para la evaluación subjetiva. La evaluación subjetiva utilizó la misma metodología de prueba e imágenes que las utilizadas por el comité JPEG cuando evaluó JPEG XR. Para imágenes con muestreo de croma 4:2:0, la reducción de tasa de bits promedio para HEVC en comparación con JPEG 2000 fue del 20,26 % para PSNR y del 30,96 % para MOS, mientras que en comparación con JPEG fue del 61,63 % para PSNR y del 43,10 % para MOS. [167]
En abril de 2013, Nokia realizó una comparación del rendimiento de HEVC basada en PSNR para la compresión de imágenes fijas . HEVC tiene una mejora de rendimiento mayor para imágenes de mayor resolución que para imágenes de menor resolución y una mejora de rendimiento mayor para velocidades de bits más bajas que para velocidades de bits más altas. Para que la compresión con pérdida obtenga el mismo PSNR que HEVC, se necesitaron en promedio 1,4 veces más bits con JPEG 2000, 1,6 veces más bits con JPEG-XR y 2,3 veces más bits con JPEG. [170]
En octubre de 2013 , Mozilla realizó un estudio de la eficiencia de compresión de HEVC, JPEG, JPEG XR y WebP . El estudio demostró que HEVC era significativamente mejor en la compresión que los otros formatos de imagen que se probaron. En el estudio se utilizaron cuatro métodos diferentes para comparar la calidad de la imagen: Y-SSIM, RGB-SSIM, IW-SSIM y PSNR-HVS-M. [171] [172]
La versión 2 de HEVC agrega 21 perfiles de extensiones de rango, dos perfiles de extensiones escalables y un perfil de vista múltiple: Monocromo , Monocromo 12 , Monocromo 16 , Principal 12 , Principal 4:2:2 10 , Principal 4:2:2 12 , Principal 4:4:4 , Principal 4:4:4 10 , Principal 4:4:4 12 , Monocromo 12 Intra , Monocromo 16 Intra , Principal 12 Intra , Principal 4:2:2 10 Intra , Principal 4:2:2 12 Intra , Principal 4:4:4 Intra , Principal 4:4:4 10 Intra , Principal 4:4:4 12 Intra , Principal 4:4:4 16 Intra , Principal 4:4:4 Imagen fija , Principal 4:4:4 16 Imagen fija , alto rendimiento 4:4:4 16 Intra , principal escalable , principal escalable 10 y principal multivista . [24] [173] Todos los perfiles de extensión de rango entre cuadros tienen un perfil Intra. [24]
HbrFactor
bits 12 veces mayor que otros perfiles HEVC, lo que le permite tener una tasa de bits máxima 12 veces mayor que el perfil Main 4:4:4 16 Intra. [24] [174] El perfil High Throughput 4:4:4 16 Intra está diseñado para la creación de contenido profesional de alta gama y no se requiere que los decodificadores para este perfil admitan otros perfiles. [174]La versión 3 de HEVC agregó un perfil 3D: 3D Main . El borrador de febrero de 2016 de las extensiones de codificación de contenido de pantalla agregó siete perfiles de extensiones de codificación de contenido de pantalla, tres perfiles de extensiones de alto rendimiento y cuatro perfiles de extensiones escalables: Screen-Extended Main , Screen-Extended Main 10 , Screen -Extended Main 4:4:4 , Screen-Extended Main 4:4:4 10, Screen-Extended High Throughput 4:4:4 , Screen-Extended High Throughput 4:4:4 10 , Screen -Extended High Throughput 4:4:4 14 , High Throughput 4:4:4 , High Throughput 4:4:4 10 , High Throughput 4:4:4 14 , Scalable Monochrome , Scalable Monochrome 12 , Scalable Monochrome 16 y Scalable Main 4:4:4 . [24] [150]
El estándar HEVC define dos niveles, principal y alto, y trece niveles. Un nivel es un conjunto de restricciones para un flujo de bits. Para los niveles inferiores al nivel 4, solo se permite el nivel principal. El nivel principal es un nivel inferior al nivel alto. Los niveles se crearon para tratar con aplicaciones que difieren en términos de su tasa de bits máxima. El nivel principal se diseñó para la mayoría de las aplicaciones, mientras que el nivel alto se diseñó para aplicaciones muy exigentes. Un decodificador que se ajuste a un nivel determinado debe ser capaz de decodificar todos los flujos de bits que estén codificados para ese nivel y para todos los niveles inferiores. [13] [24]
Las imágenes decodificadas previamente se almacenan en un búfer de imágenes decodificadas (DPB) y los codificadores HEVC las utilizan para formar predicciones para las imágenes posteriores. El número máximo de imágenes que se pueden almacenar en el DPB, denominado capacidad DPB, es 6 (incluida la imagen actual) para todos los niveles HEVC cuando se opera con el tamaño máximo de imagen admitido por el nivel. La capacidad DPB (en unidades de imágenes) aumenta de 6 a 8, 12 o 16 a medida que el tamaño de la imagen disminuye con respecto al tamaño máximo de imagen admitido por el nivel. El codificador selecciona qué imágenes específicas se conservan en el DPB imagen por imagen, de modo que el codificador tiene la flexibilidad de determinar por sí mismo la mejor manera de utilizar la capacidad DPB al codificar el contenido de vídeo. [24]
MPEG ha publicado una enmienda que agregó soporte HEVC al flujo de transporte MPEG utilizado por ATSC , DVB y Blu-ray Disc ; MPEG decidió no actualizar el flujo de programa MPEG utilizado por DVD-Video . [175] [176] MPEG también agregó soporte HEVC al formato de archivo multimedia base ISO . [177] [178] HEVC también es compatible con el estándar de transporte multimedia MPEG . [175] [179] El soporte para HEVC se agregó a Matroska a partir del lanzamiento de MKVToolNix v6.8.0 después de que se fusionara un parche de DivX. [180] [181] Se envió un documento borrador al Grupo de trabajo de ingeniería de Internet que describe un método para agregar soporte HEVC al Protocolo de transporte en tiempo real . [182]
Utilizando la codificación intraframe de HEVC, el programador Fabrice Bellard ha propuesto un formato codificado de imágenes fijas llamado Better Portable Graphics (BPG) . [183] Es esencialmente un contenedor para imágenes codificadas utilizando el perfil HEVC Main 4:4:4 16 Still Picture con hasta 14 bits por muestra, aunque utiliza una sintaxis de encabezado abreviada y agrega soporte explícito para Exif , perfiles ICC y metadatos XMP . [183] [184]
Condiciones de licencia y tarifas para las patentes HEVC, en comparación con sus principales competidores:
Al igual que con su predecesor AVC, los distribuidores de software que implementan HEVC en productos deben pagar un precio por copia distribuida. [i] Si bien este modelo de licencia es manejable para el software pago, es un obstáculo para la mayoría del software libre y de código abierto , que está destinado a ser libremente distribuible. En opinión de MulticoreWare , el desarrollador de x265 , habilitar codificadores y decodificadores de software libres de regalías es en interés de acelerar la adopción de HEVC. [191] [195] [196] HEVC Advance hizo una excepción que renuncia específicamente a las regalías en implementaciones solo de software (tanto decodificadores como codificadores) cuando no están incluidos con el hardware. [197] Sin embargo, el software exento no está libre de las obligaciones de licencia de otros titulares de patentes (por ejemplo, miembros del grupo MPEG LA).
Si bien el obstáculo al software libre no es un problema para las cadenas de televisión, por ejemplo, este problema, combinado con la perspectiva de un futuro encierro colectivo en el formato, hace que varias organizaciones como Mozilla (véase OpenH264 ) y la Free Software Foundation Europe [198] se muestren cautelosas ante los formatos que generan regalías para su uso en Internet. Los formatos competidores destinados a su uso en Internet (VP9 y AV1) tienen como objetivo evitar estas preocupaciones al estar libres de regalías (siempre que no haya reclamaciones de derechos de patente por parte de terceros).
^i : Independientemente de cómo esté licenciado el software por parte de los autores del software (ver licencia de software ), si lo que hace está patentado, su uso sigue estando sujeto a los derechos de los titulares de las patentes a menos que el uso de las patentes haya sido autorizado por una licencia.
En octubre de 2015, MPEG y VCEG formaron el Equipo Conjunto de Exploración de Vídeo (JVET) [199] para evaluar las tecnologías de compresión disponibles y estudiar los requisitos para un estándar de compresión de vídeo de próxima generación. El nuevo algoritmo debería tener una tasa de compresión entre un 30 y un 50 % mejor para la misma calidad perceptual, con soporte para compresión sin pérdida y sin pérdida subjetiva. También debería admitir YCbCr 4:4:4, 4:2:2 y 4:2:0 con 10 a 16 bits por componente, amplia gama de colores BT.2100 y alto rango dinámico (HDR) de más de 16 pasos (con brillo máximo de 1000, 4000 y 10 000 nits), canales auxiliares (para profundidad, transparencia, etc.), velocidades de cuadro variables y fraccionarias de 0 a 120 Hz, codificación de video escalable para diferencias temporales (velocidad de cuadros), espaciales (resolución), SNR, gama de colores y rango dinámico, codificación estéreo/multivista, formatos panorámicos y codificación de imágenes fijas. Se espera una complejidad de codificación 10 veces mayor que la de HEVC. JVET emitió una "Convocatoria de propuestas" final en octubre de 2017, y el primer borrador de trabajo del estándar de codificación de video versátil (VVC) se publicó en abril de 2018. [200] [201] El estándar VVC se finalizó el 6 de julio de 2020. [202]
{{cite web}}
: CS1 maint: multiple names: authors list (link){{cite web}}
: CS1 maint: multiple names: authors list (link)Como no lo han hecho, muchos productores suponen que el fondo impondrá regalías por contenido.
Varias empresas importantes con patentes de HEVC aún no se han unido a uno de los consorcios de patentes. (…) Para acelerar la adopción de HEVC, propongo que los licenciantes de patentes de HEVC acepten los siguientes principios: · La decodificación de software en dispositivos de consumo debe estar libre de regalías. · La codificación de software en dispositivos de consumo debe estar libre de regalías. · La distribución de contenido debe estar libre de regalías.
Las transformaciones son idénticas a H.265/HEVC (Cisco IPR).