Rec. 709 , también conocida como Rec.709 , BT.709 e ITU 709 , es una norma desarrollada por la UIT-R para la codificación de imágenes y características de señales de televisión de alta definición .
La versión más reciente es BT.709-6, lanzada en 2015. BT.709-6 define las características de la imagen como una relación de aspecto ( pantalla ancha ) de 16:9, 1080 líneas activas por imagen, 1920 muestras por línea y una relación de aspecto de píxeles cuadrados.
La primera versión de la norma fue aprobada por el CCIR como Rec.709 en 1990 (también hubo la Rec. CCIR XA/11 MOD F [4] en 1989), con el objetivo declarado de una norma mundial de HDTV. La UIT reemplazó al CCIR en 1992 y posteriormente publicó la BT.709-1 en noviembre de 1993. [2] Estas primeras versiones aún dejaban muchas preguntas sin respuesta y la falta de consenso hacia una norma mundial de HDTV era evidente. Tanto es así que algunos de los primeros sistemas de HDTV como 1035i30 y 1152i25 todavía formaban parte de la norma en 2002 en BT.709-5. [5]
La norma está disponible gratuitamente en el sitio web de la UIT y ese documento debe utilizarse como referencia autorizada. A continuación se resumen los aspectos esenciales.
La Recomendación UIT-R BT.709-6 define un formato de imagen común (CIF) en el que las características de la imagen son independientes de la velocidad de cuadros. La imagen tiene 1920 x 1080 píxeles, lo que supone un recuento total de 2.073.600 píxeles. [6]
Las versiones anteriores de BT.709 incluían sistemas antiguos como los sistemas HDTV 1035i30 y 1152i25. Estos sistemas ya están obsoletos y han sido reemplazados por el sistema definido en 2015 ITU BT.709-6.
BT.709 ofrece una variedad de velocidades de cuadro y esquemas de escaneo, lo que junto con la separación del tamaño de la imagen de la velocidad de cuadro ha proporcionado la flexibilidad para que BT.709 se convierta en el estándar mundial para HDTV. Esto permite a los fabricantes crear un único televisor o pantalla para todos los mercados del mundo.
BT.709-6 especifica las siguientes velocidades de cuadro, donde P indica un cuadro escaneado progresivamente , PsF indica cuadros segmentados progresivos e I indica entrelazado :
Según BT.709, las cámaras pueden capturar en formato progresivo o entrelazado. El video capturado en formato progresivo se puede grabar, transmitir o transmitir en formato progresivo o como fotograma segmentado progresivo (PsF). El video capturado en modo entrelazado se debe distribuir en formato entrelazado a menos que se aplique un proceso de desentrelazado en la posproducción.
En los casos en que una imagen capturada progresiva se distribuye en modo de cuadro segmentado, la frecuencia de segmento/campo debe ser el doble de la frecuencia de cuadro. Por lo tanto, 30/PsF tiene la misma frecuencia de campo que 60/I.
Obsérvese que el rojo, el azul y la y G son los mismos que los primarios de EBU Tech 3213 (PAL), mientras que la x G está a medio camino entre la x G de EBU Tech 3213 y la x G de SMPTE C (PAL y NTSC son dos tipos de BT.601-6 ). En la cobertura del espacio de color CIE 1931, el espacio de color Rec. 709 (y el espacio de color sRGB derivado ) es casi idéntico a Rec. 601 y cubre el 35,9 %. [8] También cubre el 33,24 % de CIE 1976 u'v' [9] [10] y el 33,5 % de CIE 1931 xy. [10] El punto blanco es D 65 como se especifica en el observador estándar de 2° .
La Rec. 709 especifica una OETF ( función de transferencia optoeléctrica ) no lineal que se conoce como " gamma de cámara " y que describe cómo la cámara HDTV codifica la luz de la escena lineal en un valor de señal eléctrica no lineal. La Rec. 709 no especifica la EOTF ( función de transferencia electroóptica ) de pantalla que describe cómo las pantallas HDTV deben convertir la señal eléctrica no lineal en luz mostrada lineal, que se realizó en la ITU-R BT.1886 . Consulte la ITU-R BT.2087 para obtener una descripción detallada de las opciones para la conversión de color de la Rec. 709 a la Rec. 2020 .
La OETF de la Rec. 709 es la siguiente, cercana a 1/1,9 – 1/2,0 gamma pura: [11]
dónde
El OETF de Rec. 709 es lineal en la parte inferior y luego una función de potencia con un gamma de 0,45 para el resto del rango. El OETF general se aproxima a una función de potencia pura con un gamma de 0,50 a 0,53 (aproximadamente 1/1,9 a 1/2,0). El uso de cualquier gamma pura como OETF es imposible, porque la compresión en valores no lineales eliminará muchas sombras inmediatamente cercanas al negro, y la ganancia infinita (pendiente) cerca de cero enfatiza mucho el ruido de la cámara. [14] Por lo tanto, se inventó un segmento lineal y se ha utilizado un gamma de 0,45 para el segmento de potencia. Los CRT antiguos tenían un EOTF de alrededor de 2,35 gamma pura [15] y, por lo tanto, la corrección correspondiente de 709 OETF para obtener una imagen lineal EOTF (si se asume el gamma de extremo a extremo de 1,2) era un gamma puro de 1,2 / 2,35 = 0,51 = 1/1,9608. Apple lo utilizó de esa manera hasta que aparecieron los dispositivos Display P3. [ cita requerida ]
En la práctica de producción típica, la función de codificación de fuentes de imagen (OETF) se ajusta de modo que la imagen final tenga el aspecto estético deseado, tal como se ve en un monitor de referencia con una gamma de 2,4 (según ITU-R BT.1886 ) en un entorno de visualización de referencia con poca luz (según ITU-R Rec. BT.2035 es de 10 lux de D 65 o D 93 en Japón). [16] [17] [18]
Rec. 709 OETF inversa describe la conversión del valor de la señal eléctrica no lineal en la luminancia de la escena lineal. Es como sigue:
La EOTF de visualización de HDTV (a veces denominada "gamma de visualización") no es la inversa de la OETF de la cámara. [19] La EOTF no se especifica en la Rec. 709. Se analiza en EBU Tech 3320 y se especifica en ITU-R BT.1886 como una gamma equivalente de 2,4, que se desvía de ella en la región negra dependiendo de qué tan profundo sea el negro. [20] [21] Esta es una gamma más alta que la gamma aproximadamente 2,0 de la OETF de Rec. 709. La gamma del sistema de extremo a extremo ( OOTF ) resultante del sistema de televisión HD es de aproximadamente 1,2 y se ha diseñado deliberadamente para proporcionar compensación por el efecto de entorno oscuro . [19]
Rec. 709 y sRGB comparten las mismas cromaticidades primarias y cromaticidad de punto blanco; sin embargo, sRGB se emite (visualiza) explícitamente con una gamma equivalente de 2,2 (la función real también es por partes para evitar problemas de negro cercano). [22] La pantalla P3 usa sRGB EOTF con su segmento lineal, se necesita un cambio de ese segmento de 709 ya sea usando la codificación de curva paramétrica de ICC v4 o usando el límite de pendiente.
Rec. 709 define una codificación R'G'B' y una codificación Y'C B C R , cada una con 8 bits o 10 bits por muestra en cada canal de color. En la codificación de 8 bits, los canales R' , B' , G' e Y' tienen un rango nominal de [16..235], y los canales C B y C R tienen un rango nominal de [16..240] con 128 como valor neutro. Por lo tanto, en un rango limitado, el negro de referencia R'G'B' es (16, 16, 16) y el blanco de referencia es (235, 235, 235), y en Y'C B C R el negro de referencia es (16, 128, 128) y el blanco de referencia es (235, 128, 128). Se permiten valores fuera de los rangos nominales, pero normalmente se limitarían para transmisión o visualización (excepto para Superwhite y xvYCC ). Los valores 0 y 255 están reservados como referencias de tiempo (SAV y EAV), y no pueden contener datos de color (para 8 bits, para 10 bits se reservan más valores y para 12 bits aún más, no se reservan valores en archivos o modo RGB o modos digitales YCbCr de rango completo como sYCC u opYCC ). La codificación de 10 bits de Rec. 709 usa valores nominales cuatro veces mayores que los de la codificación de 8 bits, para facilitar la conversión usa un relleno simple para los valores de referencia, por ejemplo 240 se rellena simplemente con dos ceros finales y da 960 para un croma máximo de 10 bits. [23] Los rangos nominales de Rec. 709 son los mismos que los definidos en ITU Rec. 601. [ 24]
La conversión entre diferentes estándares de frecuencias de cuadros de vídeo y codificación de color siempre ha sido un desafío para los productores de contenido que distribuyen en regiones con diferentes estándares y requisitos. Si bien BT.709 ha aliviado el problema de compatibilidad en términos del consumidor y el fabricante de televisores, las instalaciones de transmisión aún utilizan una frecuencia de cuadros particular según la región, como 29,97 en América del Norte o 25 en Europa, lo que significa que el contenido de transmisión aún requiere al menos una conversión de frecuencia de cuadros.
La amplia biblioteca de programas y contenidos de definición estándar presenta más desafíos. NTSC , PAL y SECAM son formatos entrelazados con una relación de aspecto de 4:3 y una resolución relativamente baja. Escalarlos a una resolución HD con una relación de aspecto de 16:9 presenta una serie de desafíos.
En primer lugar, está la posibilidad de que se produzcan artefactos de movimiento que distraigan debido al contenido de vídeo entrelazado. La solución es convertir únicamente a un formato entrelazado BT.709 a la misma velocidad de campo y escalar los campos de forma independiente, o utilizar el procesamiento de movimiento para eliminar el movimiento entre campos y desentrelazar , creando fotogramas progresivos. En el último caso, el procesamiento de movimiento puede introducir artefactos y puede ser lento de procesar.
En segundo lugar, está la cuestión de adaptar la relación de aspecto SD 4:3 al marco HD 16:9. Recortar la parte superior o inferior del marco de definición estándar puede funcionar o no, dependiendo de si la composición lo permite y si hay gráficos o títulos que se cortarían. Alternativamente, el formato pillar-boxing puede mostrar toda la imagen 4:3 dejando bordes negros a la izquierda y a la derecha. A veces, este negro se rellena con una forma estirada y borrosa de la imagen.
Además, los primarios SMPTE C RGB utilizados en la definición estándar de América del Norte son diferentes a los de BT.709 (SMPTE C se conoce comúnmente como NTSC, sin embargo, es un conjunto diferente de primarios y un punto blanco diferente al NTSC de 1953 [25] ). Los primarios rojo y azul para PAL y SECAM son los mismos que BT.709, con un cambio en el primario verde. Convertir la imagen con precisión requiere una LUT (tabla de búsqueda) o un flujo de trabajo administrado por color para convertir los colores al nuevo espacio de color. [26] Sin embargo, en la práctica esto a menudo se ignora, excepto en mpv, porque incluso si el reproductor tiene administración de color (la mayoría de ellos no lo tienen, incluido VLC), solo puede ver primarios BT.709 o BT.2020.
Al codificar video Y'C B C R , BT.709 crea luma codificado en gamma ( Y' ) utilizando coeficientes de matriz 0,2126, 0,7152 y 0,0722 (juntos suman 1). BT.709-1 utilizó coeficientes ligeramente diferentes 0,2125, 0,7154, 0,0721 (cambiados a los estándar en BT.709-2). Aunque se logró un acuerdo mundial sobre un único sistema R'G'B' con Rec. 709, la adopción de diferentes coeficientes de luma (ya que se derivan de los primarios y el punto blanco [27] ) para Y'C B C R requiere el uso de una decodificación luma-croma diferente para la definición estándar y la alta definición. [28]
Estos problemas se pueden solucionar con software de procesamiento de vídeo, que puede ser lento, o con soluciones de hardware [29] que permiten la conversión en tiempo real y, a menudo, con mejoras de calidad.
Una solución más ideal es volver a los elementos cinematográficos originales para los proyectos que se originaron en película. Debido a los problemas heredados de la distribución internacional, muchos programas de televisión que se filmaron en película utilizaron un proceso de corte de negativos tradicional y luego tenían un único master de película que podía telecinearse para diferentes formatos. Estos proyectos pueden volver a telecinear sus masters negativos cortados a un master BT.709 a un costo razonable y obtener el beneficio de la resolución completa de la película.
Por otra parte, en el caso de proyectos que se originaron en película, pero que se completaron con métodos de video en línea, sería necesario volver a telecinemar las tomas individuales de la película y luego volver a ensamblarlas, lo que requiere una cantidad significativamente mayor de mano de obra y tiempo de máquina, en comparación con un telecine para un negativo conformado. En este caso, disfrutar de los beneficios del original en película implicaría costos mucho más altos para conformar los originales de la película a un nuevo master HD.
sRGB se creó después del desarrollo inicial de Rec.709. Los creadores de sRGB decidieron utilizar los mismos colores primarios y el mismo punto blanco que Rec.709, pero cambiaron la curva de respuesta tonal (a veces denominada gamma ) para que se adaptara mejor al uso previsto en oficinas y en condiciones más luminosas que las de ver televisión en una sala de estar oscura. [ cita requerida ]
-6
es la versión actual; las versiones anteriores se -1
extendieron hasta -5
.