stringtranslate.com

Submuestreo de croma

Formatos de submuestreo de croma ampliamente utilizados

El submuestreo de croma es la práctica de codificar imágenes implementando menos resolución para la información de croma que para la información de luma , aprovechando la menor agudeza del sistema visual humano para las diferencias de color que para la luminancia. [1]

Se utiliza en muchos esquemas de codificación de vídeos e imágenes fijas, tanto analógicos como digitales, incluida la codificación JPEG .

Razón fundamental

En tamaño completo, esta imagen muestra la diferencia entre cuatro esquemas de submuestreo. Observe lo similares que aparecen las imágenes en color. La fila inferior muestra la resolución de la información de color.

Las señales digitales suelen comprimirse para reducir el tamaño del archivo y ahorrar tiempo de transmisión. Dado que el sistema visual humano es mucho más sensible a las variaciones de brillo que de color, un sistema de vídeo se puede optimizar dedicando más ancho de banda al componente luma (normalmente denominado Y') que a los componentes de diferencia de color Cb y Cr . En imágenes comprimidas, por ejemplo, el esquema 4:2:2 Y'CbCr requiere dos tercios del ancho de banda del R'G'B' "4:4:4" no submuestreado . [a] Esta reducción no produce casi ninguna diferencia visual tal como la percibe el espectador.

Cómo funciona el submuestreo

El sistema de visión humana (HVS) procesa la información del color, es decir, el tono y el colorido , a aproximadamente un tercio de la resolución de la luminancia , es decir, la información de claridad/oscuridad de una imagen. Por lo tanto, es posible muestrear información de color a una resolución más baja manteniendo una buena calidad de imagen.

Esto se logra codificando datos de imágenes RGB en una imagen compuesta en blanco y negro , con datos de diferencia de color separados ( croma ). Por ejemplo, con , los componentes codificados con gamma se ponderan y luego se suman para crear el componente luma . Los componentes de diferencia de color se crean restando dos de los componentes ponderados del tercero. Se pueden utilizar diversos métodos de filtrado para limitar la resolución.

Respecto a las funciones gamma y de transferencia

La luma codificada con gamma no debe confundirse con la luminancia lineal . La presencia de codificación gamma se indica con el símbolo primo . En los primeros sistemas de vídeo, la corrección gamma era necesaria debido a la respuesta no lineal de un tubo de rayos catódicos (CRT).

Si bien los CRT ya no se utilizan ampliamente, las curvas de transferencia gamma o electroópticas (EOTF) siguen siendo muy útiles debido a la respuesta no lineal de la visión humana. El uso de gamma mejora la relación señal-ruido percibida en sistemas analógicos y permite una codificación de datos más eficiente en sistemas digitales. Esta codificación utiliza más niveles para los colores más oscuros que para los más claros, acomodándose a la sensibilidad de la visión humana. [2]

Sistemas y proporciones de muestreo.

El esquema de submuestreo se expresa comúnmente como una relación de tres partes J : a : b (por ejemplo, 4:2:2) o cuatro partes, si hay un canal alfa presente (por ejemplo, 4:2:2:4), que describen el número de muestras de luminancia y crominancia en una región conceptual de J píxeles de ancho y 2 píxeles de alto. Las partes son (en su respectivo orden):

Esta notación no es válida para todas las combinaciones y tiene excepciones, por ejemplo, 4:1:0 (donde la altura de la región no es de 2 píxeles, sino de 4 píxeles, por lo que si se utilizan 8 bits por componente, los medios serían 9 bits por componente). píxeles) y 4:2:1.

Los ejemplos de mapeo dados son sólo teóricos y con fines ilustrativos. Además, el diagrama no indica ningún filtrado de croma, que debería aplicarse para evitar el alias . Para calcular el factor de ancho de banda requerido en relación con 4:4:4 (o 4:4:4:4), es necesario sumar todos los factores y dividir el resultado por 12 (o 16, si alfa está presente).

Tipos de muestreo y submuestreo

4:4:4

Cada uno de los tres componentes de Y'CbCr tiene la misma frecuencia de muestreo, por lo que no hay submuestreo de croma. Este esquema se utiliza a veces en escáneres de películas de alta gama y en postproducción cinematográfica.

En cambio, "4:4:4" puede estar refiriéndose erróneamente al espacio de color R'G'B' , que implícitamente tampoco tiene ningún submuestreo de croma (excepto en JPEG, R'G'B' puede ser submuestreado). Formatos como HDCAM SR pueden grabar 4:4:4 R'G'B' a través de HD-SDI de doble enlace .

4:2:2

Los dos componentes cromáticos se muestrean a la mitad de la frecuencia de muestreo horizontal de luma: la resolución cromática horizontal se reduce a la mitad. Esto reduce el ancho de banda de una señal de vídeo sin comprimir en un tercio, lo que significa que para 8 bits por componente sin alfa (24 bits por píxel) sólo 16 bits son suficientes, como en NV16.

Muchos formatos e interfaces de vídeo digital de alta gama utilizan este esquema:

4:1:1

En el submuestreo de croma 4:1:1, la resolución de color horizontal se reduce a un cuarto y el ancho de banda se reduce a la mitad en comparación con ningún submuestreo de croma. Inicialmente, el submuestreo de croma 4:1:1 del formato DV no se consideraba calidad de transmisión y solo era aceptable para aplicaciones de consumo y de gama baja. [3] [4] Sin embargo, los formatos basados ​​en DV (algunos de los cuales utilizan submuestreo de croma 4:1:1) se han utilizado profesionalmente en la recopilación de noticias electrónicas y en servidores de emisión. DV también se ha utilizado esporádicamente en largometrajes y en cinematografía digital .

En el sistema 480i "NTSC", si la luma se muestrea a 13,5 MHz, esto significa que las señales Cr y Cb se muestrearán cada una a 3,375 MHz, lo que corresponde a un ancho de banda Nyquist máximo de 1,6875 MHz, mientras que el sistema "alta-alta" tradicional El codificador NTSC analógico de transmisión final " tendría un ancho de banda Nyquist de 1,5 MHz y 0,5 MHz para los canales I/Q . Sin embargo, en la mayoría de los equipos, especialmente en televisores baratos y VCR VHS / Betamax , los canales croma tienen sólo el ancho de banda de 0,5 MHz tanto para Cr como para Cb (o equivalentemente para I/Q). Por lo tanto, el sistema DV en realidad proporciona un ancho de banda de color superior en comparación con las mejores especificaciones analógicas compuestas para NTSC, a pesar de tener sólo 1/4 del ancho de banda cromático de una señal digital "completa".

Los formatos que utilizan submuestreo de croma 4:1:1 incluyen:

4:2:0

En 4:2:0, el muestreo horizontal se duplica en comparación con 4:1:1, pero como los canales Cb y Cr solo se muestrean en cada línea alternativa en este esquema, la resolución vertical se reduce a la mitad. Por tanto, la velocidad de datos es la misma. Esto encaja razonablemente bien con el sistema de codificación de color PAL , ya que tiene sólo la mitad de la resolución de crominancia vertical de NTSC . También encajaría muy bien con el sistema de codificación de colores SECAM , ya que al igual que ese formato, 4:2:0 sólo almacena y transmite un canal de color por línea (el otro canal se recupera de la línea anterior). Sin embargo, en realidad se han producido pocos equipos que emitan una señal de vídeo analógica SECAM. En general, los territorios SECAM tienen que utilizar una pantalla compatible con PAL o un transcodificador para convertir la señal PAL a SECAM para su visualización.

Se encuentran diferentes variantes de configuraciones cromáticas 4:2:0 en:

Cb y Cr se submuestrean cada uno en un factor de 2 tanto horizontal como verticalmente. La mayoría de los formatos de vídeo digital correspondientes a 576i "PAL" utilizan submuestreo de croma 4:2:0.

Posiciones de muestreo

Hay cuatro variantes principales de esquemas 4:2:0, que tienen diferentes ubicaciones de muestreo horizontal y vertical en relación con el "cuadrado" de 2 × 2 del tamaño de entrada original. [15]

Entrelazado y progresivo

Con material entrelazado , el submuestreo de croma 4:2:0 puede provocar artefactos de movimiento si se implementa de la misma manera que con el material progresivo. Las muestras de luma se derivan de intervalos de tiempo separados, mientras que las muestras de croma se derivarían de ambos intervalos de tiempo. Es esta diferencia la que puede provocar artefactos de movimiento. El estándar MPEG-2 permite un esquema de muestreo entrelazado alternativo, donde se aplica 4:2:0 a cada campo (no a ambos campos a la vez). Esto resuelve el problema de los artefactos de movimiento, reduce la resolución cromática vertical a la mitad y puede introducir artefactos en forma de peine en la imagen.


Original. Esta imagen muestra un solo campo. El texto en movimiento tiene algo de desenfoque de movimiento aplicado.


Muestreo progresivo 4:2:0 aplicado al material entrelazado en movimiento. El croma guía y sigue al texto en movimiento. Esta imagen muestra un solo campo.


Muestreo entrelazado 4:2:0 aplicado a material entrelazado en movimiento . Esta imagen muestra un solo campo.

Sin embargo, en el esquema entrelazado 4:2:0, la resolución vertical del croma se reduce aproximadamente a la mitad, ya que las muestras de croma describen efectivamente un área de 2 muestras de ancho por 4 muestras de alto en lugar de 2×2. Además, el desplazamiento espacial entre ambos campos puede dar lugar a la aparición de artefactos cromáticos en forma de peine.


Imagen fija original.


Muestreo progresivo 4:2:0 aplicado a una imagen fija. Se muestran ambos campos.


Muestreo entrelazado 4:2:0 aplicado a una imagen fija. Se muestran ambos campos.

Si se va a desentrelazar el material entrelazado, los artefactos cromáticos en forma de peine (del muestreo entrelazado 4:2:0) se pueden eliminar difuminando el croma verticalmente. [18]

4:1:0

Esta relación es posible y algunos códecs la admiten, pero no se utiliza mucho. Esta relación utiliza la mitad de las resoluciones de color vertical y un cuarto de la horizontal, con sólo un octavo del ancho de banda de las resoluciones de color máximas utilizadas. El vídeo sin comprimir en este formato con cuantificación de 8 bits utiliza 10 bytes por cada macropíxel (que son 4×2 píxeles) o 10 bits por cada píxel. Tiene el ancho de banda de crominancia equivalente a una señal PAL-I o PAL-M decodificada con un decodificador de línea de retardo y aún muy superior a NTSC.

3:1:1

Utilizado por Sony en sus grabadoras HDCAM de alta definición (no HDCAM SR). En la dimensión horizontal, el luma se muestrea horizontalmente a tres cuartos de la frecuencia de muestreo en Full HD: 1440 muestras por fila en lugar de 1920. El croma se muestrea a 480 muestras por fila, un tercio de la frecuencia de muestreo de luma. En la dimensión vertical, tanto el luma como el croma se muestrean a la frecuencia de muestreo Full HD (1080 muestras verticalmente).

Diferentes tasas de Cb y Cr

Varios esquemas heredados permiten diferentes factores de submuestreo en Cb y Cr, de manera similar a cómo se asigna una cantidad diferente de ancho de banda a los dos valores de croma en sistemas de transmisión como el Sistema M del CCIR . Estos esquemas no se pueden expresar en notación J:a:b . En su lugar, adoptan una notación Y:Cb:Cr , y cada parte describe la cantidad de resolución del componente correspondiente. No se especifica si la reducción de la resolución se produce en dirección horizontal o vertical.

Artefactos

Note el sangrado en la luminosidad cerca de los bordes.

El submuestreo de croma sufre dos tipos principales de artefactos, lo que provoca una degradación más notable de lo previsto cuando los colores cambian abruptamente.

Error de luminancia gamma

Las señales con corrección gamma como Y'CbCr tienen un problema en el que los errores de croma "sangran" en la luma. En esas señales, una croma baja en realidad hace que un color parezca menos brillante que uno con luma equivalente. Como resultado, cuando un color saturado se mezcla con un color insaturado o complementario, se produce una pérdida de luminancia en el borde. Esto se puede ver en el ejemplo entre magenta y verde. [20] Este problema persiste en el vídeo HDR donde la gamma se generaliza en una función de transferencia " EOTF ". Un EOTF más pronunciado muestra una mayor pérdida de luminancia. [21]

Algunas correcciones propuestas de este problema son:

Rec. 2020 define una "luminancia constante" Yc'CbcCrc, que se calcula a partir de componentes RGB lineales y luego se codifica con gamma. Esta versión no sufre pérdida de luminancia por diseño. [25]

Recorte de gama

Otro defecto que puede ocurrir con el submuestreo de croma es que pueden aparecer colores fuera de gama durante la reconstrucción de croma. Supongamos que la imagen constaba de líneas rojas y negras de 1 píxel alternadas y el submuestreo omitió el croma de los píxeles negros. El croma de los píxeles rojos se reconstruirá en los píxeles negros, lo que hará que los nuevos píxeles tengan valores rojos positivos y verdes y azules negativos . Como las pantallas no pueden emitir luz negativa (la luz negativa no existe), estos valores negativos se recortarán efectivamente y el valor de luma resultante será demasiado alto. Otros filtros de submuestreo (especialmente el "cuadro" de promedio) tienen un problema similar del que es más difícil crear un ejemplo simple. Surgen artefactos similares en el ejemplo menos artificial de gradación cerca de un límite rojo/negro bastante definido. [20]

Es posible que el decodificador pueda manejar colores fuera de gama considerando cuánto croma puede contener un valor de luma determinado y distribuirlo en el intermedio 4:4:4 en consecuencia, lo que Glenn Chan denomina "reconstrucción de croma dentro del rango". . El método de "proporción" es similar en espíritu al promedio ponderado luma de Kornelski, mientras que el método de "derrame" se parece a la difusión de errores . [20] La mejora de la reconstrucción cromática sigue siendo un campo activo de investigación. [26]

Terminología

El término Y'UV se refiere a un esquema de codificación de televisión analógica (Rec. UIT-R BT.470), mientras que Y'CbCr se refiere a un esquema de codificación digital. [2] Una diferencia entre los dos es que los factores de escala de los componentes cromáticos (U, V, Cb y Cr) son diferentes. Sin embargo, el término YUV se utiliza a menudo erróneamente para referirse a la codificación Y'CbCr. Por lo tanto, expresiones como "4:2:2 YUV" siempre se refieren a 4:2:2 Y'CbCr, ya que simplemente no existe 4:x:x en codificación analógica (como YUV). Los formatos de píxeles utilizados en Y'CbCr también pueden denominarse YUV, por ejemplo, yuv420p, yuvj420p y muchos otros.

De manera similar, el término luminancia y el símbolo Y a menudo se usan erróneamente para referirse a la luma, que se denota con el símbolo Y'. La luminancia (Y') de la ingeniería de vídeo se desvía de la luminancia (Y) de la ciencia del color (según la define CIE ). Luma se forma como la suma ponderada de componentes RGB corregidos con gamma (trestímulo). La luminancia se forma como una suma ponderada de componentes RGB lineales (trestímulo). En la práctica, el símbolo CIE Y a menudo se utiliza incorrectamente para indicar luma. En 1993, la SMPTE adoptó la Guía de Ingeniería EG 28, aclarando los dos términos. El símbolo primo ' se utiliza para indicar la corrección gamma. [27]

De manera similar, la crominancia de la ingeniería de vídeo difiere de la crominancia de la ciencia del color. El croma de la ingeniería de vídeo se forma a partir de componentes triestímulo ponderados (corregido con gamma, OETF), no de componentes lineales. En la práctica de la ingeniería de vídeo, los términos croma , crominancia y saturación se utilizan a menudo indistintamente para referirse al croma, pero no es una buena práctica, como dice la Rec. UIT-T H.273. [28]

Historia

El submuestreo de croma fue desarrollado en la década de 1950 por Alda Bedford para el desarrollo de la televisión en color por parte de RCA , que se convirtió en el estándar NTSC ; La separación luma-croma fue desarrollada anteriormente, en 1938, por Georges Valensi . A través de estudios [ ¿cuáles? ] , demostró que el ojo humano tiene alta resolución sólo para el blanco y negro, algo menos para los colores de "rango medio" como amarillos y verdes, y mucho menos para los colores del extremo del espectro, rojos y azules. [ se necesita aclaración ] el conocimiento permitió a RCA desarrollar un sistema en el que descartaron la mayor parte de la señal azul después de que proviene de la cámara, manteniendo la mayor parte de la verde y solo una parte de la roja; esto es un submuestreo de croma en el espacio de color YIQ y es más o menos análogo al submuestreo 4:2:1, en el sentido de que tiene una resolución decreciente para luma, amarillo/verde y rojo/azul.

Ver también

Referencias

  1. ^ Los signos principales indican corrección gamma o cualquier EOTF no lineal.
  1. ^ S. Winkler, CJ van den Branden Lambrecht y M. Kunt (2001). "Visión y Vídeo: Modelos y Aplicaciones". En Christian J. van den Branden Lambrecht (ed.). Modelos de visión y aplicaciones al procesamiento de imágenes y vídeo . Saltador. pag. 209.ISBN 978-0-7923-7422-0.{{cite book}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
  2. ^ ab Poynton, Charles. "YUV y luminancia considerados dañinos: un llamado a favor de una terminología precisa en el video".
  3. ^ Jennings, Roger; Bertel Schmitt (1997). "DV frente a Betacam SP". Central DV . Archivado desde el original el 2 de julio de 2008 . Consultado el 29 de agosto de 2008 .
  4. ^ Wilt, Adam J. (2006). "Formatos DV, DVCAM y DVCPRO". adamwilt.com . Consultado el 29 de agosto de 2008 .
  5. ^ Clint DeBoer (16 de abril de 2008). "Niveles de negro mejorados HDMI, xvYCC y RGB". Audioadictos . Consultado el 2 de junio de 2013 .
  6. ^ "Codificación de colores digitales" (PDF) . Telairidad. Archivado desde el original (PDF) el 7 de enero de 2014 . Consultado el 2 de junio de 2013 .
  7. ^ Corporación de licencias MSX (2022). "Los modos de pantalla YJK". Página de ensamblaje de MSX .
  8. ^ Niemietz, Ricardo Cancho (2014). Problemas con el modelo de color YJK implementado en el chip VDP V9958 de Yamaha (PDF) .
  9. ^ "VCFe Vortrag vom 2016.04.30 - Homecomputer und Spielkonsolen - Videoarchitekturen als visuelles Medium". neil.franklin.ch . Consultado el 13 de noviembre de 2022 .
  10. ^ Maestro IC. Publicaciones técnicas unidas. 2001.
  11. ^ Martín Sesma, Sergio (3 de octubre de 2016). Arqueología informática: los ordenadores MSX en los inicios de la microinformática doméstica (Proyecto/Trabajo fin de carrera/grado thesis). Universitat Politècnica de València.
  12. ^ Redacción (20 de octubre de 2008). "MSX - Vari Costruttori- 1983". CyberLudus.com (en italiano) . Consultado el 13 de noviembre de 2022 .
  13. «LIBRO DE DATOS TÉCNICOS V9958 MSX-VIDEO» (PDF) . 1988.
  14. ^ Alex, Wulms (1995). "Schermen op MSX - De 2+ schermen" (PDF) . Revista MSX Computer & Club (72).
  15. ^ Poynton, Charles (2008). "Notación de submuestreo cromático" (PDF) . Poynton.com . Consultado el 1 de octubre de 2008 .
  16. ^ abcd enumeración AvChromaLocation, ffmpeg 3.1.
  17. ^ "y4minput.c - webm/libvpx - Git en Google". cromo.googlesource.com . Las muestras de croma de 420paldv se ubican como:
  18. ^ Munsil, Don; Stacey Spears (2003). "Parámetro comparativo del reproductor de DVD: error de muestreo mejorado de croma". Secretos del cine en casa y la alta fidelidad . Archivado desde el original el 6 de junio de 2008 . Consultado el 29 de agosto de 2008 .
  19. ^ "Admite la decodificación de imágenes jpeg yuv442 y yuv421. · FFmpeg/FFmpeg@387d860". GitHub .
  20. ^ abc Chan, Glenn (mayo de 2008). "Hacia un mejor submuestreo de croma: ganador del premio SMPTE Student Paper Award 2007". Revista de imágenes en movimiento SMPTE . 117 (4): 39–45. doi : 10.5594/J15100 .
  21. ^ ab Larbier, Pierre (octubre de 2015). "Alto rango dinámico: desafíos de compresión". Exposición y conferencia técnica anual SMPTE 2015 : 1–15. doi :10.5594/M001639. ISBN 978-1-61482-956-0.
  22. ^ "Submuestreo de croma con corrección gamma · Número 193 · mozilla/mozjpeg". GitHub .
  23. ^ "WebP: Sharpyuv/sharpyuv.h | Fossies". fossies.org . Se supone que la imagen se muestreará mediante un filtro bilineal. Si en su lugar se utiliza el vecino más cercano, la imagen aumentada podría verse peor que con la reducción de resolución estándar.
  24. ^ Norkin, Andrey (27 de septiembre de 2016). Conversión de color HDR con diferentes métricas de distorsión (PDF) . SPIE Ingeniería Óptica + Aplicaciones, 2016. págs. 99710E. doi :10.1117/12.2237040.
  25. ^ "BT.2020: Valores de parámetros para sistemas de televisión de ultra alta definición para producción e intercambio internacional de programas". Unión Internacional de Telecomunicaciones . 2014-07-17 . Consultado el 31 de agosto de 2014 .
  26. ^ Chung, Kuo-Liang; Liang, Yan-Cheng; Wang, Ching-Sheng (marzo de 2019). "Método eficaz de reconstrucción de croma según el contenido para imágenes de contenido de pantalla". Transacciones IEEE sobre procesamiento de imágenes . 28 (3): 1108-1117. Código Bib : 2019ITIP...28.1108C. doi :10.1109/TIP.2018.2875340. PMID  30307864. S2CID  52964340.
  27. ^ "EG 28:1993 - Directriz de ingeniería SMPTE - Glosario comentado de términos esenciales para la producción electrónica | Estándar SMPTE | IEEE Xplore". doi :10.5594/SMPTE.EG28.1993. luma: Para evitar la confusión interdisciplinaria resultante de las dos definiciones distintas de luminancia, se ha propuesto que los documentos de vídeo utilicen luma para luminancia, televisión (es decir, la señal de luminancia) y croma para televisión de crominancia (es decir, la señal de crominancia).
  28. ^ "H.273: puntos de código independientes de la codificación para la identificación del tipo de señal de vídeo". www.itu.int . 2016. NOTA – Se utiliza el término croma en lugar del término crominancia para evitar la implicación del uso de características de transferencia de luz lineal que a menudo se asocia con el término crominancia. [...] NOTA – Se utiliza el término luma en lugar del término luminancia para evitar la implicación del uso de características de transferencia de luz lineal que a menudo se asocia con el término luminancia. A veces se utiliza el símbolo L en lugar del símbolo Y para evitar confusión con el símbolo y utilizado para la ubicación vertical.

enlaces externos