stringtranslate.com

Submuestreo de croma

Formatos de submuestreo de croma ampliamente utilizados

El submuestreo de croma es la práctica de codificar imágenes implementando una resolución menor para la información de croma que para la información de luminancia , aprovechando la menor agudeza del sistema visual humano para las diferencias de color que para la luminancia. [1]

Se utiliza en muchos esquemas de codificación de vídeo e imágenes fijas, tanto analógicos como digitales, incluida la codificación JPEG .

Razón fundamental

En tamaño completo, esta imagen muestra la diferencia entre cuatro esquemas de submuestreo. Observe cuán similares son las imágenes en color. La fila inferior muestra la resolución de la información de color.

Las señales digitales suelen comprimirse para reducir el tamaño de los archivos y ahorrar tiempo de transmisión. Dado que el sistema visual humano es mucho más sensible a las variaciones de brillo que de color, se puede optimizar un sistema de vídeo dedicando más ancho de banda al componente de luminancia (normalmente denominado Y') que a los componentes de diferencia de color Cb y Cr . En imágenes comprimidas, por ejemplo, el esquema 4:2:2 Y'CbCr requiere dos tercios del ancho de banda del R'G'B' "4:4:4" no submuestreado . [a] Esta reducción da como resultado que el espectador no perciba prácticamente ninguna diferencia visual.

Cómo funciona el submuestreo

El sistema de visión humana (SVH) procesa la información de color ( tono y colorido ) a aproximadamente un tercio de la resolución de luminancia (información de claridad/oscuridad en una imagen). Por lo tanto, es posible muestrear información de color a una resolución más baja manteniendo una buena calidad de imagen.

Esto se logra codificando los datos de imagen RGB en una imagen compuesta en blanco y negro , con datos de diferencia de color separados ( croma ). Por ejemplo, con , los componentes codificados con gamma se ponderan y luego se suman para crear el componente de luminancia . Los componentes de diferencia de color se crean restando dos de los componentes ponderados del tercero. Se pueden utilizar diversos métodos de filtrado para limitar la resolución.

Respecto a las funciones gamma y de transferencia

La luminancia con codificación gamma no debe confundirse con la luminancia lineal . La presencia de codificación gamma se indica con el símbolo de prima .

Las funciones de transferencia electroóptica (EOTF) correctoras de gamma se utilizan debido a la respuesta no lineal de la visión humana. El uso de gamma mejora la relación señal-ruido percibida en sistemas analógicos y permite una codificación de datos más eficiente en sistemas digitales. Esta codificación utiliza más niveles para los colores más oscuros que para los más claros, lo que se adapta a la sensibilidad de la visión humana. [2]

Sistemas de muestreo y ratios

El esquema de submuestreo se expresa comúnmente como una relación de tres partes J : a : b (por ejemplo, 4:2:2) o cuatro partes, si hay un canal alfa (por ejemplo, 4:2:2:4), que describen la cantidad de muestras de luminancia y crominancia en una región conceptual que tiene J píxeles de ancho y 2 píxeles de alto. Las partes son (en su orden respectivo):

Esta notación no es válida para todas las combinaciones y tiene excepciones, por ejemplo 4:1:0 (donde la altura de la región no es de 2 píxeles, sino de 4 píxeles, por lo que si se utilizan 8 bits por componente, el medio sería de 9 bits por píxel) y 4:2:1.

Los ejemplos de mapeo que se dan son solo teóricos y a modo de ilustración. Además, el diagrama no indica ningún filtrado de croma, que debería aplicarse para evitar el aliasing . Para calcular el factor de ancho de banda requerido en relación con 4:4:4 (o 4:4:4:4), es necesario sumar todos los factores y dividir el resultado por 12 (o 16, si hay alfa).

Tipos de muestreo y submuestreo

4:4:4

Cada uno de los tres componentes Y'CbCr tiene la misma frecuencia de muestreo, por lo que no hay submuestreo de croma. Este esquema se utiliza a veces en escáneres de película de alta gama y en posproducción cinematográfica.

En cambio, "4:4:4" puede referirse erróneamente al espacio de color R'G'B' , que implícitamente tampoco tiene submuestreo de croma (excepto en JPEG, donde R'G'B' puede submuestrearse). Los formatos como HDCAM SR pueden grabar R'G'B' 4:4:4 a través de HD-SDI de doble enlace .

4:2:2

Los dos componentes cromáticos se muestrean a la mitad de la frecuencia de muestreo horizontal de la luma: la resolución cromática horizontal se reduce a la mitad. Esto reduce el ancho de banda de una señal de vídeo sin comprimir en un tercio, lo que significa que para 8 bits por componente sin alfa (24 bits por píxel) solo son suficientes 16 bits, como en NV16.

Muchos formatos e interfaces de vídeo digital de alta gama utilizan este esquema:

4:1:1

En el submuestreo de croma 4:1:1, la resolución de color horizontal se reduce a la cuarta parte y el ancho de banda se reduce a la mitad en comparación con la ausencia de submuestreo de croma. Inicialmente, el submuestreo de croma 4:1:1 del formato DV no se consideraba de calidad de transmisión y solo era aceptable para aplicaciones de gama baja y de consumo. [3] [4] Sin embargo, los formatos basados ​​en DV (algunos de los cuales utilizan submuestreo de croma 4:1:1) se han utilizado profesionalmente en la recopilación electrónica de noticias y en servidores de reproducción. El DV también se ha utilizado esporádicamente en largometrajes y en cinematografía digital .

En el sistema 480i "NTSC", si la luminancia se muestrea a 13,5 MHz, esto significa que las señales Cr y Cb se muestrearán cada una a 3,375 MHz, lo que corresponde a un ancho de banda Nyquist máximo de 1,6875 MHz, mientras que el "codificador analógico NTSC de transmisión de gama alta " tradicional tendría un ancho de banda Nyquist de 1,5 MHz y 0,5 MHz para los canales I/Q . Sin embargo, en la mayoría de los equipos, especialmente los televisores baratos y los VHS / VCR Betamax , los canales de croma tienen solo el ancho de banda de 0,5 MHz para Cr y Cb (o equivalente para I/Q). Por lo tanto, el sistema DV realmente proporciona un ancho de banda de color superior en comparación con las mejores especificaciones analógicas compuestas para NTSC, a pesar de tener solo 1/4 del ancho de banda de croma de una señal digital "completa".

Los formatos que utilizan submuestreo de croma 4:1:1 incluyen:

4:2:0

En 4:2:0, el muestreo horizontal se duplica en comparación con 4:1:1, pero como los canales Cb y Cr solo se muestrean en cada línea alterna en este esquema, la resolución vertical se reduce a la mitad. La velocidad de datos es, por lo tanto, la misma. Esto se ajusta razonablemente bien con el sistema de codificación de color PAL , ya que este tiene solo la mitad de la resolución de crominancia vertical de NTSC . También encajaría muy bien con el sistema de codificación de color SECAM , ya que, al igual que ese formato, 4:2:0 solo almacena y transmite un canal de color por línea (el otro canal se recupera de la línea anterior). Sin embargo, en realidad se ha producido poco equipo que emita una señal de video analógica SECAM. En general, los territorios SECAM tienen que utilizar una pantalla compatible con PAL o un transcodificador para convertir la señal PAL a SECAM para su visualización.

Se encuentran diferentes variantes de configuraciones de croma 4:2:0 en:

Tanto Cb como Cr se submuestrean en un factor de 2, tanto horizontal como verticalmente. La mayoría de los formatos de vídeo digitales correspondientes a 576i "PAL" utilizan submuestreo de croma 4:2:0.

Posiciones de muestreo

Hay cuatro variantes principales de esquemas 4:2:0, que tienen diferentes ubicaciones de muestreo horizontal y vertical en relación con el "cuadrado" 2×2 del tamaño de entrada original. [15]

Entrelazado y progresivo

Con material entrelazado , el submuestreo de croma 4:2:0 puede generar artefactos de movimiento si se implementa de la misma manera que para el material progresivo. Las muestras de luminancia se derivan de intervalos de tiempo separados, mientras que las muestras de croma se derivarían de ambos intervalos de tiempo. Es esta diferencia la que puede generar artefactos de movimiento. El estándar MPEG-2 permite un esquema de muestreo entrelazado alternativo, donde se aplica 4:2:0 a cada campo (no a ambos campos a la vez). Esto resuelve el problema de los artefactos de movimiento, reduce la resolución de croma vertical a la mitad y puede introducir artefactos tipo peine en la imagen.


Original. Esta imagen muestra un solo campo. El texto en movimiento tiene un efecto de desenfoque de movimiento.


Muestreo progresivo 4:2:0 aplicado a material entrelazado en movimiento . El croma precede y sigue al texto en movimiento. Esta imagen muestra un solo campo.


Muestreo entrelazado 4:2:0 aplicado a material entrelazado en movimiento . Esta imagen muestra un solo campo.

Sin embargo, en el esquema entrelazado 4:2:0, la resolución vertical del croma se reduce aproximadamente a la mitad, ya que las muestras de croma describen efectivamente un área de 2 muestras de ancho por 4 muestras de alto en lugar de 2x2. Además, el desplazamiento espacial entre ambos campos puede dar como resultado la aparición de artefactos de croma en forma de peine.


Imagen fija original.


Muestreo progresivo 4:2:0 aplicado a una imagen fija. Se muestran ambos campos.


Muestreo entrelazado 4:2:0 aplicado a una imagen fija. Se muestran ambos campos.

Si se desea desentrelazar el material entrelazado, los artefactos de croma en forma de peine (del muestreo entrelazado 4:2:0) se pueden eliminar difuminando el croma verticalmente. [18]

4:1:0

Esta relación es posible y algunos códecs la admiten, pero no se utiliza ampliamente. Esta relación utiliza la mitad de las resoluciones de color verticales y una cuarta parte de las horizontales, con solo una octava parte del ancho de banda de las resoluciones de color máximas utilizadas. El vídeo sin comprimir en este formato con cuantificación de 8 bits utiliza 10 bytes por cada macropíxel (que son 4×2 píxeles) o 10 bits por cada píxel. Tiene el ancho de banda de crominancia equivalente a una señal PAL-I o PAL-M decodificada con un decodificador de línea de retardo, y sigue siendo muy superior a NTSC.

3:1:1

Utilizado por Sony en sus grabadoras de alta definición HDCAM (no HDCAM SR). En la dimensión horizontal, la luminancia se muestrea horizontalmente a tres cuartas partes de la frecuencia de muestreo Full HD: 1440 muestras por fila en lugar de 1920. El croma se muestrea a 480 muestras por fila, un tercio de la frecuencia de muestreo de luminancia. En la dimensión vertical, tanto la luminancia como el croma se muestrean a la frecuencia de muestreo Full HD (1080 muestras verticalmente).

Diferentes tasas de Cb y Cr

Varios esquemas heredados permiten diferentes factores de submuestreo en Cb y Cr, de manera similar a cómo se asigna una cantidad diferente de ancho de banda a los dos valores de croma en sistemas de transmisión como el CCIR System M. Estos esquemas no se pueden expresar en notación J:a:b . En cambio, adoptan una notación Y:Cb:Cr , en la que cada parte describe la cantidad de resolución para el componente correspondiente. No se especifica si la reducción de resolución ocurre en dirección horizontal o vertical.

Artefactos

Nótese el sangrado en la luminosidad cerca de los bordes.

El submuestreo de croma sufre dos tipos principales de artefactos, que provocan una degradación más notoria de lo previsto cuando los colores cambian abruptamente.

Error de luminancia gamma

Las señales con corrección gamma, como Y'CbCr, tienen un problema en el que los errores de croma se "filtran" hacia la luminancia. En esas señales, una croma baja hace que un color parezca menos brillante que uno con una luminancia equivalente. Como resultado, cuando un color saturado se mezcla con un color no saturado o complementario, se produce una pérdida de luminancia en el borde. Esto se puede ver en el ejemplo entre el magenta y el verde. [20] Este problema persiste en el vídeo HDR, donde la gamma se generaliza en una función de transferencia " EOTF ". Una EOTF más pronunciada muestra una pérdida de luminancia más fuerte. [21]

Algunas correcciones propuestas a este problema son:

La Rec. 2020 define una "luminancia constante" Yc'CbcCrc, que se calcula a partir de componentes RGB lineales y luego se codifica en gamma. Esta versión no sufre la pérdida de luminancia por diseño. [25]

Recorte de gama

Otro artefacto que puede ocurrir con el submuestreo de croma es que pueden aparecer colores fuera de gama en la reconstrucción de croma. Supongamos que la imagen consta de líneas rojas y negras de 1 píxel alternadas y que el submuestreo omitió el croma de los píxeles negros. El croma de los píxeles rojos se reconstruirá en los píxeles negros, lo que hará que los nuevos píxeles tengan valores rojos positivos y verdes y azules negativos . Como las pantallas no pueden emitir luz negativa (la luz negativa no existe), estos valores negativos se recortarán de manera efectiva y el valor de luminancia resultante será demasiado alto. Otros filtros de submuestreo (especialmente el "cuadro" de promedio) tienen un problema similar del que es más difícil hacer un ejemplo simple. Surgen artefactos similares en el ejemplo menos artificial de gradación cerca de un límite rojo/negro bastante nítido. [20]

El decodificador puede manejar colores fuera de gama considerando la cantidad de croma que puede contener un valor de luminancia determinado y distribuirla en el intermedio 4:4:4 en consecuencia, lo que Glenn Chan denomina "reconstrucción de croma dentro de la gama". El método de "proporción" es en esencia similar al promedio ponderado por luminancia de Kornelski, mientras que el método de "derrame" se parece a la difusión de errores . [20] La mejora de la reconstrucción de croma sigue siendo un campo de investigación activo. [26]

Terminología

El término Y'UV se refiere a un esquema de codificación de TV analógica (ITU-R Rec. BT.470), mientras que Y'CbCr se refiere a un esquema de codificación digital. [2] Una diferencia entre ambos es que los factores de escala de los componentes cromáticos (U, V, Cb y Cr) son diferentes. Sin embargo, el término YUV se suele utilizar erróneamente para referirse a la codificación Y'CbCr. Por tanto, expresiones como "YUV 4:2:2" siempre se refieren a Y'CbCr 4:2:2, ya que simplemente no existe tal cosa como 4:x:x en la codificación analógica (como YUV). Los formatos de píxeles utilizados en Y'CbCr también se pueden denominar YUV, por ejemplo yuv420p, yuvj420p y muchos otros.

De manera similar, el término luminancia y el símbolo Y se usan a menudo de manera errónea para referirse a la luma, que se denota con el símbolo Y'. La luma (Y') de la ingeniería de video se desvía de la luminancia (Y) de la ciencia del color (según la definición de CIE ). La luma se forma como la suma ponderada de los componentes RGB corregidos por gamma (triestímulo). La luminancia se forma como una suma ponderada de los componentes RGB lineales (triestímulo). En la práctica, el símbolo CIE Y se usa a menudo de manera incorrecta para denotar luma. En 1993, SMPTE adoptó la Guía de ingeniería EG 28, que aclaraba los dos términos. El símbolo primo ' se usa para indicar la corrección gamma. [27]

De manera similar, el croma de la ingeniería de video difiere de la crominancia de la ciencia del color. El croma de la ingeniería de video se forma a partir de componentes triestímulo ponderados (corregidos por gamma, OETF), no de componentes lineales. En la práctica de la ingeniería de video, los términos croma , crominancia y saturación se usan a menudo indistintamente para referirse al croma, pero no es una buena práctica, como dice la Recomendación H.273 de la UIT-T. [28]

Historia

El submuestreo de croma fue desarrollado en la década de 1950 por Alda Bedford para el desarrollo de la televisión en color por parte de RCA , que se convirtió en el estándar NTSC ; la separación luma-croma fue desarrollada antes, en 1938 por Georges Valensi . A través de estudios [ ¿cuáles? ] , demostró que el ojo humano tiene alta resolución solo para blanco y negro, algo menos para colores de "rango medio" como amarillos y verdes, y mucho menos para colores en el extremo del espectro, rojos y azules. [ aclaración necesaria ] Este conocimiento permitió a RCA desarrollar un sistema en el que descartaron la mayor parte de la señal azul después de que proviene de la cámara, manteniendo la mayor parte del verde y solo algo del rojo; esto es submuestreo de croma en el espacio de color YIQ y es aproximadamente análogo al submuestreo 4:2:1, en el sentido de que tiene una resolución decreciente para luma, amarillo/verde y rojo/azul.

Véase también

Notas

  1. ^ Los signos principales indican corrección gamma o cualquier EOTF no lineal.

Referencias

  1. ^ S. Winkler, CJ van den Branden Lambrecht y M. Kunt (2001). "Visión y Vídeo: Modelos y Aplicaciones". En Christian J. van den Branden Lambrecht (ed.). Modelos de visión y aplicaciones al procesamiento de imágenes y vídeos . Saltador. pag. 209.ISBN 978-0-7923-7422-0.{{cite book}}: CS1 maint: varios nombres: lista de autores ( enlace )
  2. ^ ab Poynton, Charles. "YUV y luminancia considerados perjudiciales: un alegato a favor de una terminología precisa en vídeo".
  3. ^ Jennings, Roger; Bertel Schmitt (1997). "DV vs. Betacam SP". DV Central . Archivado desde el original el 2008-07-02 . Consultado el 2008-08-29 .
  4. ^ Wilt, Adam J. (2006). "Formatos DV, DVCAM y DVCPRO". adamwilt.com . Consultado el 29 de agosto de 2008 .
  5. ^ Clint DeBoer (16 de abril de 2008). "Niveles de negro mejorados HDMI, xvYCC y RGB". Audioholics . Consultado el 2 de junio de 2013 .
  6. ^ "Código de color digital" (PDF) . Telairity. Archivado desde el original (PDF) el 7 de enero de 2014. Consultado el 2 de junio de 2013 .
  7. ^ MSX Licensing Corporation (2022). "Los modos de pantalla de YJK". Página de ensamblaje de MSX .
  8. ^ Niemietz, Ricardo Cancho (2014). Problemas con el modelo de color YJK implementado en el chip VDP Yamaha V9958 (PDF) .
  9. ^ "VCFe Vortrag vom 2016.04.30 - Homecomputer und Spielkonsolen - Videoarchitekturen als visuelles Medium". neil.franklin.ch . Consultado el 13 de noviembre de 2022 .
  10. ^ IC Master. Publicaciones técnicas unidas. 2001.
  11. ^ Martín Sesma, Sergio (3 de octubre de 2016). Arqueología informática: los ordenadores MSX en los inicios de la microinformática doméstica (Proyecto/Trabajo fin de carrera/grado thesis). Universitat Politècnica de València.
  12. ^ Redacción (20 de octubre de 2008). "MSX - Vari Costruttori- 1983". CyberLudus.com (en italiano) . Consultado el 13 de noviembre de 2022 .
  13. ^ "LIBRO DE DATOS TÉCNICOS DEL V9958 MSX-VIDEO" (PDF) . 1988.
  14. ^ Alex, Wulms (1995). "Schermen op MSX - De 2+ schermen" (PDF) . Revista MSX Computer & Club (72).
  15. ^ Poynton, Charles (2008). "Notación de submuestreo de croma" (PDF) . Poynton.com . Consultado el 1 de octubre de 2008 .
  16. ^ enumeración abcd AvChromaLocation, ffmpeg 3.1.
  17. ^ "y4minput.c - webm/libvpx - Git en Google". chromium.googlesource.com . Los ejemplos de croma de 420paldv se encuentran en:
  18. ^ Munsil, Don; Stacey Spears (2003). "DVD Player Benchmark – Chroma Upsampling Error". Secretos del cine en casa y la alta fidelidad . Archivado desde el original el 2008-06-06 . Consultado el 2008-08-29 .
  19. ^ "Compatible con la decodificación de imágenes jpeg yuv442 y yuv421. · FFmpeg/FFmpeg@387d860". GitHub .
  20. ^ abc Chan, Glenn (mayo de 2008). "Hacia un mejor submuestreo de croma: ganador del premio SMPTE Student Paper Award 2007". Revista de imágenes en movimiento SMPTE . 117 (4): 39–45. doi : 10.5594/J15100 .
  21. ^ ab Larbier, Pierre (octubre de 2015). "Alto rango dinámico: desafíos de compresión". Conferencia y exposición técnica anual SMPTE 2015 : 1–15. doi :10.5594/M001639. ISBN 978-1-61482-956-0.
  22. ^ "Submuestreo de croma con corrección gamma · Número 193 · mozilla/mozjpeg". GitHub .
  23. ^ "WebP: sharpyuv/sharpyuv.h | Fossies". fossies.org . Supone que la imagen se sobremuestreará utilizando un filtro bilineal. Si se utiliza el vecino más cercano en su lugar, la imagen sobremuestreada podría verse peor que con el submuestreo estándar.
  24. ^ Norkin, Andrey (27 de septiembre de 2016). Conversión de color HDR con métricas de distorsión variables (PDF) . SPIE Optical Engineering + Applications, 2016. pp. 99710E. doi :10.1117/12.2237040.
  25. ^ "BT.2020: Valores de parámetros para sistemas de televisión de ultraalta definición para producción e intercambio internacional de programas". Unión Internacional de Telecomunicaciones . 2014-07-17 . Consultado el 2014-08-31 .
  26. ^ Chung, Kuo-Liang; Liang, Yan-Cheng; Wang, Ching-Sheng (marzo de 2019). "Método eficaz de reconstrucción cromática consciente del contenido para imágenes de contenido de pantalla". IEEE Transactions on Image Processing . 28 (3): 1108–1117. Bibcode :2019ITIP...28.1108C. doi :10.1109/TIP.2018.2875340. PMID  30307864. S2CID  52964340.
  27. ^ Glosario anotado de términos esenciales para la producción electrónica. doi :10.5594/SMPTE.EG28.1993. ISBN 978-1-61482-022-2. Archivado del original el 30 de noviembre de 2017. luma: Para evitar la confusión interdisciplinaria resultante de las dos definiciones distintas de luminancia, se ha propuesto que los documentos de video utilicen luma para luminancia, televisión (es decir, la señal de luminancia) y croma para crominancia televisión (es decir, la señal de crominancia)
  28. ^ "H.273: Puntos de código independientes de la codificación para la identificación del tipo de señal de vídeo". www.itu.int . 2016. NOTA – Se utiliza el término croma en lugar del término crominancia para evitar la implicación del uso de características de transferencia de luz lineal que a menudo se asocia con el término crominancia. [...] NOTA – Se utiliza el término luma en lugar del término luminancia para evitar la implicación del uso de características de transferencia de luz lineal que a menudo se asocia con el término luminancia. A veces se utiliza el símbolo L en lugar del símbolo Y para evitar la confusión con el símbolo y que se utiliza para la ubicación vertical.

Enlaces externos