stringtranslate.com

Formato intermedio común

CIF ( Common Intermediate Format o Common Interchange Format ), también conocido como FCIF ( Full Common Intermediate Format ), es un formato estandarizado para la resolución de imagen , la velocidad de cuadros , el espacio de color y el submuestreo de color de secuencias de video digital utilizadas en sistemas de videoconferencia . Se definió por primera vez en el estándar H.261 en 1988.

Comparación de los formatos CIF y D-1

Como la palabra "común" en su nombre lo indica, CIF fue diseñado como un formato de compromiso común para que fuera relativamente fácil de convertir para su uso con pantallas y cámaras estándar PAL o NTSC . CIF define una secuencia de video con una resolución de 352 × 288, que tiene una relación simple con el tamaño de imagen PAL, pero con una velocidad de cuadros de 30000/1001 (aproximadamente 29,97) cuadros por segundo como NTSC, con color codificado utilizando una representación YCbCr con muestreo de color 4:2:0 . Fue diseñado como un compromiso entre los esquemas PAL y NTSC, ya que utiliza un tamaño de imagen que se corresponde más fácilmente con PAL, pero utiliza la velocidad de cuadros de NTSC. El compromiso se estableció como una forma de llegar a un acuerdo internacional para que los sistemas de videoconferencia en diferentes países pudieran comunicarse entre sí sin necesidad de dos modos separados para mostrar el video recibido.

Detalles técnicos

La forma sencilla de convertir un vídeo NTSC a CIF es capturar todos los demás campos (por ejemplo, los campos superiores) del vídeo entrelazado , reducir su resolución en 2:1 horizontalmente para convertir 704 muestras por línea en 352 muestras por línea y aumentar su resolución verticalmente en una proporción de 6:5 verticalmente para convertir 240 líneas en 288 líneas. La forma sencilla de convertir un vídeo PAL a CIF es capturar de forma similar todos los demás campos, reducir su resolución horizontalmente en 2:1 e introducir algo de vibración en la velocidad de fotogramas saltando o repitiendo fotogramas según sea necesario. Dado que los sistemas H.261 normalmente funcionaban a bajas velocidades de bits , también solían funcionar a bajas velocidades de fotogramas saltando muchos de los fotogramas de origen de la cámara, por lo que la introducción de algo de vibración en la velocidad de fotogramas tendía a no ser perceptible. También se podrían utilizar esquemas de conversión más sofisticados (por ejemplo, utilizando desentrelazado para mejorar la resolución vertical de una cámara NTSC) en sistemas de mayor calidad.

A diferencia del compromiso CIF que se originó con el estándar H.261, existen dos variantes del SIF ( Source Input Format ) que se definió por primera vez en el estándar MPEG-1 . Por lo demás, el SIF es muy similar al CIF. El SIF en sistemas basados ​​en 525 líneas ("NTSC") es de 352 × 240 con una velocidad de cuadros de 30000/1001 cuadros por segundo, y en sistemas basados ​​en 625 líneas ("PAL"), tiene el mismo tamaño de imagen que el CIF (352 × 288) pero con una velocidad de cuadros de 25 cuadros por segundo.

Algunas referencias a CIF pretenden referirse únicamente a su resolución (352 × 288), sin pretender hacer referencia a su velocidad de cuadros.

La representación de color YCbCr se había definido previamente en el primer formato de fuente de vídeo digital estándar, CCIR 601 , en 1982. Sin embargo, CCIR 601 utiliza un muestreo de color 4:2:2 , que submuestrea los componentes Cb y Cr solo horizontalmente. H.261 utilizó además un submuestreo de color vertical, lo que da como resultado lo que se conoce como 4:2:0.

QCIF significa "Quarter CIF". Para tener un cuarto del área, como implica "quarter", la altura y el ancho del marco se dividen por la mitad.

También se utilizan los términos SQCIF (Sub Quarter CIF, a veces Sub-QCIF ), 4CIF (4 × CIF), 9CIF (9 × CIF) y 16CIF (16 × CIF). Las resoluciones para todos estos formatos se resumen en la siguiente tabla.

Los píxeles xCIF no son cuadrados, sino que tienen una relación de aspecto "nativa" ( relación de aspecto de píxeles (PAR) ) de 12:11 (PAR = DAR  :  SAR  =4/3: ​ 11/9  =  12/11 ), al igual que con el estándar para sistemas de 625 líneas (consulte CCIR 601 ). En pantallas de píxeles cuadrados (por ejemplo, pantallas de computadora y muchos televisores modernos), los rásteres xCIF deben reescalarse de modo que la imagen cubra un área de 4:3, para evitar un aspecto "estirado": el contenido CIF expandido horizontalmente por 12:11 da como resultado un ráster 4:3 de 384 × 288 píxeles cuadrados (384 = 352 * 12/11). (Esto puede suceder en pantallas gráficas más grandes de cualquier relación de aspecto en una ventana de 384 × 288 píxeles cuadrados o ampliadas a pantalla completa en cualquier pantalla gráfica 4:3 más grande). [ cita requerida ]

Las dimensiones de imagen CIF y QCIF se eligieron específicamente para que fueran múltiplos de 16 debido a la forma en que se manejaba la compresión/descompresión de video basada en la transformada de coseno discreta en H.261, utilizando macrobloques de 16 × 16 y bloques de transformación de 8 × 8. Por lo tanto, una imagen de tamaño CIF (352 × 288) contiene 22 × 18 macrobloques y una imagen QCIF (176 × 144) contiene 11 × 9 macrobloques. El concepto de macrobloque de 16 × 16 se utilizó más tarde también en otros estándares de compresión como MPEG-1 , MPEG-2 , MPEG-4 Parte 2 , H.263 y H.264/MPEG-4 AVC .

Véase también

Referencias