stringtranslate.com

Tipos de imágenes de compresión de video

En el campo de la compresión de vídeo, un fotograma de vídeo se comprime utilizando diferentes algoritmos con diferentes ventajas y desventajas, centrados principalmente en la cantidad de compresión de datos . Estos diferentes algoritmos para fotogramas de vídeo se denominan tipos de imágenes o tipos de fotogramas . Los tres tipos de imágenes principales utilizados en los diferentes algoritmos de vídeo son I , P y B. Se diferencian en las siguientes características:

Resumen

Una secuencia de fotogramas de vídeo, que consta de dos fotogramas clave (I), un fotograma predicho hacia adelante (P) y un fotograma predicho bidireccionalmente (B).

En la compresión de vídeo se utilizan tres tipos de imágenes (o fotogramas) : fotogramas I, P y B.

Un I-frame ( imagen intracodificada ) es una imagen completa, como un archivo de imagen JPG o BMP .

Un cuadro P (imagen prevista) contiene solo los cambios en la imagen desde un cuadro anterior. Por ejemplo, en una escena en la que un automóvil se mueve sobre un fondo estacionario, solo es necesario codificar los movimientos del automóvil. El codificador no necesita almacenar los píxeles de fondo que no cambian en el marco P, ahorrando así espacio. Los marcos P también se conocen como marcos delta .

Un fotograma B (imagen predicha bidireccional) ahorra aún más espacio al utilizar diferencias entre el fotograma actual y los fotogramas anterior y siguiente para especificar su contenido.

Los fotogramas P y B también se denominan fotogramas inter . El orden en el que se organizan los fotogramas I, P y B se denomina Grupo de imágenes .

Cuadros/marcos

Si bien los términos "marco" e "imagen" a menudo se usan indistintamente, el término imagen es una noción más general, ya que una imagen puede ser un marco o un campo . Un cuadro es una imagen completa y un campo es el conjunto de líneas de escaneo pares o impares que componen una imagen parcial. Por ejemplo, una imagen HD 1080 tiene 1080 líneas (filas) de píxeles. Un campo impar consta de información de píxeles para las líneas 1, 3, 5...1079. Un campo par tiene información de píxeles para las líneas 2, 4, 6...1080. Cuando el vídeo se envía en formato de escaneo entrelazado , cada fotograma se envía en dos campos, el campo de líneas impares seguido del campo de líneas pares.

Un marco utilizado como referencia para predecir otros marcos se llama marco de referencia.

Los fotogramas codificados sin información de otros fotogramas se denominan fotogramas I. Los fotogramas que utilizan predicción a partir de un único fotograma de referencia anterior (o un único fotograma para la predicción de cada región) se denominan fotogramas P. Los fotogramas B utilizan la predicción a partir de un promedio (posiblemente ponderado) de dos fotogramas de referencia, uno anterior y otro posterior.

Rebanadas

En el estándar H.264/MPEG-4 AVC , la granularidad de los tipos de predicción se reduce al "nivel de segmento". Un sector es una región espacialmente distinta de un fotograma que se codifica por separado de cualquier otra región del mismo fotograma. Los cortes I, P y B reemplazan a los fotogramas I, P y B.

Macrobloques

Normalmente, las imágenes (cuadros) se segmentan en macrobloques y los tipos de predicción individuales se pueden seleccionar según los macrobloques en lugar de ser los mismos para toda la imagen, de la siguiente manera:

Además, en el estándar de codificación de vídeo H.264 , el fotograma se puede segmentar en secuencias de macrobloques llamados sectores y, en lugar de utilizar selecciones de tipo de fotograma I, B y P, el codificador puede elegir el estilo de predicción claramente en cada sector individual. También en H.264 se encuentran varios tipos adicionales de fotogramas/cortes:

La estimación de movimiento de varios fotogramas aumenta la calidad del vídeo y, al mismo tiempo, permite la misma relación de compresión. Los marcos SI y SP (definidos para el perfil extendido) mejoran la corrección de errores . Cuando estos fotogramas se utilizan junto con un decodificador inteligente, es posible recuperar las transmisiones de DVD dañados.

Cuadros/porciones intracodificados (I) (cuadros clave)

A menudo, los fotogramas I se utilizan para el acceso aleatorio y como referencia para la decodificación de otras imágenes. Los períodos de actualización intra de medio segundo son comunes en aplicaciones como la transmisión de televisión digital y el almacenamiento de DVD . En algunos entornos se pueden utilizar períodos de actualización más prolongados. Por ejemplo, en los sistemas de videoconferencia es habitual enviar I-frames con muy poca frecuencia.

Cuadros/porciones previstos (P)

Cuadros/porciones (macrobloques) bidireccionales previstos (B)

Ver también

Referencias

enlaces externos