stringtranslate.com

Tipos de imágenes de compresión de vídeo

En el campo de la compresión de vídeo, un fotograma de vídeo se comprime utilizando diferentes algoritmos con diferentes ventajas y desventajas, centradas principalmente en la cantidad de datos comprimidos . Estos diferentes algoritmos para fotogramas de vídeo se denominan tipos de imagen o tipos de fotograma . Los tres tipos de imagen principales utilizados en los diferentes algoritmos de vídeo son I , P y B. [ 1] Se diferencian en las siguientes características:

Resumen

Una secuencia de fotogramas de vídeo, que consta de dos fotogramas clave (I), un fotograma predicho hacia adelante (P) y un fotograma predicho bidireccionalmente (B).

En la compresión de vídeo se utilizan tres tipos de imágenes (o fotogramas) : fotogramas I, P y B.

Un I-frame ( imagen intracodificada ) es una imagen completa, como un archivo de imagen JPG o BMP .

Un fotograma P (imagen predicha) contiene solo los cambios en la imagen de un fotograma anterior. Por ejemplo, en una escena en la que un automóvil se mueve sobre un fondo estático, solo es necesario codificar los movimientos del automóvil. El codificador no necesita almacenar los píxeles de fondo inmutables en el fotograma P, lo que ahorra espacio. Los fotogramas P también se conocen como fotogramas delta .

Un cuadro B (imagen predicha bidireccional) ahorra aún más espacio al utilizar las diferencias entre el cuadro actual y los cuadros anterior y siguiente para especificar su contenido.

Los fotogramas P y B también se denominan fotogramas Inter . El orden en el que se disponen los fotogramas I, P y B se denomina Grupo de imágenes .

Imágenes/marcos

Aunque los términos "marco" e "imagen" se utilizan a menudo indistintamente, el término imagen es una noción más general, ya que una imagen puede ser un marco o un campo . Un marco es una imagen completa y un campo es el conjunto de líneas de barrido pares o impares que componen una imagen parcial. Por ejemplo, una imagen HD 1080 tiene 1080 líneas (filas) de píxeles. Un campo impar consta de información de píxeles para las líneas 1, 3, 5...1079. Un campo par tiene información de píxeles para las líneas 2, 4, 6...1080. Cuando el vídeo se envía en formato de barrido entrelazado , cada marco se envía en dos campos, el campo de líneas impares seguido del campo de líneas pares.

Un marco utilizado como referencia para predecir otros marcos se llama marco de referencia.

Los fotogramas codificados sin información de otros fotogramas se denominan fotogramas I. Los fotogramas que utilizan la predicción a partir de un único fotograma de referencia anterior (o un único fotograma para la predicción de cada región) se denominan fotogramas P. Los fotogramas B utilizan la predicción a partir de un promedio (posiblemente ponderado) de dos fotogramas de referencia, uno anterior y otro posterior.

Rebanadas

En el estándar H.264/MPEG-4 AVC , la granularidad de los tipos de predicción se reduce al "nivel de corte". Un corte es una región espacialmente distinta de un fotograma que se codifica por separado de cualquier otra región del mismo fotograma. Los cortes I, P y B sustituyen a los fotogramas I, P y B.

Macrobloques

Normalmente, las imágenes (marcos) se segmentan en macrobloques y se pueden seleccionar tipos de predicción individuales sobre la base de cada macrobloque en lugar de que sean los mismos para toda la imagen, de la siguiente manera:

Además, en el estándar de codificación de vídeo H.264 , el fotograma se puede segmentar en secuencias de macrobloques denominados porciones y, en lugar de utilizar selecciones de tipo de fotograma I, B y P, el codificador puede elegir el estilo de predicción de forma diferenciada en cada porción individual. También en H.264 se encuentran varios tipos adicionales de fotogramas/porciones:

La estimación de movimiento de múltiples cuadros aumenta la calidad del video, al mismo tiempo que permite la misma relación de compresión. Los cuadros SI y SP (definidos para el perfil extendido) mejoran la corrección de errores . Cuando se utilizan dichos cuadros junto con un decodificador inteligente, es posible recuperar las transmisiones de DVD dañados.

Fotogramas/secciones intracodificadas (I) (fotogramas clave)

A menudo, los fotogramas I se utilizan para el acceso aleatorio y se utilizan como referencias para la decodificación de otras imágenes. Los períodos de refresco intra de medio segundo son comunes en aplicaciones como la transmisión de televisión digital y el almacenamiento de DVD . En algunos entornos se pueden utilizar períodos de refresco más largos. Por ejemplo, en los sistemas de videoconferencia es habitual enviar fotogramas I con muy poca frecuencia.

Cuadros/segmentos predichos (P)

Cuadros/secciones (macrobloques) predichos (B) bidireccionales

Véase también

Referencias

  1. ^ Beach, Andy; Owen, Aaron (2019). Manual de compresión de vídeo (2.ª ed.). Lugar de publicación no identificado: Peachpit Press. ISBN 978-0-13-486621-5.OCLC 1006298938  .

Enlaces externos