stringtranslate.com

grupo de fotos

En la codificación de vídeo , un grupo de imágenes , o estructura GOP , especifica el orden en el que se organizan los intra y entre fotogramas . El GOP es una colección de imágenes sucesivas dentro de una secuencia de vídeo codificada. Cada flujo de vídeo codificado consta de GOP sucesivos, a partir de los cuales se generan los fotogramas visibles. Encontrar un nuevo GOP en una secuencia de vídeo comprimido significa que el decodificador no necesita ningún fotograma anterior para decodificar los siguientes y permite una búsqueda rápida a través del vídeo.

Elementos

Un GOP puede contener los siguientes tipos de imágenes:

Un cuadro I indica el comienzo de un Partido Republicano. Luego siguen varios fotogramas P y B. En diseños más antiguos, la estructura de ordenación y referencia permitida está relativamente restringida. [2]

Los fotogramas I contienen la imagen completa y no requieren ninguna información adicional para reconstruirlos. Normalmente, los codificadores utilizan estructuras GOP que hacen que cada cuadro I sea un "punto de acceso aleatorio limpio", de modo que la decodificación pueda comenzar limpiamente en un cuadro I y cualquier error dentro de la estructura GOP se corrija después de procesar un cuadro I correcto.

En los diseños más nuevos que se encuentran en H.264/MPEG-4 AVC y HEVC , los codificadores tienen mucha más flexibilidad a la hora de hacer referencia a estructuras. Pueden usar las mismas estructuras de referencia que se usaron anteriormente en diseños más antiguos, o pueden usar más imágenes como referencias y pueden usar un orden más flexible del orden de codificación en relación con el orden de visualización. También se les permite utilizar fotogramas B como referencia al codificar otros fotogramas (B o P). Esta flexibilidad adicional puede mejorar la eficiencia de la compresión, pero puede provocar la propagación de errores si algunos datos se pierden o se corrompen. Una estructura popular para usar con los diseños más nuevos es el uso de una jerarquía de marcos B. Los fotogramas B jerárquicos pueden proporcionar una muy buena eficiencia de compresión y también pueden limitar la propagación de errores, ya que la jerarquía puede garantizar que el número de imágenes afectadas por cualquier problema de corrupción de datos esté estrictamente limitado. [3]

Generalmente, cuantos más fotogramas tenga la transmisión de vídeo, más editable será. Sin embargo, tener más fotogramas I aumenta sustancialmente la velocidad de bits necesaria para codificar el vídeo.

Estructura

La estructura del Partido Republicano suele denominarse mediante dos números, por ejemplo, M =3, N =12 . El primer número indica la distancia entre dos marcos de anclaje (I o P), también conocida como la longitud de un "mini-GOP". [4] El segundo indica la distancia entre dos imágenes completas (I-frames): es el tamaño del GOP. [5] En lugar del parámetro M, se puede utilizar el recuento máximo de fotogramas B entre dos fotogramas de anclaje consecutivos; este es el enfoque utilizado por ffmpeg . [6]

Ejemplos:

No es necesario que la estructura del GOP permanezca fija durante la codificación. Variar N para insertar un fotograma I en el cambio de escena es una técnica bien conocida. [7] Las técnicas más nuevas también varían M según la cantidad de movimiento en el video. [8]

Conceptos adicionales

Con diseños H.264 y posteriores que permiten estructuras de referencia altamente flexibles, un marco B en un GOP puede hacer referencia a un marco en un GOP diferente. Un GOP que contiene dicho marco de referencia externa se conoce como "GOP abierto". Lo opuesto es un Partido Republicano autónomo, conocido como "Partido Republicano cerrado". [4]

Ver también

Referencias

  1. ^ "Fotogramas clave, intercuadros y compresión de vídeo". 13 de abril de 2021.
  2. ^ "Marcos B".
  3. ^ "Marcos B jerárquicos o pirámide B: compresión de vídeo". www.ramugedia.com .
  4. ^ ab Vijayanagar, Krishna Rao (17 de diciembre de 2020). "GOP cerrado y GOP abierto - Explicación simplificada - OTTVerse". ottverse.com .
  5. ^ "Manual del usuario del compresor 4".
  6. ^ "Documentación de códecs FFmpeg". ffmpeg.org . bf entero (codificación, vídeo) Establece el número máximo de fotogramas B entre fotogramas que no son B.
  7. ^ "Asignación adaptable dentro de trama y estimación de velocidad de bits para longitud variable de GOP en H.264". Transacciones IEEE sobre circuitos y sistemas para tecnología de vídeo . 16 (10): 1271-1279. Octubre de 2006. doi :10.1109/TCSVT.2006.881856.
  8. ^ "Docs/Appendix-Adaptive-Prediction-Structure.md · master · Alliance for Open Media / SVT-AV1 · GitLab". GitLab . 23 de agosto de 2023.