stringtranslate.com

Codificación de vídeo multivista

Multi View Video Coding ( MVC , también conocido como MVC 3D ) es un estándar de codificación de video estereoscópico para compresión de video que permite codificar secuencias de video capturadas simultáneamente desde múltiples ángulos de cámara en una sola secuencia de video. [1] Utiliza el método 2D más Delta y es una enmienda al estándar de compresión de vídeo H.264 (MPEG-4 AVC) , desarrollado conjuntamente por MPEG y VCEG , [2] con contribuciones de varias empresas, principalmente Panasonic y Electrónica LG . [3]

El formato MVC está destinado a codificar vídeo 3D estereoscópico (de dos vistas) , así como televisión de punto de vista gratuito y televisión 3D de múltiples vistas . El perfil Stereo High se estandarizó en junio de 2009; el perfil se basa en el conjunto de herramientas MVC y se utiliza en versiones estereoscópicas de Blu-ray 3D . [4]

Resumen técnico

MVC se basa en la idea de que las grabaciones de vídeo de la misma escena desde múltiples ángulos comparten muchos elementos comunes. Es posible codificar todos los fotogramas simultáneos capturados en el mismo flujo elemental y compartir tanta información como sea posible entre las diferentes capas. Esto puede reducir el tamaño del vídeo codificado. [5] [6]

El vídeo multivista contiene una gran cantidad de dependencias estadísticas entre vistas, ya que todas las cámaras capturan la misma escena desde diferentes puntos de vista. Por lo tanto, la predicción combinada temporal y entre vistas es importante para una codificación MVC eficiente. Un fotograma de una determinada cámara se puede predecir no sólo a partir de fotogramas relacionados temporalmente de la misma cámara, sino también de los fotogramas de cámaras vecinas. Estas interdependencias se pueden utilizar para una predicción eficiente. [7] [8] [9]

El método para esto se utiliza en la codificación de video Multiview para películas Blu-ray 3D y se conoce como algoritmo 2D más Delta, y la especificación MVC en sí es parte del estándar H.264 como una enmienda en el “Anexo H” H.264 de la especificación. [10]

Falta prácticamente soporte de código abierto

En abril de 2015, no existe ningún software gratuito y de código abierto que admita la decodificación de software del estándar de compresión de video MVC. [11] Los decodificadores populares de código abierto H.264 y HEVC (H.265) , como los utilizados en las bibliotecas FFmpeg y Libav , simplemente ignoran la segunda vista y, por lo tanto, no muestran la segunda vista para vistas estereoscópicas. En la mayoría de los casos, la razón por la que no se agrega este soporte es que MVC no se consideró cuando se escribió el código inicial de los decodificadores H.264 y HEVC. Una enmienda posterior, como tal, a menudo significaría una gran cantidad de trabajo de refactorización del código como requisito previo y grandes cambios en su arquitectura actual, con un trabajo importante para desenredar y reordenar parte del código, y dividir diferentes funciones en el código del decodificador existente en fragmentos más pequeños para un manejo más simple y, a su vez, hacer enmiendas como MVC son más fáciles de agregar. [12]

Sin embargo, en el pasado se realizaron algunos trabajos de prueba de concepto , pero nunca llegaron a los lanzamientos oficiales de FFmpeg o Libav . [13] [14]

El 8 de marzo de 2016 la situación mejoró. La versión 0.68 de DirectShow Media Splitter and Decoders Collection LAV Filters [15] fue lanzada por el desarrollador "Nevcairiel" (que también trabaja para Media Player Classic - Home Cinema ( MPC-HC )) con soporte para decodificación y desmultiplexación 3D H.264 MVC . Con la ayuda de esta versión y FRIM [16] escrito por un programador llamado “videohelp3d” [17] es posible escribir un script AviSynth para preprocesar un video clip H.264 MVC 3D que luego se puede abrir mediante video 3D gratuito. reproductor Bino [18] y luego se muestra en rojo (vídeo anaglifo cian, por ejemplo). [11]

El uso del complemento FRIM AviSynth (FRIMSource) se describe en la página de inicio de “videohelp3d”. Los filtros LAV se pueden utilizar para obtener audio de un videoclip H.264 MVC 3D. El desarrollador [19] publicó que en una versión futura de, podría ser posible que LAV Video reproduzca el video directamente en lado a lado. [20]

Titulares de patentes

Las siguientes organizaciones poseen patentes que contribuyeron al desarrollo de la tecnología MVC, incluidas en un grupo de patentes de MPEG LA . [21]

Ver también

Referencias

  1. ^ https://research.nokia.com/page/4988 Archivado el 16 de julio de 2015 en Wayback Machine Mobile 3D Video
  2. ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 19 de julio de 2011 . Consultado el 13 de enero de 2011 .{{cite web}}: CS1 maint: archived copy as title (link)3DTV EN CASA: ESTADO, RETOS Y SOLUCIONES PARA OFRECER UNA EXPERIENCIA DE ALTA CALIDAD
  3. ^ ab "Lista de patentes MVC" (PDF) . MPEG LA . Consultado el 11 de julio de 2019 .
  4. ^ "mpeg4-mvc - Blog de visión 3D" . Consultado el 8 de marzo de 2023 .
  5. ^ https://wiki.libav.org/Blueprint/MultiAVFrame Plano de Libav MultiAVFrame
  6. ^ Ijsselsteijn, Wijnand A.; Seuntiëns, Pieter JH; Meesters, Lydia MJ (3 de enero de 2006). "Factores humanos de las pantallas 3D". Videocomunicación 3D . Chichester, Reino Unido: John Wiley & Sons, Ltd. págs. doi :10.1002/0470022736.ch12. ISBN 978-0-470-02273-3.
  7. ^ MPEG - Tecnologías - Introducción a la codificación de vídeo multivista
  8. ^ http://vision.princeton.edu/projects/2008/ECCV_stereo/paper_low-res.pdf Aprendizaje de la coincidencia estéreo de dos vistas
  9. ^ http://cs.nyu.edu/~fergus/teaching/vision_2012/6_Multiview_SfM.pdf Conferencia 6: Estéreo de vista múltiple y estructura a partir del movimiento
  10. ^ http://www.itu.int/rec/T-REC-H.264 H.264: codificación de vídeo avanzada para servicios audiovisuales genéricos
  11. ^ ab Ho, Yo-Sung; Oh, Kwan-Jung (2007). "Descripción general de la codificación de vídeo de múltiples vistas". 2007 14º Taller Internacional sobre Sistemas, Procesamiento de Señales y Imágenes y 6ª Conferencia EURASIP centrada en Procesamiento de Habla e Imágenes, Comunicaciones y Servicios Multimedia. págs. 5-12. doi :10.1109/IWSSIP.2007.4381085. ISBN 978-961-248-036-3. S2CID  453153.
  12. ^ blogs.gentoo.org/lu_zero/2014/04/04/the-road-to-mvc/ El camino hacia MVC
  13. ^ http://www.nt.uni-saarland.de/fileadmin/file_uploads/theses/master/Optimized_implementation_of_a_MVC_decoder.pdf Archivado el 4 de marzo de 2016 en Wayback Machine Jochen Britz - Implementación optimizada de un decodificador MVC - Tesis de maestría en Computación y Comunicación Tecnología
  14. ^ https://github.com/Britz/FFmpeg Britz: en términos de mi tesis de maestría, trabajo en una implementación H.264 MVC en libvacodec basada en H.264 Anexo H.
  15. ^ https://github.com/Nevcairiel/LAVFilters Repositorio de GitHub del proyecto LAV Filters Consultado el 30 de marzo de 2016.
  16. ^ http://www.videohelp.com/software/FRIM Página de descarga de Videohelp Consultado el 30 de marzo de 2016.
  17. ^ http://forum.doom9.org/showthread.php?t=169651 página de desarrolladores de "videohelp3d" Consultado el 30 de marzo de 2016.
  18. ^ http://bino3d.org/index.html Página de inicio de Bino: un reproductor de video 3D gratuito Consultado el 30 de marzo de 2016.
  19. ^ http://forum.doom9.org/showthread.php?t=156191&page=1029 página de desarrolladores de "Nevcairiel" (en la parte inferior de la página) Consultado el 30 de marzo de 2016.
  20. ^ CrendKing (10 de febrero de 2022), Filtro AviSynth y filtro VapourSynth , consultado el 10 de febrero de 2022
  21. ^ "Medios: programas de licencias". MPEG LA . Consultado el 10 de febrero de 2022 .
  22. ^ "Licenciantes incluidos en la licencia de cartera de patentes de MVC". MPEG LA . Consultado el 11 de julio de 2019 .

enlaces externos