stringtranslate.com

Codificación de vídeo multivista

Multi View Video Coding ( MVC , también conocido como MVC 3D ) es un estándar de codificación de video estereoscópico para compresión de video que permite codificar secuencias de video capturadas simultáneamente desde múltiples ángulos de cámara en una sola transmisión de video. [1] Utiliza el método 2D más Delta y es una enmienda al estándar de compresión de video H.264 (MPEG-4 AVC) , desarrollado conjuntamente por MPEG y VCEG , [2] con las contribuciones de varias empresas, como Panasonic y LG Electronics . [3]

El formato MVC está pensado para codificar vídeo 3D estereoscópico (de dos vistas) , así como televisión de punto de vista libre y televisión 3D de múltiples vistas . El perfil Stereo High se estandarizó en junio de 2009; el perfil se basa en el conjunto de herramientas MVC y se utiliza en lanzamientos de Blu-ray 3D estereoscópicos . [4]

Descripción técnica

MVC se basa en la idea de que las grabaciones de vídeo de la misma escena desde múltiples ángulos comparten muchos elementos comunes. Es posible codificar todos los fotogramas simultáneos capturados en el mismo flujo elemental y compartir la mayor cantidad de información posible entre las diferentes capas. Esto puede reducir el tamaño del vídeo codificado. [5] [6]

El video multivista contiene una gran cantidad de dependencias estadísticas entre vistas, ya que todas las cámaras capturan la misma escena desde diferentes puntos de vista. Por lo tanto, la predicción temporal y entre vistas combinadas es importante para una codificación MVC eficiente. Un cuadro de una determinada cámara se puede predecir no solo a partir de cuadros relacionados temporalmente de la misma cámara, sino también a partir de los cuadros de cámaras vecinas. Estas interdependencias se pueden utilizar para una predicción eficiente. [7] [8] [9]

El método utilizado en la codificación de vídeo multivista para películas Blu-ray 3D se conoce como algoritmo 2D más Delta, y la especificación MVC en sí misma es parte del estándar H.264 como una enmienda en el “Anexo H” de H.264 de la especificación. [10]

El soporte de código abierto prácticamente no existe

A partir de abril de 2015, no existe ningún software libre y de código abierto que admita la decodificación de software del estándar de compresión de video MVC. [11] Los decodificadores de código abierto H.264 y HEVC (H.265) populares , como los que se usan en las bibliotecas FFmpeg y Libav , simplemente ignoran la segunda vista y, por lo tanto, no muestran la segunda vista para las vistas estereoscópicas. En la mayoría de los casos, la razón por la que no se agregó este soporte es que MVC no se consideró cuando se escribió el código central inicial de los decodificadores H.264 y HEVC. Las modificaciones posteriores a menudo significarían mucho trabajo de refactorización de código de requisitos previos y grandes cambios en su arquitectura actual, con un trabajo importante en desenredar y reordenar parte del código y dividir diferentes funciones en el código de decodificador existente en fragmentos más pequeños para un manejo más simple para, a su vez, hacer que las modificaciones como MVC sean más fáciles de agregar. [12]

Sin embargo, en el pasado se han realizado algunos trabajos de prueba de concepto , pero nunca llegaron a incorporarse a los lanzamientos oficiales de FFmpeg o Libav . [13] [14]

El 8 de marzo de 2016, la situación mejoró. El desarrollador "Nevcairiel" (que también trabaja para Media Player Classic — Home Cinema ( MPC-HC )) lanzó la versión 0.68 de DirectShow Media Splitter and Decoders Collection LAV Filters [15] con soporte para desmultiplexación y decodificación H.264 MVC 3D. Con la ayuda de esta versión y FRIM [16] escrito por un programador llamado "videohelp3d" [17] es posible escribir un script de AviSynth para preprocesar un videoclip H.264 MVC 3D que luego puede abrirse con el reproductor de video 3D gratuito Bino [18] y luego mostrarse como video anaglifo rojo — cian, por ejemplo. [11]

El uso del complemento FRIM AviSynth (FRIMSource) se describe en la página de inicio de “videohelp3d”. Los filtros LAV se pueden usar para obtener audio de un videoclip 3D H.264 MVC. El desarrollador [19] publicó que en una versión futura de, podría ser posible que LAV Video renderice el video como Side-by-Side directamente. [20]

Titulares de patentes

Las siguientes organizaciones poseen patentes que contribuyeron al desarrollo de la tecnología MVC, enumeradas en un grupo de patentes de MPEG LA . [21]

Véase también

Referencias

  1. ^ https://research.nokia.com/page/4988 Archivado el 16 de julio de 2015 en Wayback Machine Vídeo 3D móvil
  2. ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 19 de julio de 2011. Consultado el 13 de enero de 2011 .{{cite web}}: CS1 maint: archived copy as title (link)3DTV EN CASA: ESTADO, RETOS Y SOLUCIONES PARA OFRECER UNA EXPERIENCIA DE ALTA CALIDAD
  3. ^ ab "MVC Patent List" (PDF) . MPEG LA . Consultado el 11 de julio de 2019 .
  4. ^ "mpeg4-mvc - Blog de 3D Vision" . Consultado el 8 de marzo de 2023 .
  5. ^ https://wiki.libav.org/Blueprint/MultiAVFrame Plano MultiAVFrame de Libav
  6. ^ Ijsselsteijn, Wijnand A.; Seuntiëns, Pieter JH; Meesters, Lydia MJ (3 de enero de 2006). "Factores humanos de las pantallas 3D". Videocomunicación 3D . Chichester, Reino Unido: John Wiley & Sons, Ltd. págs. doi :10.1002/0470022736.ch12. ISBN 978-0-470-02273-3.
  7. ^ MPEG – Tecnologías – Introducción a la codificación de video multivista
  8. ^ http://vision.princeton.edu/projects/2008/ECCV_stereo/paper_low-res.pdf Aprendizaje de la correspondencia estéreo de dos vistas
  9. ^ http://cs.nyu.edu/~fergus/teaching/vision_2012/6_Multiview_SfM.pdf Clase 6: Estéreo multivista y estructura a partir del movimiento
  10. ^ http://www.itu.int/rec/T-REC-H.264 H.264: Codificación de vídeo avanzada para servicios audiovisuales genéricos
  11. ^ ab Ho, Yo-Sung; Oh, Kwan-Jung (2007). "Descripción general de la codificación de vídeo multivista". 14.º taller internacional sobre sistemas, señales y procesamiento de imágenes de 2007 y 6.ª conferencia EURASIP centrada en el procesamiento de voz e imágenes, las comunicaciones y los servicios multimedia. págs. 5-12. doi :10.1109/IWSSIP.2007.4381085. ISBN 978-961-248-036-3.S2CID 453153  .
  12. ^ blogs.gentoo.org/lu_zero/2014/04/04/the-road-to-mvc/ El camino hacia MVC
  13. ^ http://www.nt.uni-saarland.de/fileadmin/file_uploads/theses/master/Optimized_implementation_of_a_MVC_decoder.pdf Archivado el 4 de marzo de 2016 en Wayback Machine Jochen Britz – Implementación optimizada de un decodificador MVC – Tesis de maestría en tecnología informática y de comunicaciones
  14. ^ https://github.com/Britz/FFmpeg Britz – En términos de mi tesis de maestría, trabajo en una implementación H.264 MVC en libvacodec basada en H.264 Annex H.
  15. ^ https://github.com/Nevcairiel/LAVFilters Repositorio de GitHub del proyecto LAV Filters. Recuperado el 30 de marzo de 2016.
  16. ^ http://www.videohelp.com/software/FRIM Página de descarga de Videohelp Consultado el 30 de marzo de 2016
  17. ^ http://forum.doom9.org/showthread.php?t=169651 página de desarrolladores de "videohelp3d" Consultado el 30 de marzo de 2016
  18. ^ http://bino3d.org/index.html Página de inicio de Bino, un reproductor de vídeo 3D gratuito. Consultado el 30 de marzo de 2016.
  19. ^ http://forum.doom9.org/showthread.php?t=156191&page=1029 página de desarrolladores de "Nevcairiel" (en la parte inferior de la página) Consultado el 30 de marzo de 2016
  20. ^ CrendKing (10 de febrero de 2022), Filtro AviSynth y filtro VapourSynth , consultado el 10 de febrero de 2022
  21. ^ "Medios: Programas de licencias". MPEG LA . Consultado el 10 de febrero de 2022 .
  22. ^ "Licenciantes incluidos en la licencia de cartera de patentes de MVC". MPEG LA . Consultado el 11 de julio de 2019 .

Enlaces externos