stringtranslate.com

Salpicaduras gaussianas en 3D

Modelo de salpicadura gaussiana de un edificio derrumbado tomado de imágenes tomadas con un dron

La salpicadura gaussiana 3D es una técnica utilizada en el campo de la representación de campos de resplandor en tiempo real. [1] Permite la creación de escenas de visualización novedosas en tiempo real de alta calidad mediante la unión de múltiples fotos o videos, lo que históricamente había sido un gran desafío.

Contribuciones

El artículo introdujo varias ideas creativas en el campo de la generación de nuevas vistas, con el objetivo de mejorar la velocidad y la calidad de la generación, especialmente en enfoques basados ​​en el campo de radiancia neuronal .

  1. Por primera vez, se utilizaron gaussianas 3D anisotrópicas para representar campos de radiancia.
  2. Se introdujo un nuevo método de optimización.
  3. Se propuso un enfoque de renderizado rápido, adaptado al uso de GPU.

Descripción general

El enfoque se puede resumir de la siguiente manera: (insertar imagen)

Método

Este diagrama ilustra el funcionamiento del algoritmo propuesto.

El enfoque tiene los siguientes puntos destacados:

Resultados y evaluación[1]

Limitaciones

Los autores señalan que algunas de estas limitaciones, como los artefactos emergentes y el consumo de memoria, podrían abordarse potencialmente mediante mejoras futuras como mejores enfoques de selección, suavizado de bordes, regularización y técnicas de compresión.

Aplicaciones de la salpicadura gaussiana 3D

A continuación, se muestran algunos ejemplos de cómo se ha adaptado y ampliado el Gaussian Splatting en diversas aplicaciones de visión artificial y gráficos, desde la representación dinámica de escenas hasta simulaciones de conducción autónoma y creación de contenido 4D:

Referencias

  1. ^ ab "Salpicaduras gaussianas 3D para renderizado de campos de radiancia en tiempo real". repo-sam.inria.fr . Consultado el 25 de septiembre de 2024 .
  2. ^ abc Fridovich-Keil, Sara; Yu, Alex; Tancik, Matthew; Chen, Qinhong; Recht, Benjamin; Kanazawa, Angjoo (junio de 2022). "Plenoxeles: campos de radiancia sin redes neuronales". Conferencia IEEE/CVF de 2022 sobre visión artificial y reconocimiento de patrones (CVPR) . IEEE. págs. 5491–5500. arXiv : 2112.05131 . doi :10.1109/cvpr52688.2022.00542. ISBN . 978-1-6654-6946-3.
  3. ^ ab Mildenhall, Ben; Srinivasan, Pratul P.; Tancik, Matthew; Barron, Jonathan T.; Ramamoorthi, Ravi; Ng, Ren (2020), "NeRF: Representación de escenas como campos de radiancia neuronal para la síntesis de vistas", Lecture Notes in Computer Science , Cham: Springer International Publishing, págs. 405–421, doi :10.1007/978-3-030-58452-8_24, ISBN 978-3-030-58451-1, consultado el 25 de septiembre de 2024
  4. ^ ab Barron, Jonathan T.; Mildenhall, Ben; Verbin, Dor; Srinivasan, Pratul P.; Hedman, Peter (junio de 2022). "Mip-NeRF 360: campos de radiancia neuronal antialias sin límites". Conferencia IEEE/CVF de 2022 sobre visión artificial y reconocimiento de patrones (CVPR) . IEEE. págs. 5460–5469. arXiv : 2111.12077 . doi :10.1109/cvpr52688.2022.00539. ISBN . 978-1-6654-6946-3.
  5. ^ ab Müller, Thomas; Evans, Alex; Schied, Christoph; Keller, Alexander (julio de 2022). "Primitivas de gráficos neuronales instantáneos con una codificación hash multirresolución". ACM Transactions on Graphics . 41 (4): 1–15. doi :10.1145/3528223.3530127. ISSN  0730-0301.
  6. ^ Wu, Guanjun; Yi, Taoran; Colmillo, Jiemin; Xie, Lingxi; Zhang, Xiaopeng; Wei, Wei; Liu, Wenyu; Tian, ​​Qi; Wang, Xinggang (16 de junio de 2024). "Salpicadura gaussiana 4D para representación dinámica de escenas en tiempo real". Conferencia IEEE/CVF 2024 sobre visión por computadora y reconocimiento de patrones (CVPR) . vol. 38. IEEE. págs. 20310–20320. arXiv : 2310.08528 . doi :10.1109/cvpr52733.2024.01920. ISBN 979-8-3503-5300-6.
  7. ^ Chen, Zilong; Wang, Feng; Wang, Yikai; Liu, Huaping (16 de junio de 2024). "Texto a 3D usando salpicadura gaussiana". Conferencia IEEE/CVF de 2024 sobre visión artificial y reconocimiento de patrones (CVPR) . Vol. abs/2211.0 1324. IEEE. págs. 21401–21412. arXiv : 2309.16585 . doi :10.1109/cvpr52733.2024.02022. ISBN . 979-8-3503-5300-6.
  8. ^ Chen, Li; Wu, Penghao; Chitta, Kashyap; Jaeger, Bernhard; Geiger, Andreas; Li, Hongyang (2024). "Conducción autónoma de extremo a extremo: desafíos y fronteras". Transacciones IEEE sobre análisis de patrones e inteligencia artificial . PP : 1–20. doi :10.1109/tpami.2024.3435937. ISSN  0162-8828. PMID  39078757.
  9. ^ Guédon, Antoine; Lepetit, Vincent (16 de junio de 2024). "SuGaR: salpicadura gaussiana alineada con la superficie para una reconstrucción de malla 3D eficiente y una representación de malla de alta calidad". Conferencia IEEE/CVF de 2024 sobre visión artificial y reconocimiento de patrones (CVPR) . IEEE. págs. 5354–5363. arXiv : 2311.12775 . doi :10.1109/cvpr52733.2024.00512. ISBN . 979-8-3503-5300-6.
  10. ^ Keetha, Nikhil; Karhade, Jay; Jatavallabhula, Krishna Murthy; Yang, Gengshan; Scherer, Sebastian; Ramanan, Deva; Luiten, Jonathon (16 de junio de 2024). "SplaTAM: gaussianas 3D de salpicadura, seguimiento y mapeo para SLAM RGB-D denso". Conferencia IEEE/CVF de 2024 sobre visión artificial y reconocimiento de patrones (CVPR) . IEEE. págs. 21357–21366. doi :10.1109/cvpr52733.2024.02018. ISBN . 979-8-3503-5300-6.
  11. ^ Ling, Huan; Kim, Seung Wook; Torralba, Antonio; Fidler, Sanja; Kreis, Karsten (16 de junio de 2024). "Alinee sus gaussianas: texto a 4D con gaussianas 3D dinámicas y modelos de difusión compuestos". Conferencia IEEE/CVF de 2024 sobre visión artificial y reconocimiento de patrones (CVPR) . IEEE. págs. 8576–8588. arXiv : 2312.13763 . doi :10.1109/cvpr52733.2024.00819. ISBN . 979-8-3503-5300-6.