stringtranslate.com

Estereoscopía de movimiento

Ejemplo de estereoscopía de movimiento, una calle de Cork , Irlanda, en 1927

La estereoscopía Wiggle es un ejemplo de estereoscopía en la que se animan las imágenes izquierda y derecha de un estereograma . Esta técnica también se denomina Wiggle 3-D , Wobble 3-D , Wigglegram o, a veces, Piku-Piku (que en japonés significa "espasmo"). [1]

La sensación de profundidad que ofrecen estas imágenes se debe al paralaje y a los cambios en la oclusión de los objetos del fondo. A diferencia de otras técnicas de visualización estereoscópica, la misma imagen se presenta a ambos ojos.

Ventajas y desventajas

La estereoscopía Wiggle ofrece la ventaja de que no se necesitan gafas ni ningún dispositivo especial; la mayoría de las personas pueden percibir el efecto más rápidamente que cuando se utilizan técnicas de visión bizca y paralela. Además, ofrece una profundidad similar a la de la estereoscopía para personas con visión limitada o nula en un ojo.

Las desventajas de la estereoscopía de movimiento son que no proporciona una verdadera percepción de profundidad binocular ; no es adecuada para medios impresos, ya que está limitada a pantallas que pueden alternar entre las dos imágenes, y es difícil apreciar detalles en imágenes que están constantemente en movimiento.

Número y momento de las imágenes

La mayoría de las imágenes con movimiento utilizan solo dos imágenes, lo que produce una imagen entrecortada. Se puede componer una imagen más suave utilizando varias imágenes intermedias y utilizando las imágenes izquierda y derecha como imágenes finales de la secuencia de imágenes. Si no hay imágenes intermedias disponibles, se pueden calcular imágenes aproximadas a partir de las imágenes finales utilizando técnicas conocidas como interpolación de vistas . [2] Las dos imágenes finales se pueden mostrar durante un tiempo más largo que las imágenes intermedias para permitir la inspección de detalles en las imágenes izquierda y derecha.

Otra opción para reducir la sensación de sacudidas es reducir el tiempo entre los fotogramas de una imagen sacudida. [ cita requerida ]

Fotos 3D a partir de una sola imagen

Un ejemplo de imágenes de retratos monoculares de rostros humanos que se han convertido para crear una foto 3D en movimiento mediante estimación de profundidad mediante aprendizaje automático utilizando TensorFlow.js en el navegador
Un ejemplo de imágenes de retratos monoculares de rostros humanos que se han convertido para crear una foto 3D en movimiento mediante estimación de profundidad mediante aprendizaje automático con TensorFlow.js [3] en el navegador

Con los avances en el aprendizaje automático y la visión por computadora, [3] ahora también es posible recrear este efecto utilizando una única imagen monocular como entrada. [4]

En este caso, se puede utilizar un modelo de segmentación combinado con un modelo de estimación de profundidad [5] para estimar información relacionada con la distancia de las superficies de los objetos en la escena desde un punto de vista dado para cada píxel en esa imagen (conocido como mapa de profundidad ), y con esa información se pueden representar esos datos de píxeles como si fueran tridimensionales para crear un sutil efecto 3D.

Percepción

La sensación de profundidad que ofrecen las imágenes tridimensionales onduladas se debe al paralaje y a los cambios en la oclusión de los objetos de fondo. [6]

Aunque la estereoscopía de movimiento permite la percepción de imágenes estereoscópicas, no es un formato de visualización estereoscópica tridimensional "real" en el sentido de que la estereoscopía de movimiento no presenta a cada ojo su propia visión separada. La sensación de profundidad se puede mejorar cerrando un ojo, lo que elimina la señal visual de vergencia conflictiva de ambos ojos mirando el plano de la imagen.

El aparente efecto estéreo resulta de la sincronización del momento del movimiento y la cantidad de paralaje con el procesamiento realizado por la corteza visual. Tres o cinco imágenes con un buen paralaje pueden producir un mejor efecto que las imágenes simples de izquierda y derecha. [ cita requerida ]

El movimiento de balanceo funciona por la misma razón que una toma panorámica de transición (o un plano secuencia ) en una película proporciona una buena información de profundidad: la corteza visual es capaz de inferir información de distancia a partir del paralaje de movimiento , la velocidad relativa del movimiento percibido de diferentes objetos en la pantalla. Muchos animales pequeños mueven la cabeza para crear paralaje de movimiento (balanceo) de modo que puedan estimar mejor la distancia antes de saltar. [7] [8] [9]

Galería

Véase también

Referencias

  1. ^ Simulación 3D: Wiggle 3D, Shortcourses.com
  2. ^ Para una descripción general reciente de las técnicas de interpolación de vistas, consulte, por ejemplo, N. Martin, S. Roy: Fast view interpolation from stereo: Simpler can be better (PDF), Proceedings of 3DPTV'08, The Fourth International Symposium on 3-D Data Processing, Visualization and Transmission , 18-20 de junio de 2008, Georgia Institute of Technology, Atlanta, Georgia, EE. UU.
  3. ^ ab "Estimación de profundidad", GitHub
  4. ^ "Demostración de profundidad de TensorFlow.js", googleapis.com
  5. ^ "API de profundidad de retrato: convertir una sola imagen en una foto 3D con TensorFlow.js" . Consultado el 1 de julio de 2022 .
  6. ^ John Altoft: Visualización de datos para ESM y ELINT. Visualización de datos tridimensionales e hiperdimensionales, Defense R&D Canada (DRDC) Ottawa, Informe de contrato 2011-084, junio de 2011
  7. ^ Scott B. Steinman; Barbara A. Steinman; Ralph Philip Garzia (2000). Fundamentos de la visión binocular: una perspectiva clínica . McGraw-Hill Medical. pág. 180. ISBN 0-8385-2670-5.
  8. ^ Legg, CR; Lambert, S. (diciembre de 1990). "Estimación de distancia en la rata encapuchada: evidencia experimental del papel de las señales de movimiento". Behavioural Brain Research . 41 (1): 11–20. doi :10.1016/0166-4328(90)90049-K. PMID  2073352. S2CID  45771715.
  9. ^ Ellard, Colin Godfrey; Goodale, Melvin A.; Timney, Brian (octubre de 1984). "Estimación de distancia en el jerbo mongol: el papel de las señales de profundidad dinámicas". Behavioural Brain Research . 14 (1): 29–39. doi :10.1016/0166-4328(84)90017-2. PMID  6518079. S2CID  15508633.

Enlaces externos