La estereoscopía (también llamada estereoscopía o imagen estereoscópica ) es una técnica para crear o mejorar la ilusión de profundidad en una imagen por medio de la estereopsis para la visión binocular . [2] La palabra estereoscopía deriva del griego στερεός (stereos) 'firme, sólido' y σκοπέω (skopeō) 'mirar, ver'. [3] [4] Cualquier imagen estereoscópica se llama estereograma . Originalmente, estereograma se refería a un par de imágenes estéreo que podían verse usando un estereoscopio .
La mayoría de los métodos estereoscópicos presentan un par de imágenes bidimensionales al espectador. La imagen izquierda se presenta al ojo izquierdo y la imagen derecha se presenta al ojo derecho. Cuando se observan, el cerebro humano percibe las imágenes como una única vista en 3D, lo que da al espectador la percepción de profundidad en 3D . Sin embargo, el efecto 3D carece de la profundidad focal adecuada, lo que da lugar al conflicto de convergencia-acomodación .
La estereoscopía se distingue de otros tipos de pantallas 3D que muestran una imagen en tres dimensiones completas , lo que permite al observador aumentar la información sobre los objetos tridimensionales que se muestran mediante los movimientos de la cabeza y los ojos .
La estereoscopía crea la impresión de profundidad tridimensional a partir de un par de imágenes bidimensionales. [5] La visión humana, incluida la percepción de profundidad, es un proceso complejo que comienza con la adquisición de información visual captada a través de los ojos; gran parte del procesamiento se lleva a cabo en el cerebro, en su esfuerzo por dar sentido a la información en bruto. Una de las funciones que se llevan a cabo en el cerebro mientras interpreta lo que ven los ojos es evaluar las distancias relativas de los objetos respecto del observador y la dimensión de profundidad de esos objetos. Las señales que utiliza el cerebro para medir las distancias relativas y la profundidad en una escena percibida incluyen: [6]
(Todas las señales mencionadas anteriormente, excepto las dos primeras, existen en imágenes bidimensionales tradicionales, como pinturas, fotografías y televisión). [7]
La estereoscopía es la producción de la impresión de profundidad en una fotografía , película u otra imagen bidimensional mediante la presentación de una imagen ligeramente diferente a cada ojo , lo que añade la primera de estas señales ( estereopsis ). Las dos imágenes se combinan entonces en el cerebro para dar la percepción de profundidad. Debido a que todos los puntos de la imagen producida por estereoscopía se enfocan en el mismo plano independientemente de su profundidad en la escena original, la segunda señal, el enfoque, no se duplica y, por lo tanto, la ilusión de profundidad es incompleta. También hay principalmente dos efectos de la estereoscopía que no son naturales para la visión humana: (1) el desajuste entre convergencia y acomodación, causado por la diferencia entre la posición percibida de un objeto delante o detrás de la pantalla y el origen real de esa luz; y (2) posible diafonía entre los ojos, causada por la separación imperfecta de imágenes en algunos métodos de estereoscopía.
Aunque el término "3D" se utiliza de forma ubicua, la presentación de imágenes duales en 2D es claramente diferente de la visualización de una imagen en tres dimensiones completas . La diferencia más notable es que, en el caso de las pantallas "3D", el movimiento de la cabeza y los ojos del observador no cambia la información recibida sobre los objetos tridimensionales que se están viendo. Las pantallas holográficas y las pantallas volumétricas no tienen esta limitación. Así como no es posible recrear un campo de sonido tridimensional completo con sólo dos altavoces estereofónicos, es una exageración llamar "3D" a las imágenes duales en 2D. El término preciso "estereoscópico" es más engorroso que el término erróneo común "3D", que se ha arraigado durante muchas décadas de mal uso incuestionable. Aunque la mayoría de las pantallas estereoscópicas no califican como pantallas 3D reales, todas las pantallas 3D reales también son pantallas estereoscópicas porque también cumplen los criterios inferiores.
La mayoría de las pantallas 3D utilizan este método estereoscópico para transmitir imágenes. Fue inventado por primera vez por Sir Charles Wheatstone en 1838, [8] [9] y mejorado por Sir David Brewster , quien fabricó el primer dispositivo portátil de visualización 3D. [10]
Wheatstone utilizó originalmente su estereoscopio (un dispositivo bastante voluminoso) [11] con dibujos porque la fotografía aún no estaba disponible, aunque su artículo original parece prever el desarrollo de un método de obtención de imágenes realista: [12]
Para ilustrar la obra, he empleado únicamente figuras esquemáticas, pues si se hubieran aplicado sombras o colores, se podría suponer que el efecto se debía total o parcialmente a estas circunstancias, mientras que si se las deja de lado, no queda lugar a dudas de que todo el efecto de relieve se debe a la percepción simultánea de las dos proyecciones monoculares, una en cada retina. Pero si se requiere obtener las semejanzas más fieles con los objetos reales, se pueden emplear sombras y colores para realzar los efectos. Una atención cuidadosa permitiría a un artista dibujar y pintar las dos imágenes componentes, de modo que presenten a la mente del observador, en la percepción resultante, una identidad perfecta con el objeto representado. De este modo, se podrían representar flores, cristales, bustos, jarrones, instrumentos de diversos tipos, etc., de modo que no se los pudiera distinguir a simple vista de los objetos reales. [8]
La estereoscopía se utiliza en fotogrametría y también para el entretenimiento a través de la producción de estereogramas. La estereoscopía es útil para ver imágenes renderizadas a partir de grandes conjuntos de datos multidimensionales como los producidos por datos experimentales. La fotografía tridimensional industrial moderna puede utilizar escáneres 3D para detectar y registrar información tridimensional. [13] La información de profundidad tridimensional se puede reconstruir a partir de dos imágenes utilizando una computadora correlacionando los píxeles en las imágenes izquierda y derecha. [14] La solución del problema de correspondencia en el campo de la visión por computadora tiene como objetivo crear información de profundidad significativa a partir de dos imágenes.
Anatómicamente, se requieren tres niveles de visión binocular para ver imágenes estereoscópicas:
Estas funciones se desarrollan en la primera infancia. Algunas personas que tienen estrabismo alteran el desarrollo de la estereopsis, sin embargo, se puede utilizar un tratamiento ortóptico para mejorar la visión binocular . La agudeza estereoscópica de una persona [15] determina la disparidad mínima de imagen que puede percibir como profundidad. Se cree que aproximadamente el 12% de las personas no pueden ver correctamente las imágenes en 3D, debido a una variedad de condiciones médicas. [16] [17] Según otro experimento, hasta el 30% de las personas tienen una visión estereoscópica muy débil que les impide la percepción de profundidad basada en la disparidad estereoscópica. Esto anula o disminuye en gran medida los efectos de inmersión del estéreo para ellos. [18]
La visión estereoscópica puede ser creada artificialmente por el cerebro del espectador, como se demuestra con el efecto Van Hare , donde el cerebro percibe imágenes estereoscópicas incluso cuando las fotografías emparejadas son idénticas. Esta "falsa dimensionalidad" es resultado de la agudeza estereoscópica desarrollada en el cerebro, lo que permite al espectador completar la información en profundidad incluso cuando hay pocas o ninguna pista 3D disponibles en las imágenes emparejadas.
La fotografía estereoscópica tradicional consiste en crear una ilusión 3D a partir de un par de imágenes 2D, un estereograma. La forma más sencilla de mejorar la percepción de profundidad en el cerebro es proporcionar a los ojos del espectador dos imágenes diferentes, que representen dos perspectivas del mismo objeto, con una desviación mínima igual o casi igual a las perspectivas que ambos ojos reciben de forma natural en la visión binocular .
Para evitar la fatiga visual y la distorsión, cada una de las dos imágenes 2D debe presentarse al espectador de manera que cualquier objeto que se encuentre a una distancia infinita sea percibido por el ojo como si estuviera directamente frente a él, sin que los ojos del espectador se bizqueen ni se dispersen. Cuando la imagen no contiene ningún objeto a una distancia infinita, como un horizonte o una nube, las imágenes deben estar espaciadas correspondientemente más cerca unas de otras.
Las ventajas de los visores de imágenes en paralelo son la ausencia de disminución del brillo, lo que permite la presentación de imágenes con una resolución muy alta y en todo el espectro de color, la simplicidad en la creación y la necesidad de poco o ningún procesamiento adicional de las imágenes. En algunas circunstancias, como cuando se presenta un par de imágenes para su visualización libre, no se necesita ningún dispositivo ni equipo óptico adicional.
La principal desventaja de los visores de lado a lado es que la visualización de imágenes de gran tamaño no es práctica y la resolución está limitada por el tamaño del medio de visualización o del ojo humano. Esto se debe a que, a medida que aumentan las dimensiones de una imagen, el aparato de visualización o el propio espectador deben alejarse proporcionalmente de ella para poder verla cómodamente. Acercarse a una imagen para ver más detalles solo sería posible con un equipo de visualización que se ajustara a la diferencia.
La visualización libre consiste en ver un par de imágenes una al lado de la otra sin utilizar un dispositivo de visualización. [2]
Hay dos métodos disponibles para la visualización gratuita: [15] [19]
Algunos defensores de la visión bizca utilizan ahora gafas prismáticas que se enmascaran solas, ya que reducen el grado de convergencia necesario y permiten visualizar imágenes de gran tamaño. Sin embargo, cualquier ayuda para la visión que utilice prismas, espejos o lentes para facilitar la fusión o el enfoque es simplemente un tipo de estereoscopio, excluido por la definición habitual de visión libre.
La fusión estereoscópica de dos imágenes separadas sin la ayuda de espejos o prismas y, al mismo tiempo, su enfoque nítido sin la ayuda de lentes de visión adecuadas requiere inevitablemente una combinación poco natural de convergencia y acomodación ocular . Por lo tanto, la simple visión libre no puede reproducir con precisión las claves de profundidad fisiológicas de la experiencia de visión del mundo real. Diferentes personas pueden experimentar diferentes grados de facilidad y comodidad para lograr la fusión y un buen enfoque, así como diferentes tendencias a la fatiga o tensión ocular.
Un autoestereograma es un estereograma de una sola imagen (SIS), diseñado para crear la ilusión visual de una escena tridimensional (3D) dentro del cerebro humano a partir de una imagen bidimensional externa . Para percibir formas 3D en estos autoestereogramas, uno debe superar la coordinación normalmente automática entre el enfoque y la vergencia .
El estereoscopio es básicamente un instrumento en el que se presentan simultáneamente dos fotografías del mismo objeto, tomadas desde ángulos ligeramente diferentes, una a cada ojo. Un estereoscopio simple está limitado en el tamaño de la imagen que se puede utilizar. Un estereoscopio más complejo utiliza un par de dispositivos horizontales similares a periscopios , lo que permite el uso de imágenes más grandes que pueden presentar información más detallada en un campo de visión más amplio. Se pueden comprar estereoscopios históricos, como los estereoscopios Holmes, como antigüedades.
Algunos estereoscopios están diseñados para ver fotografías transparentes en película o vidrio, conocidas como transparencias o diapositivas y comúnmente llamadas diapositivas . Algunas de las primeras vistas estereoscopio, emitidas en la década de 1850, fueron en vidrio. A principios del siglo XX, las diapositivas de vidrio de 45x107 mm y 6x13 cm eran formatos comunes para la fotografía estereoscópica amateur, especialmente en Europa. En años posteriores, se utilizaron varios formatos basados en película. Los formatos más conocidos para vistas estereoscópicas emitidas comercialmente en película son Tru-Vue , introducido en 1931, y View-Master , introducido en 1939 y todavía en producción. Para diapositivas estereoscópicas amateur, el formato Stereo Realist , introducido en 1947, es con diferencia el más común.
El usuario suele llevar un casco o unas gafas con dos pequeñas pantallas LCD u OLED con lentes de aumento, una para cada ojo. La tecnología se puede utilizar para mostrar películas, imágenes o juegos en estéreo, pero también se puede utilizar para crear una pantalla virtual . Las pantallas montadas en la cabeza también se pueden acoplar a dispositivos de seguimiento de la cabeza, lo que permite al usuario "mirar alrededor" del mundo virtual moviendo la cabeza, eliminando la necesidad de un controlador independiente. Realizar esta actualización con la suficiente rapidez para evitar provocar náuseas en el usuario requiere una gran cantidad de procesamiento de imágenes por ordenador. Si se utiliza un sensor de posición de seis ejes (dirección y posición), el usuario puede moverse dentro de las limitaciones del equipo utilizado. Debido a los rápidos avances en gráficos por ordenador y la continua miniaturización del vídeo y otros equipos, estos dispositivos están empezando a estar disponibles a un coste más razonable.
Se pueden utilizar gafas que se colocan sobre la cabeza o que se pueden llevar puestas para ver una imagen transparente superpuesta a la vista del mundo real, creando lo que se denomina realidad aumentada . Esto se hace reflejando las imágenes de vídeo a través de espejos parcialmente reflectantes. La vista del mundo real se ve a través de la superficie reflectante de los espejos. Se han utilizado sistemas experimentales para juegos, en los que los oponentes virtuales pueden echar un vistazo desde ventanas reales mientras un jugador se mueve. Se espera que este tipo de sistema tenga una amplia aplicación en el mantenimiento de sistemas complejos, ya que puede proporcionar a un técnico lo que es efectivamente una "visión de rayos X" al combinar la representación de gráficos de computadora de elementos ocultos con la visión natural del técnico. Además, los datos técnicos y los diagramas esquemáticos se pueden enviar a este mismo equipo, eliminando la necesidad de obtener y transportar documentos voluminosos en papel.
También se espera que la visión estereoscópica aumentada tenga aplicaciones en cirugía, ya que permite la combinación de datos radiográficos ( tomografías computarizadas y resonancias magnéticas ) con la visión del cirujano.
Una pantalla de retina virtual (VRD), también conocida como pantalla de escaneo de retina (RSD) o proyector de retina (RP), que no debe confundirse con una " pantalla de retina ", es una tecnología de visualización que dibuja una imagen rasterizada (como una imagen de televisión ) directamente sobre la retina del ojo. El usuario ve lo que parece ser una pantalla convencional flotando en el espacio frente a él. Para una estereoscopía verdadera, cada ojo debe tener su propia pantalla discreta. Para producir una pantalla virtual que ocupe un ángulo visual útilmente grande pero que no implique el uso de lentes o espejos relativamente grandes, la fuente de luz debe estar muy cerca del ojo. Una lente de contacto que incorpora una o más fuentes de luz semiconductoras es la forma más comúnmente propuesta. A partir de 2013, la inclusión de medios adecuados de escaneo de haz de luz en una lente de contacto sigue siendo muy problemática, como lo es la alternativa de incrustar una matriz razonablemente transparente de cientos de miles (o millones, para una resolución HD) de fuentes de luz colimadas alineadas con precisión.
Existen dos categorías de tecnología de visores 3D: activos y pasivos. Los visores activos tienen componentes electrónicos que interactúan con una pantalla. Los visores pasivos filtran flujos constantes de información binocular para el ojo correspondiente.
Un sistema de obturador funciona presentando abiertamente la imagen destinada al ojo izquierdo mientras se bloquea la visión del ojo derecho, luego presenta la imagen del ojo derecho mientras se bloquea el ojo izquierdo y repite esto tan rápidamente que las interrupciones no interfieren con la fusión percibida de las dos imágenes en una sola imagen 3D. Generalmente se utilizan gafas de obturador de cristal líquido. El cristal de cada ojo contiene una capa de cristal líquido que tiene la propiedad de oscurecerse cuando se aplica voltaje, siendo transparente de lo contrario. Las gafas están controladas por una señal de temporización que permite que las gafas se oscurezcan alternativamente sobre un ojo y luego sobre el otro, en sincronización con la frecuencia de actualización de la pantalla. El principal inconveniente de los obturadores activos es que la mayoría de los videos y películas 3D se filmaron con vistas izquierda y derecha simultáneas, de modo que introduce un "paralaje temporal" para cualquier cosa que se mueva lateralmente: por ejemplo, alguien que camina a 3,4 mph se verá un 20% demasiado cerca o un 25% demasiado lejos en el caso más actual de una proyección de 2x60 Hz.
Para presentar imágenes estereoscópicas, se proyectan dos imágenes superpuestas en la misma pantalla a través de filtros polarizadores o se presentan en una pantalla con filtros polarizados. Para la proyección, se utiliza una pantalla plateada para preservar la polarización. En la mayoría de las pantallas pasivas, cada dos filas de píxeles está polarizada para un ojo o para el otro. [20] Este método también se conoce como entrelazado. El espectador usa anteojos de bajo costo que también contienen un par de filtros polarizadores opuestos. Como cada filtro solo deja pasar la luz que está polarizada de manera similar y bloquea la luz polarizada opuesta, cada ojo solo ve una de las imágenes y se logra el efecto.
Esta técnica utiliza longitudes de onda específicas de rojo, verde y azul para el ojo derecho, y diferentes longitudes de onda de rojo, verde y azul para el ojo izquierdo. Las gafas que filtran las longitudes de onda muy específicas permiten al usuario ver una imagen 3D a todo color. También se conoce como filtrado de peine espectral o visualización multiplexada de longitud de onda o superanaglifo . Dolby 3D utiliza este principio. El sistema Omega 3D/ Panavision 3D también ha utilizado una versión mejorada de esta tecnología [21]. En junio de 2012, el sistema Omega 3D/Panavision 3D fue descontinuado por DPVO Theatrical, que lo comercializó en nombre de Panavision, citando "condiciones económicas globales y del mercado 3D desafiantes".
Anaglifo 3D es el nombre que se le da al efecto 3D estereoscópico que se logra mediante la codificación de la imagen de cada ojo utilizando filtros de diferentes colores (generalmente cromáticamente opuestos), típicamente rojo y cian . Se pueden utilizar filtros rojo-cian porque nuestros sistemas de procesamiento de la visión utilizan comparaciones de rojo y cian, así como de azul y amarillo, para determinar el color y los contornos de los objetos. Las imágenes 3D anaglifo contienen dos imágenes de colores filtrados de manera diferente, una para cada ojo. Cuando se ven a través de las "gafas anaglifo" "codificadas por colores", cada una de las dos imágenes llega a un ojo, revelando una imagen estereoscópica integrada. La corteza visual del cerebro fusiona esto en la percepción de una escena o composición tridimensional. [22]
El procedimiento ChromaDepth de American Paper Optics se basa en el hecho de que con un prisma los colores están separados en distintos grados. Las gafas ChromaDepth contienen láminas especiales que consisten en prismas microscópicos. Esto hace que la imagen se desplace en una determinada cantidad, dependiendo de su color. Si se utiliza una lámina prismática con un ojo pero no con el otro, las dos imágenes que se ven, dependiendo del color, están más o menos separadas. El cerebro crea la impresión espacial a partir de esta diferencia. La ventaja de esta tecnología consiste sobre todo en el hecho de que se pueden ver imágenes ChromaDepth sin gafas (es decir, bidimensionales) sin problemas (a diferencia de lo que ocurre con los anaglifos de dos colores). Sin embargo, los colores solo se pueden seleccionar de forma limitada, ya que contienen la información de profundidad de la imagen. Si se cambia el color de un objeto, también se modifica su distancia observada. [23]
El efecto Pulfrich se basa en el fenómeno de que el ojo humano procesa las imágenes más lentamente cuando hay menos luz, como cuando se mira a través de una lente oscura. [24] Debido a que el efecto Pulfrich depende del movimiento en una dirección particular para instigar la ilusión de profundidad, no es útil como una técnica estereoscópica general. Por ejemplo, no se puede utilizar para mostrar un objeto estacionario que aparentemente se extiende dentro o fuera de la pantalla; de manera similar, los objetos que se mueven verticalmente no se verán como si se movieran en profundidad. El movimiento incidental de los objetos creará artefactos espurios, y estos efectos incidentales se verán como una profundidad artificial no relacionada con la profundidad real en la escena.
La visión estereoscópica se logra colocando un par de imágenes una encima de otra. Existen visores especiales para el formato superpuesto que inclinan el ojo derecho ligeramente hacia arriba y el izquierdo ligeramente hacia abajo. El más común, con espejos, es el View Magic. Otro, con lentes prismáticos , es el visor KMQ . [25] Un uso reciente de esta técnica es el proyecto openKMQ. [26]
Las tecnologías de visualización autoestereoscópica utilizan componentes ópticos en la pantalla, en lugar de que el usuario los lleve puestos, para permitir que cada ojo vea una imagen diferente. Debido a que no se requiere un casco, también se denomina "3D sin gafas". La óptica divide las imágenes direccionalmente en los ojos del espectador, por lo que la geometría de visualización de la pantalla requiere posiciones limitadas de la cabeza que logren el efecto estereoscópico. Las pantallas automultiscópicas proporcionan múltiples vistas de la misma escena, en lugar de solo dos. Cada vista es visible desde un rango diferente de posiciones frente a la pantalla. Esto permite que el espectador se mueva de izquierda a derecha frente a la pantalla y vea la vista correcta desde cualquier posición. La tecnología incluye dos amplias clases de pantallas: las que utilizan el seguimiento de la cabeza para garantizar que cada uno de los dos ojos del espectador vea una imagen diferente en la pantalla, y las que muestran múltiples vistas para que la pantalla no necesite saber hacia dónde se dirigen los ojos del espectador. Los ejemplos de tecnología de pantallas autoestereoscópicas incluyen lentes lenticulares , barrera de paralaje , pantalla volumétrica , holografía y pantallas de campo de luz .
La holografía láser , en su forma original "pura" de holograma de transmisión fotográfica , es la única tecnología creada hasta ahora que puede reproducir un objeto o una escena con un realismo tan completo que la reproducción es visualmente indistinguible del original, dadas las condiciones de iluminación originales. [ cita requerida ] Crea un campo de luz idéntico al que emanó de la escena original, con paralaje en todos los ejes y un ángulo de visión muy amplio. El ojo enfoca de forma diferencial los objetos a diferentes distancias y los detalles del sujeto se conservan hasta el nivel microscópico. El efecto es exactamente como mirar a través de una ventana. Desafortunadamente, esta forma "pura" requiere que el sujeto esté iluminado con láser y completamente inmóvil (con una precisión de una fracción menor de la longitud de onda de la luz) durante la exposición fotográfica, y se debe utilizar luz láser para ver correctamente los resultados. La mayoría de las personas nunca han visto un holograma de transmisión iluminado con láser. Los tipos de hologramas que se encuentran comúnmente han comprometido seriamente la calidad de la imagen, de modo que se puede utilizar luz blanca común para visualizar, y casi siempre se recurre a procesos de imágenes intermedias no holográficas, como alternativa al uso de láseres pulsados potentes y peligrosos, cuando se fotografían sujetos vivos.
Aunque los procesos fotográficos originales han demostrado ser poco prácticos para el uso general, la combinación de hologramas generados por computadora (CGH) y pantallas holográficas optoelectrónicas, ambas en desarrollo durante muchos años, tiene el potencial de transformar el sueño de medio siglo de la televisión holográfica en 3D en una realidad; hasta ahora, sin embargo, la gran cantidad de cálculos necesarios para generar solo un holograma detallado y el enorme ancho de banda requerido para transmitir un flujo de ellos han confinado esta tecnología al laboratorio de investigación.
En 2013, una empresa de Silicon Valley, LEIA Inc , comenzó a fabricar pantallas holográficas muy adecuadas para dispositivos móviles (relojes, teléfonos inteligentes o tabletas) utilizando una retroiluminación multidireccional y permitiendo un amplio ángulo de visión de paralaje completo para ver contenido 3D sin la necesidad de gafas. [27]
Las pantallas volumétricas utilizan algún mecanismo físico para mostrar puntos de luz dentro de un volumen. Estas pantallas utilizan vóxeles en lugar de píxeles . Las pantallas volumétricas incluyen pantallas multiplanares, que tienen múltiples planos de visualización apilados, y pantallas de panel giratorio, donde un panel giratorio recorre un volumen.
Se han desarrollado otras tecnologías para proyectar puntos de luz en el aire por encima de un dispositivo. Un láser infrarrojo se enfoca hacia el destino en el espacio, generando una pequeña burbuja de plasma que emite luz visible.
La imagen integral es una técnica para producir visualizaciones 3D que son tanto autoestereoscópicas como multiscópicas , lo que significa que la imagen 3D se ve sin el uso de gafas especiales y se ven diferentes aspectos cuando se ve desde posiciones que difieren ya sea horizontal o verticalmente. Esto se logra mediante el uso de una matriz de microlentes (similar a una lente lenticular , pero una matriz X-Y o "ojo de mosca" en la que cada lente suele formar su propia imagen de la escena sin la ayuda de una lente objetivo más grande ) o agujeros para capturar y mostrar la escena como un campo de luz 4D , produciendo imágenes estereoscópicas que exhiben alteraciones realistas de paralaje y perspectiva cuando el espectador se mueve a la izquierda, derecha, arriba, abajo, más cerca o más lejos.
Es posible que la obtención de imágenes integrales no sea técnicamente un tipo de autoestereoscopia, ya que la autoestereoscopia todavía se refiere a la generación de dos imágenes.
La estereoscopía Wiggle es una técnica de visualización de imágenes que se logra alternando rápidamente la visualización de los lados izquierdo y derecho de un estereograma. Se encuentra en formato GIF animado en la web; se pueden ver ejemplos en línea en la colección de estereogramas de la Biblioteca Pública de Nueva York Archivado el 25 de mayo de 2022 en Wayback Machine . La técnica también se conoce como "Piku-Piku". [28]
En el caso de la fotografía estereoscópica de uso general, en la que el objetivo es duplicar la visión humana natural y dar una impresión visual lo más parecida posible a la de estar realmente en el lugar, la línea de base correcta (distancia entre el lugar donde se toman las imágenes derecha e izquierda) sería la misma que la distancia entre los ojos. [29] Cuando las imágenes tomadas con esa línea de base se visualizan utilizando un método de visualización que duplica las condiciones en las que se tomó la fotografía, el resultado sería una imagen muy similar a la que se vería en el lugar donde se tomó la fotografía. Esto podría describirse como "ortoestéreo".
Sin embargo, existen situaciones en las que puede ser conveniente utilizar una línea base más larga o más corta. Los factores a tener en cuenta incluyen el método de visualización que se utilizará y el objetivo al tomar la fotografía. El concepto de línea base también se aplica a otras ramas de la estereografía, como los dibujos estereoscópicos y las imágenes estereoscópicas generadas por computadora , pero implica el punto de vista elegido en lugar de la separación física real de las cámaras o lentes.
El concepto de ventana estereoscópica es siempre importante, ya que la ventana es la imagen estereoscópica de los límites externos de las vistas izquierda y derecha que constituyen la imagen estereoscópica. Si cualquier objeto, que está cortado por los lados laterales de la ventana, se coloca frente a ella, se produce un efecto que no es natural ni deseable; esto se llama "violación de ventana". Esto se puede entender mejor volviendo a la analogía de una ventana física real. Por lo tanto, existe una contradicción entre dos señales de profundidad diferentes: algunos elementos de la imagen están ocultos por la ventana, de modo que la ventana aparece más cerca que estos elementos, y los mismos elementos de la imagen aparecen más cerca que la ventana. Como tal, la ventana estereoscópica siempre debe ajustarse para evitar violaciones de ventana y evitar la incomodidad del espectador debido a señales de profundidad conflictivas.
Algunos objetos se pueden ver desde delante de la ventana, siempre que no lleguen a los lados de la misma. Pero estos objetos no se pueden ver demasiado cerca, ya que siempre existe un límite en el rango de paralaje para una visión cómoda.
Si se ve una escena a través de una ventana, normalmente toda la escena estaría detrás de la ventana (suponiendo una vista paralela, con las imágenes de la izquierda vistas por el ojo izquierdo y viceversa). Si la escena está lejos, estaría a cierta distancia detrás de la ventana; si está cerca, parecería estar justo más allá de la ventana. Un objeto más pequeño que la propia ventana podría incluso atravesar la ventana y aparecer parcial o completamente frente a ella. Lo mismo se aplica a una parte de un objeto más grande que sea más pequeña que la ventana. El objetivo de configurar la ventana estéreo es duplicar este efecto.
Por lo tanto, la ubicación de la ventana en relación con el conjunto de la imagen debe ajustarse de modo que la mayor parte de la imagen se vea más allá de la ventana. En el caso de la visualización en un televisor 3D, es más fácil colocar la ventana delante de la imagen y dejarla en el plano de la pantalla.
Por el contrario, en el caso de la proyección en una pantalla mucho más grande, es mucho mejor colocar la ventana delante de la pantalla (se llama "ventana flotante"), por ejemplo de manera que sea vista a unos dos metros de distancia por los espectadores sentados en la primera fila. Por lo tanto, estas personas verán normalmente el fondo de la imagen en el infinito. Por supuesto, los espectadores sentados más allá verán la ventana más lejos, pero si la imagen se realiza en condiciones normales, de manera que los espectadores de la primera fila vean este fondo en el infinito, los otros espectadores, sentados detrás, también verán este fondo en el infinito, ya que la paralaje de este fondo es igual a la distancia interocular humana media.
Es posible mover la escena completa, incluida la ventana, hacia atrás o hacia adelante en profundidad, deslizando horizontalmente las vistas de los ojos izquierdo y derecho una respecto de la otra. Al mover una o ambas imágenes lejos del centro, se alejará toda la escena del espectador, mientras que al mover una o ambas imágenes hacia el centro, se acercará toda la escena al espectador. Esto es posible, por ejemplo, si se utilizan dos proyectores para esta proyección.
En la fotografía estereoscópica, los ajustes de la ventana se logran desplazando o recortando las imágenes; en otras formas de estereoscopía, como dibujos e imágenes generadas por computadora, la ventana está integrada en el diseño de las imágenes a medida que se generan.
Las imágenes se pueden recortar de forma creativa para crear una ventana estereoscópica que no sea necesariamente rectangular ni se encuentre sobre un plano perpendicular a la línea de visión del espectador. Los bordes del marco estereoscópico pueden ser rectos o curvos y, cuando se ven en 3D, pueden fluir hacia el espectador o alejarse de él y atravesar la escena. Estos marcos estereoscópicos diseñados pueden ayudar a enfatizar ciertos elementos en la imagen estereoscópica o pueden ser un componente artístico de la imagen estereoscópica.
En el método paralelo de visión libre o en la visión 3D asistida por gafas o estereoscopio, las “violaciones de ventana” pueden referirse a sujetos que se recortan más allá del plano focal o la pantalla (como si se estuviera mirando una parte de un objeto grande que llena una ventana estrecha). Sin embargo, la mayoría de las violaciones de ventana se refieren a objetos vistos en vista cruzada (“saltos” donde un objeto aparece antes del plano focal o la pantalla; imagen derecha al ojo izquierdo y viceversa), donde partes del objeto parecen estar físicamente recortadas; imagine un objeto grande extruido a través de una ventana pequeña de tal manera que sus bordes están literalmente cortados. Esta es una violación de ventana tradicional crítica antes de la ventana (entre un espectador y la pantalla), y es más desorientadora porque partes del objeto que sobresale parecen faltar, en lugar de simplemente estar ocultas como estarían con objetos vistos en paralelo más allá de la ventana (profundidad).
Si bien las imágenes estereoscópicas se han utilizado tradicionalmente con fines de entretenimiento, incluidas tarjetas estereográficas , películas en 3D , televisión en 3D , videojuegos estereoscópicos , [30] impresiones que utilizan anaglifos e imágenes, carteles y libros de autoestereogramas , también existen otros usos de esta tecnología.
Salvador Dalí creó algunos estereogramas impresionantes en su exploración de una variedad de ilusiones ópticas. Otros artistas estereoscópicos incluyen a Zoe Beloff, Christopher Schneberger, Rebecca Hackemann, William Kentridge y Jim Naughten. [31] Las imágenes estereoscópicas anaglifas en rojo y cian también se han pintado a mano. [32]
En el siglo XIX, se comprendió que las imágenes estereoscópicas brindaban a las personas la oportunidad de experimentar lugares y cosas lejanas, y se produjeron muchos conjuntos de viajes y se publicaron libros que permitían a las personas aprender sobre geografía, ciencia, historia y otros temas. [33] Estos usos continuaron hasta mediados del siglo XX, cuando la Keystone View Company siguió produciendo tarjetas hasta la década de 1960.
Los Mars Exploration Rovers , lanzados por la NASA en 2003 para explorar la superficie de Marte , están equipados con cámaras únicas que permiten a los investigadores ver imágenes estereoscópicas de la superficie de Marte.
Las dos cámaras que componen la Pancam de cada rover están situadas a 1,5 m sobre la superficie del suelo y separadas por 30 cm, con un grado de convergencia. Esto permite que los pares de imágenes se conviertan en imágenes estereoscópicas de utilidad científica, que pueden verse como estereogramas, anaglifos o procesarse en imágenes de computadora en 3D. [34]
La capacidad de crear imágenes tridimensionales realistas a partir de un par de cámaras situadas aproximadamente a la altura de un ser humano permite a los investigadores comprender mejor la naturaleza de los paisajes que se observan. En entornos sin atmósferas brumosas ni puntos de referencia familiares, los seres humanos dependen de pistas estereoscópicas para calcular la distancia. Por lo tanto, los puntos de vista de una sola cámara son más difíciles de interpretar. Los sistemas estereoscópicos con varias cámaras, como la Pancam, abordan este problema en la exploración espacial sin tripulación.
Los optometristas , oftalmólogos , ortoptistas y terapeutas de la visión utilizan tarjetas estereoscópicas y vectografías en el diagnóstico y tratamiento de la visión binocular y los trastornos acomodativos . [35]
Las fotografías de pares estereoscópicos proporcionaron una forma de visualización tridimensional (3D) de fotografías aéreas ; desde aproximadamente el año 2000, las vistas aéreas en 3D se basan principalmente en tecnologías de imágenes estereoscópicas digitales. Un problema relacionado con las imágenes estereoscópicas es la cantidad de espacio en disco necesario para guardar dichos archivos. De hecho, una imagen estereoscópica generalmente requiere el doble de espacio que una imagen normal. Recientemente, los científicos de visión por computadora intentaron encontrar técnicas para atacar la redundancia visual de los pares estereoscópicos con el objetivo de definir una versión comprimida de los archivos de pares estereoscópicos. [37] [38] Los cartógrafos generan hoy pares estereoscópicos utilizando programas informáticos para visualizar la topografía en tres dimensiones. [39] La visualización estereoscópica computarizada aplica programas de coincidencia estereoscópica. [40] En biología y química, las estructuras moleculares complejas a menudo se representan en pares estereoscópicos. La misma técnica también se puede aplicar a cualquier parámetro matemático (o científico, o de ingeniería) que sea una función de dos variables, aunque en estos casos es más común que se cree un efecto tridimensional utilizando una malla o sombreado "distorsionado" (como si fuera de una fuente de luz distante).