La percepción del movimiento es el proceso de inferir la velocidad y la dirección de los elementos de una escena basándose en información visual , vestibular y propioceptiva . Aunque este proceso parece sencillo para la mayoría de los observadores, ha demostrado ser un problema difícil desde una perspectiva computacional y difícil de explicar en términos de procesamiento neuronal .
La percepción del movimiento es estudiada por muchas disciplinas, incluidas la psicología (es decir, la percepción visual ), la neurología , la neurofisiología , la ingeniería y la informática .
La incapacidad de percibir el movimiento se denomina acinetopsia y puede estar causada por una lesión en el área cortical V5 en la corteza extraestriada . Los estudios neuropsicológicos de un paciente que no podía ver el movimiento y que veía el mundo en una serie de "marcos" estáticos sugirieron que el área visual V5 en los humanos [1] es homóloga al área de procesamiento del movimiento V5/MT en los primates. [2] [3] [4]
Cuando dos o más estímulos se activan y desactivan alternativamente, pueden producir dos percepciones de movimiento distintas. La primera, conocida como movimiento beta , se muestra en la figura de la bola amarilla y forma la base de las pantallas de teletipo de noticias electrónicas . Sin embargo, a velocidades de alternancia más rápidas, y cuando la distancia entre los estímulos es óptima, un "objeto" ilusorio, que coincide con el color de fondo, parece moverse entre los estímulos, ocluyéndolos alternativamente. Este fenómeno se llama fenómeno phi y a menudo se describe como un ejemplo de detección de movimiento "puro", no contaminado por señales de forma, a diferencia del movimiento beta. [5] Sin embargo, esta descripción es algo paradójica ya que crear tal movimiento sin percepciones figurales es imposible.
El fenómeno phi se ha denominado percepción de movimiento de "primer orden". Werner E. Reichardt y Bernard Hassenstein lo han modelado en términos de "sensores de movimiento" relativamente simples en el sistema visual, que han evolucionado para detectar un cambio en la luminancia en un punto de la retina y correlacionarlo con un cambio en la luminancia en un punto vecino de la retina después de un breve retraso. Los sensores que se propone que funcionen de esta manera se han denominado detectores Hassenstein-Reichardt en honor a los científicos Bernhard Hassenstein y Werner Reichardt , quienes los modelaron por primera vez, [6] sensores de movimiento-energía, [7] o detectores Reichardt elaborados. [8] Estos sensores se describen como detectores de movimiento por correlación espacio-temporal y algunos los consideran modelos plausibles de cómo el sistema visual puede detectar el movimiento. (Aunque, una vez más, la noción de un detector de "movimiento puro" adolece del problema de que no existe un estímulo de "movimiento puro", es decir, un estímulo que carezca de propiedades percibidas de figura/fondo). Todavía hay un debate considerable sobre la precisión del modelo y la naturaleza exacta de este proceso propuesto. No está claro cómo el modelo distingue entre los movimientos de los ojos y los movimientos de los objetos en el campo visual, los cuales producen cambios en la luminancia en puntos de la retina.
El movimiento de segundo orden es cuando el contorno en movimiento está definido por el contraste , la textura, el parpadeo o alguna otra cualidad que no resulte en un aumento de la luminancia o la energía del movimiento en el espectro de Fourier del estímulo. [9] [10] Hay mucha evidencia que sugiere que el procesamiento temprano del movimiento de primer y segundo orden se lleva a cabo por vías separadas. [11] Los mecanismos de segundo orden tienen una resolución temporal más pobre y son de paso bajo en términos del rango de frecuencias espaciales a las que responden. (La noción de que las respuestas neuronales están en sintonía con los componentes de frecuencia de la estimulación adolece de la falta de una justificación funcional y ha sido generalmente criticada por G. Westheimer (2001) en un artículo llamado "La teoría de Fourier de la visión"). El movimiento de segundo orden produce un efecto posterior de movimiento más débil a menos que se pruebe con estímulos que parpadean dinámicamente. [12]
La dirección del movimiento de un contorno es ambigua, porque el componente de movimiento paralelo a la línea no se puede inferir a partir de la información visual. Esto significa que una variedad de contornos con diferentes orientaciones que se mueven a diferentes velocidades pueden provocar respuestas idénticas en una neurona sensible al movimiento en el sistema visual.
Algunos han especulado que, después de extraer las señales de movimiento hipotéticas (de primer o segundo orden) de la imagen retiniana, el sistema visual debe integrar esas señales de movimiento locales individuales en varias partes del campo visual en una representación bidimensional o global de objetos y superficies en movimiento. (No está claro cómo esta representación 2D se convierte luego en la percepción 3D). Se requiere un procesamiento adicional para detectar el movimiento coherente o el "movimiento global" presente en una escena. [13]
La capacidad de un sujeto para detectar el movimiento coherente se suele evaluar mediante tareas de discriminación de coherencia del movimiento. Para estas tareas se utilizan patrones dinámicos de puntos aleatorios (también denominados cinematogramas de puntos aleatorios ) que consisten en puntos de "señal" que se mueven en una dirección y puntos de "ruido" que se mueven en direcciones aleatorias. La sensibilidad a la coherencia del movimiento se evalúa midiendo la relación entre los puntos de "señal" y los puntos de "ruido" necesarios para determinar la dirección del movimiento coherente. La relación necesaria se denomina umbral de coherencia del movimiento .
Como en otros aspectos de la visión, la información visual del observador es generalmente insuficiente para determinar la verdadera naturaleza de las fuentes de estímulo, en este caso su velocidad en el mundo real. En la visión monocular , por ejemplo, la información visual será una proyección 2D de una escena 3D. Las señales de movimiento presentes en la proyección 2D serán por defecto insuficientes para reconstruir el movimiento presente en la escena 3D. Dicho de otra manera, muchas escenas 3D serán compatibles con una única proyección 2D. El problema de la estimación del movimiento se generaliza a la visión binocular cuando consideramos la oclusión o la percepción del movimiento a distancias relativamente grandes, donde la disparidad binocular es una mala señal de profundidad. Esta dificultad fundamental se conoce como el problema inverso . [14]
Sin embargo, algunos humanos perciben el movimiento en profundidad. Hay indicios de que el cerebro utiliza diversas señales, en particular los cambios temporales en la disparidad, así como las relaciones de velocidad monocular, para producir una sensación de movimiento en profundidad. [15] Se han planteado dos señales binoculares diferentes de la percepción del movimiento en profundidad: la diferencia de velocidad interocular (IOVD) y la disparidad cambiante (CD) a lo largo del tiempo. El movimiento en profundidad basado en las diferencias de velocidad interocular se puede probar utilizando cinematogramas de puntos aleatorios no correlacionados binocularmente. [16] Los resultados del estudio indican que el procesamiento de estas dos señales binoculares (IOVD y CD) puede utilizar características de estímulo de bajo nivel fundamentalmente diferentes, que pueden procesarse conjuntamente en etapas posteriores. [17] [18] Además, como señal monocular, también el tamaño cambiante de las imágenes retinianas contribuye a la detección del movimiento en profundidad.
La detección y discriminación del movimiento se pueden mejorar mediante un entrenamiento con resultados a largo plazo. Los participantes entrenados para detectar los movimientos de puntos en una pantalla en una sola dirección se vuelven particularmente buenos en la detección de pequeños movimientos en las direcciones alrededor de aquella en la que fueron entrenados. Esta mejora todavía estaba presente 10 semanas después. Sin embargo, el aprendizaje perceptivo es altamente específico. Por ejemplo, los participantes no muestran ninguna mejora cuando se les prueba en otras direcciones de movimiento o para otros tipos de estímulos. [19]
Un mapa cognitivo es un tipo de representación mental que sirve a un individuo para adquirir, codificar, almacenar, recordar y decodificar información sobre las ubicaciones relativas y los atributos de los fenómenos en su entorno espacial. [20] [21] Las células de lugar trabajan con otros tipos de neuronas en el hipocampo y las regiones circundantes del cerebro para realizar este tipo de procesamiento espacial, [22] pero las formas en que funcionan dentro del hipocampo aún se están investigando. [23]
Muchas especies de mamíferos pueden realizar un seguimiento de la ubicación espacial incluso en ausencia de señales visuales, auditivas, olfativas o táctiles, mediante la integración de sus movimientos; la capacidad de hacer esto se conoce en la literatura como integración de trayectorias . Varios modelos teóricos han explorado mecanismos por los cuales la integración de trayectorias podría ser realizada por redes neuronales . En la mayoría de los modelos, como los de Samsonovich y McNaughton (1997) [24] o Burak y Fiete (2009), [25] los ingredientes principales son (1) una representación interna de la posición, (2) representaciones internas de la velocidad y dirección del movimiento, y (3) un mecanismo para cambiar la posición codificada en la cantidad correcta cuando el animal se mueve. Debido a que las células en la corteza entorinal medial (MEC) codifican información sobre la posición ( células de cuadrícula [26] ) y el movimiento ( células de dirección de la cabeza y células conjuntivas de posición por dirección [27] ), esta área actualmente se considera como el candidato más prometedor para el lugar en el cerebro donde ocurre la integración de trayectorias.
La detección del movimiento mediante la visión es crucial para detectar una posible pareja, presa o depredador, y por ello se encuentra tanto en la visión de vertebrados como de invertebrados en una amplia variedad de especies, aunque no se encuentra universalmente en todas ellas. En los vertebrados, el proceso tiene lugar en la retina y, más concretamente, en las células ganglionares de la retina , que son neuronas que reciben información visual de las células bipolares y las células amacrinas y procesan la información de salida a regiones superiores del cerebro, como el tálamo, el hipotálamo y el mesencéfalo.
El estudio de las unidades selectivas direccionales comenzó con el descubrimiento de dichas células en la corteza cerebral de los gatos por parte de David Hubel y Torsten Wiesel en 1959. Tras el informe inicial, Horace B. Barlow y William R. Levick intentaron comprender el mecanismo de las células selectivas direccionales en 1965. [28] Sus experimentos en profundidad en la retina de conejos ampliaron la comprensión anatómica y fisiológica del sistema visual de los vertebrados y despertaron el interés en el campo. Numerosos estudios posteriores han revelado el mecanismo de detección del movimiento en la visión en su mayor parte. El artículo de revisión de 2011 de Alexander Borst y Thomas Euler, "Seeing Things in Motion: Models, Circuits and Mechanisms" [29] analiza ciertos hallazgos importantes desde los primeros descubrimientos hasta el trabajo reciente sobre el tema, llegando a la conclusión del estado actual del conocimiento.
Las células selectivas de dirección (DS) de la retina se definen como neuronas que responden de forma diferencial a la dirección de un estímulo visual. Según Barlow y Levick (1965), el término se utiliza para describir un grupo de neuronas que "emite una descarga vigorosa de impulsos cuando un objeto de estímulo se mueve a través de su campo receptivo en una dirección". [28] Esta dirección en la que un conjunto de neuronas responde con mayor intensidad es su "dirección preferida". Por el contrario, no responden en absoluto a la dirección opuesta, la "dirección nula". La dirección preferida no depende del estímulo, es decir, independientemente del tamaño, la forma o el color del estímulo, las neuronas responden cuando se mueve en su dirección preferida y no responden si se mueve en la dirección nula. Existen tres tipos conocidos de células DS en la retina de vertebrados del ratón: las células ganglionares DS ON/OFF, las células ganglionares DS ON y las células ganglionares DS OFF. Cada una tiene una fisiología y anatomía distintivas. No se cree que existan células selectivas de dirección análogas en la retina de los primates. [30]
Las células ganglionares ON/OFF DS actúan como detectores de movimiento locales. Se activan al inicio y al final de un estímulo (una fuente de luz). Si un estímulo se mueve en la dirección de preferencia de la célula, se activará en el borde anterior y posterior. Su patrón de activación depende del tiempo y está respaldado por el modelo de Reichardt - Hassenstain , que detecta la correlación espaciotemporal entre los dos puntos adyacentes. La explicación detallada del modelo de Reichardt-Hassenstain se proporcionará más adelante en esta sección. La anatomía de las células ON/OFF es tal que las dendritas se extienden hasta dos sublaminas de la capa plexiforme interna y hacen sinapsis con células bipolares y amacrinas. Tienen cuatro subtipos, cada uno con su propia preferencia de dirección.
A diferencia de las células ganglionares ON/OFF DS que responden tanto al borde anterior como al posterior de un estímulo, las células ganglionares ON DS responden solo al borde anterior. Las dendritas de las células ganglionares ON DS son monoestratificadas y se extienden hacia la sublamina interna de la capa plexiforme interna. Tienen tres subtipos con diferentes preferencias direccionales.
Las células ganglionares de la DS OFF actúan como un detector de movimiento centrípeto y responden únicamente al borde posterior de un estímulo. Están sintonizadas con el movimiento ascendente de un estímulo. Las dendritas son asimétricas y se orientan en la dirección de su preferencia. [29]
Las primeras células DS en invertebrados se encontraron en moscas en una estructura cerebral llamada placa lobulillar . La placa lobulillar es una de las tres pilas de neuropilos en el lóbulo óptico de la mosca . Las "células tangenciales" de la placa lobulillar se componen de aproximadamente unas 50 neuronas, y se arborizan extensamente en el neuropilo. Se sabe que las células tangenciales son direccionalmente selectivas con una preferencia direccional distintiva. Una de ellas son las células sensibles horizontalmente (HS), como la neurona H1 , que se despolarizan con mayor fuerza en respuesta a un estímulo que se mueve en una dirección horizontal (dirección preferida). Por otro lado, se hiperpolarizan cuando la dirección del movimiento es opuesta (dirección nula). Las células sensibles verticalmente (VS) son otro grupo de células que son más sensibles al movimiento vertical. Se despolarizan cuando un estímulo se mueve hacia abajo y se hiperpolarizan cuando se mueve hacia arriba. Tanto las células HS como las VS responden con una dirección preferida fija y una dirección nula independientemente del color o el contraste del fondo o del estímulo.
Ahora se sabe que la detección de movimiento en la visión se basa en el modelo de detector Hassenstein-Reichardt. [31] Este es un modelo utilizado para detectar la correlación entre los dos puntos adyacentes. Consta de dos subunidades simétricas. Ambas subunidades tienen un receptor que puede ser estimulado por una entrada (luz en el caso del sistema visual). En cada subunidad, cuando se recibe una entrada, se envía una señal a la otra subunidad. Al mismo tiempo, la señal se retrasa en el tiempo dentro de la subunidad y, después del filtro temporal, se multiplica por la señal recibida de la otra subunidad. Por lo tanto, dentro de cada subunidad, se multiplican los dos valores de brillo, uno recibido directamente de su receptor con un retraso de tiempo y el otro recibido del receptor adyacente. Luego, los valores multiplicados de las dos subunidades se restan para producir una salida. La dirección de selectividad o dirección preferida se determina en función de si la diferencia es positiva o negativa. La dirección que produce un resultado positivo es la dirección preferida.
Para confirmar que el modelo de Reichardt-Hassenstein describe con precisión la selectividad direccional en la retina, el estudio se realizó utilizando registros ópticos de los niveles de calcio citosólico libre después de cargar un tinte indicador fluorescente en las células tangenciales de la mosca. Se le presentaron a la mosca rejillas que se movían uniformemente mientras se medía la concentración de calcio en las puntas dendríticas de las células tangenciales. Las células tangenciales mostraron modulaciones que coincidían con la frecuencia temporal de las rejillas, y la velocidad de las rejillas móviles a la que las neuronas responden con mayor intensidad mostró una dependencia estrecha de la longitud de onda del patrón. Esto confirmó la precisión del modelo tanto a nivel celular como conductual. [32]
Aunque los detalles del modelo de Hassenstein-Reichardt no han sido confirmados a nivel anatómico y fisiológico, el sitio de sustracción en el modelo ahora se está localizando en las células tangenciales. Cuando se inyecta corriente despolarizante en la célula tangencial mientras se presenta un estímulo visual, la respuesta a la dirección preferida de movimiento disminuye y la respuesta a la dirección nula aumenta. Se observó lo opuesto con la corriente hiperpolarizante. Las células T4 y T5, que han sido seleccionadas como fuertes candidatas para proporcionar información a las células tangenciales, tienen cuatro subtipos que se proyectan cada uno en uno de los cuatro estratos de la placa lobulillar que difieren en la orientación preferida. [29]
Uno de los primeros trabajos sobre células de DS en vertebrados fue realizado en la retina de conejo por H. Barlow y W. Levick en 1965. Sus métodos experimentales incluyen variaciones de los experimentos de rendija y el registro de los potenciales de acción en la retina de conejo. La configuración básica del experimento de rendija fue presentar una rejilla en blanco y negro en movimiento a través de una rendija de varios anchos a un conejo y registrar los potenciales de acción en la retina. Este estudio temprano tuvo un gran impacto en el estudio de las células de DS al sentar las bases para estudios posteriores. El estudio mostró que las células ganglionares de DS derivan su propiedad de la actividad discriminante de secuencia de las subunidades, y que esta actividad puede ser el resultado de un mecanismo inhibidor en respuesta al movimiento de la imagen en la dirección nula. También mostró que la propiedad de DS de las células ganglionares de la retina se distribuye por todo el campo receptivo, y no se limita a zonas específicas. La selectividad de dirección está contenida para dos puntos adyacentes en el campo receptivo separados por tan solo 1/4°, pero la selectividad disminuye con separaciones mayores. Utilizaron esto para apoyar su hipótesis de que la discriminación de secuencias da lugar a la selectividad de dirección porque el movimiento normal activaría puntos adyacentes en una sucesión. [28]
Las células ganglionares ON/OFF DS se pueden dividir en 4 subtipos que difieren en su preferencia direccional: ventral, dorsal, nasal o temporal. Las células de diferentes subtipos también difieren en su estructura dendrítica y objetivos sinápticos en el cerebro. Las neuronas que se identificaron por preferir el movimiento ventral también tenían proyecciones dendríticas en la dirección ventral. Además, las neuronas que prefieren el movimiento nasal tenían extensiones dendríticas asimétricas en la dirección nasal. Por lo tanto, se observó una fuerte asociación entre la asimetría estructural y funcional en la dirección ventral y nasal. Con una propiedad y preferencia distintas para cada subtipo, existía la expectativa de que pudieran ser etiquetados selectivamente por marcadores moleculares. De hecho, se demostró que las neuronas que respondían preferentemente al movimiento vertical se expresaban selectivamente por un marcador molecular específico. Sin embargo, aún no se han encontrado marcadores moleculares para otros tres subtipos. [33]
Las células ganglionares selectivas de dirección (DS) reciben entradas de células bipolares y células amacrinas en estrella . Las células ganglionares DS responden a su dirección preferida con un gran potencial postsináptico excitatorio seguido de una pequeña respuesta inhibidora. Por otro lado, responden a su dirección nula con un pequeño potencial postsináptico excitatorio simultáneo y un gran potencial postsináptico inhibidor. Las células amacrinas en estrella se han considerado un fuerte candidato para la selectividad de dirección en las células ganglionares porque pueden liberar tanto GABA como Ach. Sus dendritas se ramifican de forma radiante desde un soma, y hay una superposición dendrítica significativa. Las mediciones ópticas de la concentración de Ca 2+ mostraron que responden fuertemente al movimiento centrífugo (el movimiento hacia afuera desde el soma a las dendritas), mientras que no responden bien al movimiento centrípeto (el movimiento hacia adentro desde las puntas dendríticas hasta el soma). Cuando las células en estrella se eliminaron con toxinas, se eliminó la selectividad de dirección. Además, la liberación de neurotransmisores, en concreto de iones de calcio, refleja una selectividad direccional que, presumiblemente, puede atribuirse al patrón sináptico. El patrón de ramificación está organizado de tal manera que determinadas entradas presinápticas tendrán más influencia en una dendrita determinada que otras, lo que crea una polaridad en la excitación y la inhibición. Otras pruebas sugieren que las células en formación de estrellas liberan neurotransmisores inhibidores, GABA, entre sí de forma retardada y prolongada. Esto explica la propiedad temporal de la inhibición. [29]
Además del desfase espacial debido a las sinapsis GABAérgicas, se ha comenzado a discutir el importante papel de los transportadores de cloruro. La hipótesis popular es que las células amacrinas en estrella expresan transportadores de cloruro de manera diferencial a lo largo de las dendritas. Dada esta suposición, algunas áreas a lo largo de la dendrita tendrán un potencial de equilibrio de iones de cloruro positivo en relación con el potencial de reposo, mientras que otras tendrán un potencial de equilibrio negativo. Esto significa que el GABA en un área se despolarizará y en otra área se hiperpolarizará, lo que explica el desfase espacial presente entre la excitación y la inhibición. [34]
Una investigación reciente (publicada en marzo de 2011) basada en la microscopía electrónica de barrido de caras de bloques en serie (SBEM) ha llevado a la identificación del circuito que influye en la selectividad direccional. Esta nueva técnica proporciona imágenes detalladas del flujo de calcio y la anatomía de las dendritas de las células ganglionares amacrinas en estrella (SAC) y de las células ganglionares DS. Al comparar las direcciones preferidas de las células ganglionares con sus sinapsis en las SAC, Briggman et al. proporcionan evidencia de un mecanismo basado principalmente en señales inhibidoras de las SAC [35] basándose en un estudio de microscopía electrónica de barrido de caras de bloques en serie sobremuestreado de una retina muestreada, que las células ganglionares de la retina pueden recibir entradas inhibidoras asimétricas directamente de las células amacrinas en estrella y, por lo tanto, el cálculo de la selectividad direccional también ocurre postsinápticamente. Estos modelos postsinápticos son poco parsimoniosos, y por lo tanto, si una célula amacrina en estrella transmite información de movimiento a las células ganglionares de la retina, entonces cualquier cálculo de selectividad de dirección "local" postsinápticamente por parte de las células ganglionares de la retina es redundante y disfuncional. Un modelo de transmisión de acetilcolina (ACh) de células amacrinas en estrella selectivas direccionalmente proporciona una sólida base topológica de una detección de movimiento en la retina. [36]