La integración multisensorial , también conocida como integración multimodal , es el estudio de cómo la información de las diferentes modalidades sensoriales (como la vista, el oído, el tacto, el olfato, el movimiento propio y el gusto) puede ser integrada por el sistema nervioso . [1] Una representación coherente de objetos que combina modalidades permite a los animales tener experiencias perceptivas significativas. De hecho, la integración multisensorial es central para el comportamiento adaptativo porque permite a los animales percibir un mundo de entidades perceptivas coherentes. [2] La integración multisensorial también se ocupa de cómo las diferentes modalidades sensoriales interactúan entre sí y alteran el procesamiento de las demás.
La percepción multimodal es la forma en que los animales forman una percepción coherente, válida y sólida al procesar estímulos sensoriales de diversas modalidades. Rodeado de múltiples objetos y recibiendo múltiples estímulos sensoriales, el cerebro se enfrenta a la decisión de cómo categorizar los estímulos resultantes de diferentes objetos o eventos en el mundo físico. El sistema nervioso es, por lo tanto, responsable de si integrar o segregar ciertos grupos de señales. La percepción multimodal ha sido ampliamente estudiada en la ciencia cognitiva, la ciencia del comportamiento y la neurociencia.
Existen cuatro atributos del estímulo: modalidad, intensidad, ubicación y duración. El neocórtex del cerebro de los mamíferos tiene parcelaciones que procesan principalmente la información sensorial de una modalidad. Por ejemplo, el área visual primaria, V1, o el área somatosensorial primaria , S1. Estas áreas se ocupan principalmente de características de estímulos de bajo nivel, como brillo, orientación, intensidad, etc. Estas áreas tienen amplias conexiones entre sí, así como con áreas de asociación superiores que procesan aún más los estímulos y se cree que integran la información sensorial de varias modalidades. Sin embargo, se ha demostrado que también se producen efectos multisensoriales en las áreas sensoriales primarias. [3]
La relación entre el problema de la vinculación y la percepción multisensorial puede considerarse como una cuestión –el problema de la vinculación– y su posible solución –la percepción multisensorial–. El problema de la vinculación surgió de preguntas sin respuesta sobre cómo los mamíferos (en particular los primates superiores) generan una percepción unificada y coherente de su entorno a partir de la cacofonía de ondas electromagnéticas , interacciones químicas y fluctuaciones de presión que forman la base física del mundo que nos rodea. Se investigó inicialmente en el dominio visual (color, movimiento, profundidad y forma), luego en el dominio auditivo y, recientemente, en las áreas multisensoriales. Por lo tanto, se puede decir que el problema de la vinculación es central para la percepción multisensorial . [4]
Sin embargo, las consideraciones sobre cómo se forman las representaciones conscientes unificadas no son el foco completo de la investigación de la integración multisensorial. Obviamente, es importante que los sentidos interactúen para maximizar la eficiencia con la que las personas interactúan con el entorno. Para que la experiencia perceptiva y el comportamiento se beneficien de la estimulación simultánea de múltiples modalidades sensoriales, es necesaria la integración de la información de estas modalidades. A continuación, se examinarán algunos de los mecanismos que median este fenómeno y sus efectos posteriores en los procesos cognitivos y conductuales. La percepción se define a menudo como la experiencia consciente de una persona y, por lo tanto, combina las entradas de todos los sentidos relevantes y el conocimiento previo. La percepción también se define y estudia en términos de extracción de características, que está a varios cientos de milisegundos de distancia de la experiencia consciente. A pesar de la existencia de escuelas de psicología de la Gestalt que abogan por un enfoque holístico del funcionamiento del cerebro, [5] [6] los procesos fisiológicos subyacentes a la formación de percepciones y la experiencia consciente han sido muy poco estudiados. Sin embargo, la creciente investigación en neurociencia continúa enriqueciendo nuestra comprensión de los muchos detalles del cerebro, incluidas las estructuras neuronales implicadas en la integración multisensorial, como el colículo superior (SC) [7] y varias estructuras corticales como el giro temporal superior (GT) y las áreas de asociación visual y auditiva. Aunque la estructura y la función del SC son bien conocidas, la corteza y la relación entre sus partes constituyentes son actualmente objeto de mucha investigación. Al mismo tiempo, el reciente impulso a la integración ha permitido la investigación de fenómenos perceptivos como el efecto de ventriloquia , [8] la localización rápida de estímulos y el efecto McGurk ; [9] culminando en una comprensión más completa del cerebro humano y sus funciones.
Los estudios del procesamiento sensorial en humanos y otros animales se han realizado tradicionalmente de un sentido a la vez, [10] y hasta el día de hoy, numerosas sociedades académicas y revistas se limitan en gran medida a considerar las modalidades sensoriales por separado ( "Investigación de la visión" , "Investigación auditiva", etc.). Sin embargo, también hay una larga y paralela historia de investigación multisensorial. Un ejemplo son los experimentos de Stratton (1896) sobre los efectos somatosensoriales de usar gafas prismáticas que distorsionan la visión. [11] [12] Las interacciones multisensoriales o efectos intermodales en los que la percepción de un estímulo está influenciada por la presencia de otro tipo de estímulo se mencionan desde muy temprano en el pasado. Fueron revisados por Hartmann [13] en un libro fundamental donde, entre varias referencias a diferentes tipos de interacciones multisensoriales, se hace referencia al trabajo de Urbantschitsch en 1888 [14] quien informó sobre la mejora de la agudeza visual por estímulos auditivos en sujetos con cerebros dañados. Este efecto también fue encontrado posteriormente en individuos con cerebros no dañados por Krakov [15] y Hartmann [16], así como el hecho de que la agudeza visual podía ser mejorada por otro tipo de estímulos. [16] También es destacable la cantidad de trabajos a principios de los años 30 sobre relaciones intersensoriales en la Unión Soviética, revisados por Londres. [17] Una investigación multisensorial destacable es el extenso y pionero trabajo de Gonzalo [18] a mediados del siglo XX sobre la caracterización de un síndrome multisensorial en pacientes con lesiones corticales parieto-occipitales. En este síndrome, todas las funciones sensoriales están afectadas, y con bilateralidad simétrica, a pesar de ser una lesión unilateral donde las áreas primarias no estaban involucradas. Una característica de este síndrome es la gran permeabilidad a los efectos transmodales entre estímulos visuales, táctiles, auditivos así como el esfuerzo muscular para mejorar la percepción, disminuyendo también los tiempos de reacción. Se encontró que la mejoría por efecto crossmodal era mayor cuanto más débil era el estímulo primario a percibir, y cuanto mayor era la lesión cortical (Vol 1 y 2 de la referencia [18] ). Este autor interpretó estos fenómenos bajo un concepto fisiológico dinámico, y a partir de un modelo basado en gradientes funcionales a través de la corteza y leyes de escalamiento de sistemas dinámicos, destacando así la unidad funcional de la corteza. Según los gradientes corticales funcionales, la especificidad de la corteza se distribuiría en gradación, y la superposición de diferentes gradientes específicos estaría relacionada con interacciones multisensoriales. [19] La investigación multisensorial ha ganado recientemente un enorme interés y popularidad.
Cuando escuchamos el claxon de un coche , determinaríamos qué coche lo activa en función del coche que vemos que está más cerca del claxon en el espacio. Es un ejemplo de congruencia espacial al combinar estímulos visuales y auditivos. Por otro lado, el sonido y las imágenes de un programa de televisión se integrarían como congruentes estructuralmente al combinar estímulos visuales y auditivos. Sin embargo, si el sonido y las imágenes no encajaran de forma significativa, segregaríamos los dos estímulos. Por lo tanto, la congruencia espacial o estructural proviene no solo de la combinación de los estímulos, sino que también está determinada por nuestra comprensión.
La literatura sobre sesgos intermodales espaciales sugiere que la modalidad visual a menudo influye en la información de otros sentidos. [20] Algunas investigaciones indican que la visión domina lo que escuchamos, al variar el grado de congruencia espacial. Esto se conoce como el efecto ventrílocuo. [21] En los casos de integración visual y háptica, los niños menores de 8 años muestran dominio visual cuando se les requiere identificar la orientación de los objetos. Sin embargo, el dominio háptico ocurre cuando el factor a identificar es el tamaño del objeto. [22] [23]
Según Welch y Warren (1980), la hipótesis de adecuación de la modalidad establece que la influencia de la percepción en cada modalidad en la integración multisensorial depende de la adecuación de esa modalidad para la tarea dada. Por lo tanto, la visión tiene una mayor influencia en la localización integrada que la audición, y la audición y el tacto tienen una mayor influencia en las estimaciones de tiempo que la visión. [24] [25]
Estudios más recientes perfeccionan esta explicación cualitativa temprana de la integración multisensorial. Alais y Burr (2004) descubrieron que, tras una degradación progresiva de la calidad de un estímulo visual, la percepción de la ubicación espacial de los participantes estaba determinada progresivamente más por una señal auditiva simultánea. [26] Sin embargo, también cambiaron progresivamente la incertidumbre temporal de la señal auditiva; finalmente concluyeron que es la incertidumbre de las modalidades individuales la que determina en qué medida se tiene en cuenta la información de cada modalidad al formar una percepción. [26] Esta conclusión es similar en algunos aspectos a la "regla de la efectividad inversa". El grado en que se produce la integración multisensorial puede variar según la ambigüedad de los estímulos relevantes. En apoyo de esta noción, un estudio reciente muestra que los sentidos débiles, como el olfato, pueden incluso modular la percepción de la información visual siempre que la fiabilidad de las señales visuales se vea adecuadamente comprometida. [27]
La teoría de la integración bayesiana se basa en el hecho de que el cerebro debe manejar una serie de entradas, que varían en fiabilidad. [28] Al manejar estas entradas, debe construir una representación coherente del mundo que corresponda a la realidad. La perspectiva de la integración bayesiana es que el cerebro utiliza una forma de inferencia bayesiana . [29] Esta perspectiva ha sido respaldada por el modelado computacional de dicha inferencia bayesiana a partir de señales hasta una representación coherente, que muestra características similares a la integración en el cerebro. [29]
Con el supuesto de independencia entre las distintas fuentes, el modelo tradicional de combinación de señales es exitoso en la integración de modalidades. Sin embargo, dependiendo de las discrepancias entre modalidades, puede haber diferentes formas de fusión de estímulos: integración, integración parcial y segregación. Para entender completamente los otros dos tipos, tenemos que usar el modelo de inferencia causal sin el supuesto como modelo de combinación de señales. Esta libertad nos da una combinación general de cualquier número de señales y modalidades usando la regla de Bayes para hacer inferencia causal de señales sensoriales. [30]
La diferencia entre los dos modelos es que el modelo jerárquico puede hacer inferencias causales explícitas para predecir ciertos estímulos, mientras que el modelo no jerárquico solo puede predecir la probabilidad conjunta de los estímulos. Sin embargo, el modelo jerárquico es en realidad un caso especial de modelo no jerárquico al establecer la probabilidad previa conjunta como un promedio ponderado de la probabilidad previa de las causas comunes e independientes, cada una ponderada por su probabilidad previa. Con base en la correspondencia de estos dos modelos, también podemos decir que el modelo jerárquico es una mezcla modal del modelo no jerárquico.
En el modelo bayesiano , los valores a priori y la probabilidad generalmente representan las estadísticas del entorno y las representaciones sensoriales. La independencia de los valores a priori y las probabilidades no está asegurada, ya que los valores a priori pueden variar con la probabilidad solo por las representaciones. Sin embargo, Shams ha demostrado la independencia con una serie de control de parámetros en un experimento de percepción multisensorial. [31]
El enfoque de la intencionalidad compartida propone la explicación holística de los procesos neurofisiológicos que subyacen a la formación de percepciones y experiencias conscientes. El constructo psicológico de la intencionalidad compartida fue introducido a finales del siglo XX. [32] [33] [34] Michael Tomasello lo desarrolló para explicar la cognición que comienza en la etapa de desarrollo temprana a través de la colaboración inconsciente en díadas madre-hijo. [35] [36] En los últimos veinte años, el conocimiento de esta noción ha evolucionado a través de la observación de la intencionalidad compartida desde diferentes perspectivas, por ejemplo, la psicofisiología , [37] [38] y la neurobiología . [39] Según Igor Val Danilov, la intencionalidad compartida permite a la pareja madre-hijo compartir el estímulo sensorial esencial del problema cognitivo real. [40] La hipótesis de que los procesos neurofisiológicos ocurren durante la intencionalidad compartida explica su complejidad integradora desde los niveles de dinámica neuronal a interpersonal. [41] Esta interacción colaborativa proporciona un aprendizaje ambiental del organismo inmaduro, a partir de la etapa de reflejos del desarrollo, para procesar la organización, identificación e interpretación de la información sensorial en el desarrollo de la percepción. [42] Desde esta perspectiva, la intencionalidad compartida contribuye a la formación de percepciones y experiencias conscientes, resolviendo el problema vinculante , o al menos complementa uno de los mecanismos señalados anteriormente. [43]
Las contribuciones de Barry Stein, Alex Meredith y sus colegas (por ejemplo, "La fusión de los sentidos", 1993, [44] ) se consideran ampliamente como el trabajo pionero en el campo moderno de la integración multisensorial. A través de un estudio detallado a largo plazo de la neurofisiología del colículo superior, destilaron tres principios generales mediante los cuales se puede describir mejor la integración multisensorial.
Hasta principios de este siglo, la literatura científica se rigió por un enfoque unimodal, que permitió una rápida progresión del mapeo neuronal y una mejor comprensión de las estructuras neuronales, pero que, con algunas excepciones, la investigación de la percepción permaneció relativamente estancada. El reciente entusiasmo renovado por la investigación perceptual es indicativo de un cambio sustancial que se aleja del reduccionismo y se orienta hacia las metodologías gestálticas. La teoría de la Gestalt, dominante a finales del siglo XIX y principios del XX, propugnaba dos principios generales: el «principio de totalidad», según el cual la experiencia consciente debe considerarse globalmente, y el «principio de isomorfismo psicofísico», que afirma que los fenómenos perceptuales están correlacionados con la actividad cerebral. Justo estas ideas ya las aplicó Justo Gonzalo en su trabajo sobre dinámica cerebral, donde se considera una correspondencia sensorio-cerebral en la formulación del «desarrollo del campo sensorial debido a un isomorfismo psicofísico» (pág. 23 de la traducción inglesa de la ref. [19] ). Ambas ideas, el "principio de totalidad" y el "isomorfismo psicofísico", son particularmente relevantes en el clima actual y han impulsado a los investigadores a investigar los beneficios conductuales de la integración multisensorial.
Se ha reconocido ampliamente que la incertidumbre en los dominios sensoriales da como resultado una mayor dependencia de la integración multisensorial. [26] Por lo tanto, se deduce que las señales de múltiples modalidades que son sincrónicas tanto temporal como espacialmente se consideran neuronalmente y perceptualmente como emanando de la misma fuente. El grado de sincronía que se requiere para que se produzca esta "unión" se está investigando actualmente en una variedad de enfoques. [50] La función integradora solo se produce hasta un punto más allá del cual el sujeto puede diferenciarlos como dos estímulos opuestos. Al mismo tiempo, se puede extraer una conclusión intermedia significativa de la investigación realizada hasta el momento. Los estímulos multisensoriales que están ligados a un solo percepto, también están ligados a los mismos campos receptivos de las neuronas multisensoriales en el SC y la corteza. [26]
Las respuestas a múltiples estímulos sensoriales simultáneos pueden ser más rápidas que las respuestas a los mismos estímulos presentados de forma aislada. Hershenson (1962) presentó una luz y un tono de forma simultánea y por separado, y pidió a los participantes humanos que respondieran lo más rápidamente posible a ellos. Al variar la asincronía entre los inicios de ambos estímulos, se observó que para ciertos grados de asincronía, los tiempos de reacción disminuyeron. [51] Estos niveles de asincronía fueron bastante pequeños, tal vez reflejando la ventana temporal que existe en las neuronas multisensoriales del SC. Estudios posteriores han analizado los tiempos de reacción de los movimientos oculares sacádicos; [52] y más recientemente correlacionaron estos hallazgos con fenómenos neuronales. [53] En pacientes estudiados por Gonzalo , [18] con lesiones en la corteza parietooccipital, se demostró que la disminución del tiempo de reacción a un estímulo dado mediante la facilitación intersensorial era muy notable.
El efecto de objetivo redundante es la observación de que las personas suelen responder más rápido a objetivos dobles (dos objetivos presentados simultáneamente) que a cualquiera de los objetivos presentados por separado. Esta diferencia en latencia se denomina ganancia de redundancia (RG). [54]
En un estudio realizado por Forster, Cavina-Pratesi, Aglioti y Berlucchi (2001), los observadores normales respondieron más rápido a estímulos visuales y táctiles simultáneos que a estímulos visuales o táctiles individuales. El TR a estímulos visuales y táctiles simultáneos también fue más rápido que el TR a estímulos visuales o táctiles duales simultáneos. La ventaja del TR a estímulos visuales y táctiles combinados sobre el TR a otros tipos de estimulación podría explicarse por la facilitación neuronal intersensorial en lugar de por la suma de probabilidades. Estos efectos pueden atribuirse a la convergencia de entradas táctiles y visuales en centros neuronales que contienen representaciones multisensoriales flexibles de partes del cuerpo. [55]
Se ha descubierto que dos estímulos bimodales convergentes pueden producir una percepción que no sólo es diferente en magnitud que la suma de sus partes, sino también bastante diferente en calidad. En un estudio clásico denominado efecto McGurk , [56] la producción de fonemas de una persona fue doblada con un vídeo de esa persona diciendo un fonema diferente. [57] El resultado fue la percepción de un tercer fonema diferente. McGurk y MacDonald (1976) explicaron que los fonemas como ba, da, ka, ta, ga y pa se pueden dividir en cuatro grupos, los que se pueden confundir visualmente, es decir (da, ga, ka, ta) y (ba y pa), y los que se pueden confundir audiblemente. Por tanto, cuando ba – voz y ga labios se procesan juntos, la modalidad visual ve ga o da, y la modalidad auditiva oye ba o da, combinándose para formar el percepto da. [56]
El ventriloquismo se ha utilizado como evidencia de la hipótesis de adecuación de la modalidad. El efecto del ventriloquismo es la situación en la que la percepción de la ubicación auditiva se desplaza hacia una señal visual. El estudio original que describe este fenómeno fue realizado por Howard y Templeton (1966), después del cual varios estudios han replicado y se han basado en las conclusiones a las que llegaron. [58] En condiciones en las que la señal visual es inequívoca, la captura visual ocurre de manera confiable. Por lo tanto, para probar la influencia del sonido en la ubicación percibida, el estímulo visual debe degradarse progresivamente. [26] Además, dado que los estímulos auditivos están más en sintonía con los cambios temporales, estudios recientes han probado la capacidad de las características temporales para influir en la ubicación espacial de los estímulos visuales. Algunos tipos de EVP ( fenómeno de voz electrónica ), principalmente los que utilizan burbujas de sonido, se consideran un tipo de técnica de ventriloquismo moderna y se reproducen mediante el uso de software sofisticado, computadoras y equipos de sonido.
La ilusión del doble destello fue reportada como la primera ilusión que demostró que los estímulos visuales pueden ser alterados cualitativamente por estímulos auditivos. [59] En el paradigma estándar, a los participantes se les presentan combinaciones de uno a cuatro destellos acompañados de cero a cuatro pitidos. Luego se les pidió que dijeran cuántos destellos percibieron. Los participantes percibieron destellos ilusorios cuando hubo más pitidos que destellos. Los estudios de fMRI han demostrado que hay una activación intermodal en áreas visuales tempranas de bajo nivel, que fue cualitativamente similar a la percepción de un destello real. Esto sugiere que la ilusión refleja la percepción subjetiva del destello adicional. [60] Además, los estudios sugieren que el momento de la activación multisensorial en las cortezas unisensoriales es demasiado rápido para ser mediado por una integración de orden superior, lo que sugiere conexiones de retroalimentación o laterales. [61] Un estudio ha revelado el mismo efecto pero de la visión a la audición, así como efectos de fisión en lugar de fusión, aunque el nivel del estímulo auditivo se redujo para hacerlo menos relevante para aquellas ilusiones que afectan la audición. [62]
En la ilusión de la mano de goma (RHI), [63] los participantes humanos ven una mano ficticia que es acariciada con un pincel, mientras sienten una serie de pinceladas idénticas aplicadas a su propia mano, que está oculta a la vista. Si esta información visual y táctil se aplica de manera sincrónica, y si la apariencia visual y la posición de la mano ficticia son similares a la de la propia mano, entonces las personas pueden sentir que los toques en su propia mano provienen de la mano ficticia, e incluso que la mano ficticia es, de alguna manera, su propia mano. [63] Esta es una forma temprana de ilusión de transferencia corporal .
La RHI es una ilusión de visión, tacto y postura ( propiocepción ), pero también se puede inducir una ilusión similar con el tacto y la propiocepción. [64] También se ha descubierto que la ilusión puede no requerir estimulación táctil en absoluto, pero se puede inducir completamente utilizando la mera visión de la mano de goma en una postura congruente con la mano real oculta. [65]
El primer informe de este tipo de ilusión puede haber sido ya en 1937 (Tastevin, 1937). [66] [67] [68]
La ilusión de transferencia corporal generalmente implica el uso de dispositivos de realidad virtual para inducir la ilusión en el sujeto de que el cuerpo de otra persona o ser es su propio cuerpo.
El colículo superior (SC) o techo óptico (OT) es parte del techo, ubicado en el mesencéfalo, superior al tronco encefálico e inferior al tálamo. Contiene siete capas de materia blanca y gris alternadas, de las cuales las superficiales contienen mapas topográficos del campo visual; y las capas más profundas contienen mapas espaciales superpuestos de las modalidades visual, auditiva y somatosensorial. [69] La estructura recibe aferencias directamente de la retina, así como de varias regiones de la corteza (principalmente el lóbulo occipital), la médula espinal y el colículo inferior. Envía eferencias a la médula espinal, el cerebelo, el tálamo y el lóbulo occipital a través del núcleo geniculado lateral (LGN). La estructura contiene una alta proporción de neuronas multisensoriales y desempeña un papel en el control motor de las conductas de orientación de los ojos, los oídos y la cabeza. [53]
Los campos receptivos de las modalidades somatosensoriales, visuales y auditivas convergen en las capas más profundas para formar un mapa multisensorial bidimensional del mundo externo. Aquí, los objetos que se encuentran frente a nosotros se representan caudalmente y los objetos de la periferia se representan rosteralmente. De manera similar, las ubicaciones en el espacio sensorial superior se representan medialmente y las ubicaciones inferiores se representan lateralmente. [44]
Sin embargo, a diferencia de la simple convergencia, el SC integra información para crear una salida que difiere de la suma de sus entradas. Siguiendo un fenómeno denominado "regla espacial", las neuronas se excitan si los estímulos de múltiples modalidades caen en el mismo campo receptivo o en campos adyacentes, pero se inhiben si los estímulos caen en campos dispares. [70] Las neuronas excitadas pueden entonces proceder a inervar varios músculos y estructuras neuronales para orientar el comportamiento y la atención de un individuo hacia el estímulo. Las neuronas en el SC también se adhieren a la "regla temporal", en la que la estimulación debe ocurrir dentro de una proximidad temporal cercana para excitar a las neuronas. Sin embargo, debido al tiempo de procesamiento variable entre las modalidades y la velocidad relativamente más lenta del sonido a la luz, se ha descubierto que las neuronas pueden excitarse de manera óptima cuando se estimulan con cierto tiempo de diferencia. [71]
Se ha demostrado que las neuronas individuales del putamen del macaco tienen respuestas visuales y somatosensoriales estrechamente relacionadas con las de la zona polisensorial de la corteza premotora y el área 7b del lóbulo parietal. [72] [73]
Las neuronas multisensoriales existen en una gran cantidad de lugares, a menudo integradas con neuronas unimodales. Recientemente se han descubierto en áreas que antes se creía que eran específicas de una modalidad, como la corteza somatosensorial, así como en grupos en los límites entre los lóbulos cerebrales principales, como el espacio occipitoparietal y el espacio occipitotemporal. [74] [53] [75]
Sin embargo, para que se produzcan tales cambios fisiológicos, debe existir una conectividad continua entre estas estructuras multisensoriales. En general, se acepta que el flujo de información dentro de la corteza sigue una configuración jerárquica. [76] Hubel y Wiesel demostraron que los campos receptivos y, por lo tanto, la función de las estructuras corticales, a medida que se avanza desde V1 a lo largo de las vías visuales, se vuelven cada vez más complejos y especializados. [76] A partir de esto, se postuló que la información fluía hacia afuera en un modo de retroalimentación; los productos finales complejos finalmente se unían para formar un percepto. Sin embargo, a través de fMRI y tecnologías de registro intracraneal, se ha observado que el tiempo de activación de los niveles sucesivos de la jerarquía no se correlaciona con una estructura de retroalimentación. Es decir, se ha observado una activación tardía en la corteza estriada, marcadamente después de la activación de la corteza prefrontal en respuesta al mismo estímulo. [77]
Como complemento, se han encontrado fibras nerviosas aferentes que se proyectan a áreas visuales tempranas como el giro lingual desde finales de las corrientes visuales dorsal (acción) y ventral (percepción), así como desde la corteza de asociación auditiva. [78] También se han observado proyecciones de retroalimentación en la zarigüeya directamente desde la corteza de asociación auditiva a V1. [76] Esta última observación actualmente resalta un punto de controversia dentro de la comunidad neurocientífica. Sadato et al. (2004) concluyeron, en línea con Bernstein et al. (2002), que la corteza auditiva primaria (A1) era funcionalmente distinta de la corteza de asociación auditiva, en el sentido de que carecía de cualquier interacción con la modalidad visual. Por lo tanto, concluyeron que A1 no se vería afectada en absoluto por la plasticidad intermodal . [79] [80] Esto coincide con la afirmación de Jones y Powell (1970) de que las áreas sensoriales primarias están conectadas solo a otras áreas de la misma modalidad. [81]
Por el contrario, la vía auditiva dorsal, que se proyecta desde el lóbulo temporal, se ocupa en gran medida del procesamiento de la información espacial y contiene campos receptivos que están organizados topográficamente. Las fibras de esta región se proyectan directamente a las neuronas que gobiernan los campos receptivos correspondientes en V1. [76] Las consecuencias perceptivas de esto aún no se han reconocido empíricamente. Sin embargo, se puede plantear la hipótesis de que estas proyecciones pueden ser las precursoras de una mayor agudeza y énfasis de los estímulos visuales en áreas relevantes del espacio perceptivo. En consecuencia, este hallazgo rechaza la hipótesis de Jones y Powell (1970) [81] y, por lo tanto, está en conflicto con los hallazgos de Sadato et al. (2004). [79] Una resolución a esta discrepancia incluye la posibilidad de que las áreas sensoriales primarias no se puedan clasificar como un solo grupo y, por lo tanto, pueden ser mucho más diferentes de lo que se pensaba anteriormente.
El síndrome multisensorial con bilateralidad simétrica, caracterizado por Gonzalo y denominado por este autor ‘síndrome central de la corteza’, [18] [19] se originó a partir de una lesión cortical parietooccipital unilateral equidistante de las áreas de proyección visual, táctil y auditiva (la mitad del área 19, la parte anterior del área 18 y la más posterior del área 39, en terminología de Brodmann) que se denominó ‘zona central’. La gradación observada entre síndromes llevó a este autor a proponer un esquema de gradiente funcional en el que la especificidad de la corteza se distribuye con una variación continua, [19] la superposición de los gradientes específicos sería alta o máxima en esa ‘zona central’.
Área F4 en macacos
Área F5 en macacos [82] [83]
Zona polisensorial de la corteza premotora (ZP) en macacos [84]
Corteza visual primaria (V1) [85]
Giro lingual en humanos
Complejo occipital lateral (LOC), que incluye el área visual táctil occipital lateral (LOtv) [86]
Surco intraparietal ventral (VIP) en macacos [82]
Surco intraparietal lateral (LIP) en macacos [82]
Área 7b en macacos [87]
Segunda corteza somatosensorial (SII) [88]
Corteza auditiva primaria (A1)
Corteza temporal superior (STG/STS/PT) Se sabe que las interacciones intermodales audiovisuales ocurren en la corteza de asociación auditiva que se encuentra directamente debajo de la cisura de Silvio en el lóbulo temporal. [79] Petitto et al. (2000) observaron plasticidad en el giro temporal superior (STG) . [89] Aquí, se encontró que el STG era más activo durante la estimulación en sordos nativos que hablaban señas en comparación con los no oyentes. Al mismo tiempo, investigaciones posteriores han revelado diferencias en la activación del Planum temporale (PT) en respuesta a movimientos no lingüísticos de los labios entre oyentes y sordos; así como una activación progresivamente creciente de la corteza de asociación auditiva a medida que los participantes previamente sordos adquieren experiencia auditiva a través de un implante coclear. [79]
Surco ectosilviano anterior (SEA) en gatos [90] [91] [92]
Surco suprasilviano lateral rostral (rLS) en gatos [91]
La interacción más significativa entre estos dos sistemas (interacciones corticotectales) es la conexión entre el surco ectosilviano anterior (SEA), que se encuentra en la unión de los lóbulos parietal, temporal y frontal, y el SC. El SEA se divide en tres regiones unimodales con neuronas multisensoriales en las uniones entre estas secciones. [93] (Jiang y Stein, 2003). Las neuronas de las regiones unimodales se proyectan a las capas profundas del SC e influyen en el efecto de integración multiplicativa. Es decir, aunque pueden recibir entradas de todas las modalidades de forma normal, el SC no puede mejorar o deprimir el efecto de la estimulación multisensorial sin la entrada del SEA. [93]
Al mismo tiempo, las neuronas multisensoriales del sistema AES, aunque también están conectadas integralmente a las neuronas AES unimodales, no están conectadas directamente al sistema SC. Este patrón de división se refleja en otras áreas de la corteza, lo que da como resultado la observación de que los sistemas multisensoriales cortical y tectal están algo disociados. [94] Stein, London, Wilkinson y Price (1996) analizaron la luminancia percibida de un LED en el contexto de distractores auditivos espacialmente dispares de varios tipos. Un hallazgo significativo fue que un sonido aumentó el brillo percibido de la luz, independientemente de sus ubicaciones espaciales relativas, siempre que la imagen de la luz se proyectara sobre la fóvea. [95] Aquí, la aparente falta de la regla espacial diferencia aún más las neuronas multisensoriales corticales y tectales. Existe poca evidencia empírica para justificar esta dicotomía. Sin embargo, las neuronas corticales que gobiernan la percepción y un sistema subcortical separado que gobierna la acción (comportamiento de orientación) es sinónimo de la hipótesis de la acción de percepción del flujo visual. [96] Es necesaria una mayor investigación en este campo antes de poder hacer afirmaciones sustanciales.
Las investigaciones sugieren la existencia de dos rutas multisensoriales para el "qué" y el "dónde". La ruta del "qué" que identifica la identidad de las cosas involucra el área 9 de Brodmann en el giro frontal inferior derecho y el giro frontal medio derecho , el área 13 de Brodmann y el área 45 de Brodmann en la ínsula derecha - área del giro frontal inferior, y el área 13 de Brodmann bilateralmente en la ínsula. La ruta del "dónde" que detecta sus atributos espaciales involucra el área 40 de Brodmann en el lóbulo parietal inferior derecho e izquierdo y el área 7 de Brodmann en el precuneo derecho - lóbulo parietal superior y el área 7 de Brodmann en el lóbulo parietal superior izquierdo. [97]
Todas las especies dotadas de múltiples sistemas sensoriales los utilizan de manera integradora para lograr la acción y la percepción. [44] Sin embargo, en la mayoría de las especies, especialmente los mamíferos superiores y los humanos, la capacidad de integración se desarrolla en paralelo con la madurez física y cognitiva. Los niños hasta ciertas edades no muestran patrones de integración maduros. [98] [99] Clásicamente, se han propuesto dos puntos de vista opuestos que son principalmente manifestaciones modernas de la dicotomía nativista/empirista. El punto de vista de la integración (empirista) afirma que al nacer, las modalidades sensoriales no están en absoluto conectadas. Por lo tanto, es solo a través de la exploración activa que pueden ocurrir cambios plásticos en el sistema nervioso para iniciar percepciones y acciones holísticas. Por el contrario, la perspectiva de la diferenciación (nativista) afirma que el sistema nervioso joven está altamente interconectado; y que durante el desarrollo, las modalidades se diferencian gradualmente a medida que se ensayan las conexiones relevantes y se descartan las irrelevantes. [100]
Utilizando el SC como modelo, se puede analizar la naturaleza de esta dicotomía. En el gato recién nacido, las capas profundas del SC contienen sólo neuronas que responden a la modalidad somatosensorial. En el plazo de una semana, comienzan a aparecer las neuronas auditivas, pero no es hasta dos semanas después del nacimiento que aparecen las primeras neuronas multisensoriales. Otros cambios continúan, con la llegada de las neuronas visuales después de tres semanas, hasta que el SC ha alcanzado su estructura completamente madura después de tres a cuatro meses. Al mismo tiempo, en las especies de monos, los recién nacidos están dotados de un complemento significativo de células multisensoriales; sin embargo, al igual que en los gatos, no hay un efecto de integración aparente hasta mucho más tarde. [53] Se cree que este retraso es el resultado del desarrollo relativamente más lento de las estructuras corticales, incluido el AES; que, como se dijo anteriormente, es esencial para la existencia del efecto de integración. [93]
Además, Wallace (2004) descubrió que los gatos criados en un entorno privado de luz tenían campos receptivos visuales severamente subdesarrollados en las capas profundas del SC. [53] Aunque se ha demostrado que el tamaño del campo receptivo disminuye con la madurez, el hallazgo anterior sugiere que la integración en el SC es una función de la experiencia. Sin embargo, la existencia de neuronas multisensoriales visuales, a pesar de una completa falta de experiencia visual, resalta la aparente relevancia de los puntos de vista nativistas. El desarrollo multisensorial en la corteza se ha estudiado en menor medida, sin embargo, se realizó un estudio similar al presentado anteriormente en gatos cuyos nervios ópticos habían sido cortados. Estos gatos mostraron una marcada mejora en su capacidad para localizar estímulos a través de la audición; y en consecuencia también mostraron una mayor conectividad neuronal entre V1 y la corteza auditiva. [76] Tal plasticidad en la primera infancia permite una mayor adaptabilidad y, por lo tanto, un desarrollo más normal en otras áreas para aquellos con un déficit sensorial.
En cambio, tras el período de formación inicial, el SC no parece mostrar ninguna plasticidad neuronal. A pesar de ello, se sabe que en las conductas de orientación existe habituación y sensibilización a largo plazo. Esta aparente plasticidad funcional se ha atribuido a la adaptabilidad del AES. Es decir, aunque las neuronas del SC tienen una magnitud fija de salida por unidad de entrada y básicamente operan con una respuesta de todo o nada, el nivel de activación neuronal puede ajustarse con mayor precisión mediante variaciones en la entrada del AES.
Aunque hay evidencia que apoya ambas perspectivas de la dicotomía integración/diferenciación, también existe un conjunto significativo de evidencia que apoya una combinación de factores de ambas perspectivas. Por lo tanto, de manera análoga al argumento nativista/empirista más amplio, es evidente que, en lugar de una dicotomía, existe un continuo, de modo que las hipótesis de integración y diferenciación son extremos en cada extremo.
No se sabe mucho sobre el desarrollo de la capacidad de integrar múltiples estimaciones, como la visión y el tacto. [98] Algunas capacidades multisensoriales están presentes desde la primera infancia, pero no es hasta que los niños tienen ocho años o más que comienzan a utilizar múltiples modalidades para reducir la incertidumbre sensorial. [98]
Un estudio demostró que la integración visual y auditiva intermodal está presente desde el primer año de vida. [101] Este estudio midió el tiempo de respuesta para orientarse hacia una fuente. Los bebés de entre 8 y 10 meses mostraron tiempos de respuesta significativamente menores cuando la fuente se presentó a través de información visual y auditiva en comparación con una sola modalidad . Sin embargo, los bebés más pequeños no mostraron tal cambio en los tiempos de respuesta a estas diferentes condiciones. De hecho, los resultados del estudio indican que los niños potencialmente tienen la capacidad de integrar fuentes sensoriales a cualquier edad. Sin embargo, en ciertos casos, por ejemplo, las señales visuales , se evita la integración intermodal. [98]
Otro estudio encontró que la integración intermodal del tacto y la visión para distinguir el tamaño y la orientación está disponible desde al menos los 8 años de edad. [99] Para los grupos de edad de preintegración, un sentido domina dependiendo de la característica discernida (ver dominio visual). [99]
Un estudio que investigó la integración sensorial dentro de una única modalidad ( visión ) descubrió que no se puede establecer hasta los 12 años o más. [98] Este estudio en particular evaluó la integración de las señales de disparidad y textura para resolver la inclinación de la superficie. Aunque los grupos de edad más jóvenes mostraron un rendimiento algo mejor al combinar señales de disparidad y textura en comparación con el uso de solo señales de disparidad o textura, esta diferencia no fue estadísticamente significativa. [98] En los adultos, la integración sensorial puede ser obligatoria, lo que significa que ya no tienen acceso a las fuentes sensoriales individuales. [102]
Reconociendo estas variaciones, se han establecido muchas hipótesis para reflejar por qué estas observaciones dependen de la tarea. Dado que los diferentes sentidos se desarrollan a diferentes ritmos, se ha propuesto que la integración intermodal no aparece hasta que ambas modalidades han alcanzado la madurez. [99] [103] El cuerpo humano experimenta una transformación física significativa durante la infancia. No solo hay crecimiento en tamaño y estatura (que afecta la altura de visualización), sino que también hay cambios en la distancia interocular y la longitud del globo ocular . Por lo tanto, las señales sensoriales deben reevaluarse constantemente para apreciar estos diversos cambios fisiológicos. [99] Algunos estudios en animales que exploran la neurobiología detrás de la integración respaldan esta afirmación. Los monos adultos tienen conexiones interneuronales profundas dentro del colículo superior que proporcionan una integración visoauditiva fuerte y acelerada. [104] Por el contrario, los animales jóvenes no tienen esta mejora hasta que las propiedades unimodales están completamente desarrolladas. [105] [106]
Además, para racionalizar el dominio sensorial, Gori et al. (2008) defienden que el cerebro utiliza la fuente de información más directa durante la inmadurez sensorial. [99] En este caso, la orientación es principalmente una característica visual. Puede derivarse directamente de la imagen del objeto que se forma en la retina , independientemente de otros factores visuales. De hecho, los datos muestran que una propiedad funcional de las neuronas dentro de las cortezas visuales de los primates es su discernimiento de la orientación. [107] En contraste, los juicios de orientación hápticos se recuperan a través de estimulaciones con patrones colaborativos, evidentemente una fuente indirecta susceptible a interferencias. Del mismo modo, cuando se trata del tamaño, la información háptica que proviene de las posiciones de los dedos es más inmediata. Las percepciones visuales del tamaño, alternativamente, tienen que calcularse utilizando parámetros como la inclinación y la distancia . Considerando esto, el dominio sensorial es un instinto útil para ayudar con la calibración. Durante la inmadurez sensorial, la fuente de información más simple y robusta podría usarse para ajustar la precisión de la fuente alternativa. [99] El trabajo de seguimiento de Gori et al. (2012) mostró que, a todas las edades, las percepciones del tamaño de la visión son casi perfectas cuando se ven objetos dentro del espacio de trabajo háptico (es decir, al alcance de la mano). [108] Sin embargo, aparecieron errores sistemáticos en la percepción cuando el objeto se posicionó más allá de esta zona. [109] Los niños menores de 14 años tienden a subestimar el tamaño del objeto, mientras que los adultos lo sobreestimaron. Sin embargo, si el objeto se devolvió al espacio de trabajo háptico, esos sesgos visuales desaparecieron. [108] Estos resultados respaldan la hipótesis de que la información háptica puede educar las percepciones visuales. Si se utilizan fuentes para la calibración cruzada, por lo tanto, no se pueden combinar (integrar). Mantener el acceso a las estimaciones individuales es una compensación por una mayor plasticidad sobre la precisión, lo que podría ser beneficioso en retrospectiva para el cuerpo en desarrollo. [99] [103]
Alternativamente, Ernst (2008) defiende que la integración eficiente se basa inicialmente en establecer una correspondencia: qué señales sensoriales pertenecen juntas. [103] De hecho, los estudios han demostrado que la integración viso-háptica falla en adultos cuando hay una separación espacial percibida , lo que sugiere que la información sensorial proviene de diferentes objetivos. [110] Además, si la separación se puede explicar, por ejemplo, viendo un objeto a través de un espejo , la integración se restablece e incluso puede ser óptima. [111] [112] Ernst (2008) sugiere que los adultos pueden obtener este conocimiento de experiencias previas para determinar rápidamente qué fuentes sensoriales representan el mismo objetivo, pero los niños pequeños podrían ser deficientes en esta área. [103] Una vez que hay un banco suficiente de experiencias, la confianza para integrar correctamente las señales sensoriales se puede introducir en su comportamiento.
Por último, Nardini et al. (2010) recientemente plantearon la hipótesis de que los niños pequeños han optimizado su apreciación sensorial para la velocidad sobre la precisión. [98] Cuando la información se presenta en dos formas, los niños pueden derivar una estimación de la fuente más rápida disponible, ignorando posteriormente la alternativa, incluso si contiene información redundante. Nardini et al. (2010) proporciona evidencia de que las latencias de respuesta de los niños (de 6 años) son significativamente más bajas cuando los estímulos se presentan en condiciones de múltiples señales en lugar de una sola señal. [98] Por el contrario, los adultos no mostraron cambios entre estas condiciones. De hecho, los adultos muestran una fusión obligatoria de señales, por lo tanto, solo pueden aspirar a la máxima precisión. [98] [102] Sin embargo, las latencias medias generales de los niños no fueron más rápidas que las de los adultos, lo que sugiere que la optimización de la velocidad simplemente les permite seguir el ritmo maduro. Considerando la prisa de los eventos del mundo real, esta estrategia puede resultar necesaria para contrarrestar el procesamiento general más lento de los niños y mantener un acoplamiento eficaz entre visión y acción. [113] [114] [115] En última instancia, el sistema sensorial en desarrollo puede adaptarse preferentemente a objetivos diferentes ( velocidad y detección de conflictos sensoriales ), que son típicos del aprendizaje objetivo.
El desarrollo tardío de la integración eficiente también se ha investigado desde el punto de vista computacional. [116] Daee et al. (2014) demostraron que tener una fuente sensorial dominante a una edad temprana, en lugar de integrar todas las fuentes, facilita el desarrollo general de integraciones intermodales.
Los diseñadores de prótesis deben considerar cuidadosamente la naturaleza de la alteración de la dimensionalidad de la señalización sensoriomotora desde y hacia el SNC al diseñar dispositivos protésicos. Como se informa en la literatura, la señalización neuronal desde el SNC a los motores está organizada de una manera que las dimensionalidades de las señales aumentan gradualmente a medida que se acerca a los músculos, también llamadas sinergias musculares. Por otro lado, en el mismo principio, pero en orden opuesto, las dimensionalidades de las señales de los receptores sensoriales se integran gradualmente, también llamadas sinergias sensoriales, a medida que se acercan al SNC. Esta formación de señalización similar a un moño permite que el SNC procese solo información abstracta pero valiosa. Tal proceso reducirá la complejidad de los datos, manejará los ruidos y garantizará al SNC el consumo óptimo de energía. Aunque los dispositivos protésicos disponibles comercialmente actualmente se centran principalmente en implementar el lado motor simplemente utilizando sensores EMG para cambiar entre diferentes estados de activación de la prótesis, trabajos muy limitados han propuesto un sistema para involucrar mediante la integración del lado sensorial. La integración del sentido táctil y la propiocepción se considera esencial para implementar la capacidad de percibir la información del entorno. [117]
También se ha demostrado que la integración multisensorial mejora la hemianopsia visual. Mediante la presentación repetida de estímulos multisensoriales en el hemicampo ciego, la capacidad de responder a estímulos puramente visuales regresa gradualmente a ese hemicampo de manera central a periférica. Estos beneficios persisten incluso después de que cese el entrenamiento multisensorial explícito. [118]
{{cite book}}
: |journal=
ignorado ( ayuda ){{cite book}}
: |work=
ignorado ( ayuda ){{cite book}}
: |work=
ignorado ( ayuda )