El efecto McGurk es un fenómeno perceptivo que demuestra una interacción entre la audición y la visión en la percepción del habla . La ilusión se produce cuando el componente auditivo de un sonido se combina con el componente visual de otro sonido, lo que lleva a la percepción de un tercer sonido. [1] La información visual que una persona obtiene al ver a otra persona hablar cambia la forma en que escucha el sonido. [2] [3] Si una persona recibe información auditiva de mala calidad pero información visual de buena calidad, es más probable que experimente el efecto McGurk. [4]
La capacidad de integración de información auditiva y visual también puede influir en la posibilidad de que una persona experimente el efecto. Se ha demostrado que las personas con mayor capacidad de integración sensorial son más susceptibles a este efecto. [2] Muchas personas se ven afectadas de forma diferente por el efecto McGurk en función de muchos factores, entre ellos, el daño cerebral y otros trastornos.
El efecto se describió por primera vez en 1976 en un artículo de Harry McGurk y John MacDonald titulado "Oír labios y ver voces" en la revista Nature (23 de diciembre de 1976). [5] Este efecto se descubrió por accidente cuando McGurk y su asistente de investigación, MacDonald, pidieron a un técnico que doblara un vídeo con un fonema diferente del que se hablaba mientras realizaban un estudio sobre cómo los bebés perciben el lenguaje en diferentes etapas del desarrollo. Cuando se reprodujo el vídeo, ambos investigadores oyeron un tercer fonema en lugar del que se hablaba o articulaba en el vídeo. [6]
Este efecto se puede experimentar cuando un video de la producción de un fonema se dobla con una grabación de sonido de un fonema diferente que se está pronunciando. A menudo, el fonema percibido es un tercer fonema intermedio. Como ejemplo, las sílabas /ba-ba/ se pronuncian sobre los movimientos labiales de /ga-ga/, y la percepción es /da-da/. McGurk y MacDonald originalmente creían que esto era resultado de las propiedades fonéticas y visuales comunes de /b/ y /g/. [7] Se han observado dos tipos de ilusión en respuesta a estímulos audiovisuales incongruentes: fusiones ('ba' auditivo y 'ga' visual producen 'da') y combinaciones ('ga' auditivo y 'ba' visual producen 'bga'). [8] Este es el esfuerzo del cerebro para proporcionar a la conciencia su mejor suposición sobre la información entrante. [9] La información que llega desde los ojos y los oídos es contradictoria, y en este caso, los ojos (información visual) han tenido un mayor efecto sobre el cerebro, y así se han creado las respuestas de fusión y combinación. [9]
La visión es el sentido primario para los humanos, [2] pero la percepción del habla es multimodal , lo que significa que involucra información de más de una modalidad sensorial, en particular, la audición y la visión . El efecto McGurk surge durante el procesamiento fonético porque la integración de la información auditiva y visual ocurre temprano en la percepción del habla. [7] El efecto McGurk es muy robusto; es decir, el conocimiento sobre él parece tener poco efecto en la percepción que uno tiene de él. Esto es diferente de ciertas ilusiones ópticas , que se descomponen una vez que uno "ve a través" de ellas. Algunas personas, incluidas aquellas que han estado investigando el fenómeno durante más de veinte años, experimentan el efecto incluso cuando son conscientes de que está ocurriendo. [8] [10] Con la excepción de las personas que pueden identificar la mayor parte de lo que se dice solo con la lectura de los labios , la mayoría de las personas tienen una capacidad bastante limitada para identificar el habla a partir de señales solo visuales. [2] Un fenómeno más extenso es la capacidad del habla visual para aumentar la inteligibilidad del habla escuchada en un entorno ruidoso. [2] El habla visible también puede alterar la percepción de sonidos del habla perfectamente audibles cuando los estímulos visuales del habla no coinciden con el habla auditiva. [2] Normalmente, se piensa que la percepción del habla es un proceso auditivo; [2] sin embargo, nuestro uso de la información es inmediato, automático y, en gran medida, inconsciente [10] y, por lo tanto, a pesar de lo que se acepta ampliamente como cierto, el habla no es solo algo que oímos. [10] El habla es percibida por todos los sentidos trabajando juntos (ver, tocar y escuchar el movimiento de una cara). [10] El cerebro a menudo no es consciente de las contribuciones sensoriales separadas de lo que percibe. [10] Por lo tanto, cuando se trata de reconocer el habla, el cerebro no puede diferenciar si está viendo u oyendo la información entrante. [10]
También se ha examinado en relación con el testimonio de testigos. El estudio de 2005 de Wareham y Wright mostró que la información visual inconsistente puede cambiar la percepción de los enunciados hablados, lo que sugiere que el efecto McGurk puede tener muchas influencias en la percepción cotidiana. No se limita a las sílabas, el efecto puede ocurrir en palabras completas [7] [11] y tener un efecto en las interacciones diarias de las que las personas no son conscientes. La investigación en esta área puede proporcionar información no solo sobre cuestiones teóricas, sino que también puede proporcionar relevancia terapéutica y diagnóstica para las personas con trastornos relacionados con la integración auditiva y visual de las señales del habla. [12]
Ambos hemisferios del cerebro contribuyen al efecto McGurk. [13] Trabajan juntos para integrar la información del habla que se recibe a través de los sentidos auditivo y visual. Es más probable que se produzca una respuesta McGurk en personas diestras para quienes el rostro tiene un acceso privilegiado al hemisferio derecho y las palabras al hemisferio izquierdo. [13] En las personas a las que se les han realizado callosotomías , el efecto McGurk todavía está presente, pero significativamente más lento. [13] En las personas con lesiones en el hemisferio izquierdo del cerebro, las características visuales a menudo desempeñan un papel fundamental en la terapia del habla y el lenguaje. [12] Las personas con lesiones en el hemisferio izquierdo del cerebro muestran un mayor efecto McGurk que los controles normales. [12] La información visual influye fuertemente en la percepción del habla en estas personas. [12] Existe una falta de susceptibilidad a la ilusión McGurk si el daño en el hemisferio izquierdo resultó en un déficit en la percepción visual segmentaria del habla. [14] En las personas con daño en el hemisferio derecho, se exhibe un deterioro tanto en las tareas de integración visual como en las audiovisuales, aunque todavía son capaces de integrar la información para producir un efecto McGurk. [14] La integración solo aparece si se utilizan estímulos visuales para mejorar el rendimiento cuando la señal auditiva está empobrecida pero es audible. [14] Por lo tanto, hay un efecto McGurk exhibido en personas con daño en el hemisferio derecho del cerebro, pero el efecto no es tan fuerte como en un grupo normal.
Los individuos disléxicos muestran un efecto McGurk menor que los lectores normales de la misma edad cronológica , pero mostraron el mismo efecto que los lectores de la misma edad y nivel de lectura. [15] Los disléxicos difieren particularmente en las respuestas de combinación, no en las respuestas de fusión. [15] El menor efecto McGurk puede deberse a las dificultades que tienen los disléxicos para percibir y producir grupos de consonantes . [15]
Los niños con trastorno específico del lenguaje muestran un efecto McGurk significativamente menor que el niño promedio. [16] Utilizan menos información visual en la percepción del habla o tienen una atención reducida a los gestos articulatorios , pero no tienen problemas para percibir señales exclusivamente auditivas. [16]
Los niños con trastornos del espectro autista (TEA) mostraron un efecto McGurk significativamente reducido en comparación con los niños sin TEA. [17] Sin embargo, si el estímulo no era humano (por ejemplo, rebotar una pelota de tenis con el sonido de una pelota de playa rebotando), entonces obtuvieron una puntuación similar a la de los niños sin TEA. [17] Los niños más pequeños con TEA muestran un efecto McGurk muy reducido; sin embargo, este disminuye con la edad. A medida que los individuos crecen, el efecto que muestran se acerca más al de los que no tenían TEA. [18] Se ha sugerido que el efecto McGurk debilitado observado en las personas con TEA se debe a déficits en la identificación de los componentes auditivos y visuales del habla en lugar de en la integración de dichos componentes (aunque distinguir los componentes del habla como componentes del habla puede ser isomorfo a integrarlos). [19]
Los adultos con discapacidades de aprendizaje del lenguaje presentan un efecto McGurk mucho menor que otros adultos. [20] Estas personas no están tan influenciadas por la información visual como la mayoría de las personas. [20] Por lo tanto, las personas con habilidades lingüísticas deficientes producirán un efecto McGurk menor. Una razón para el efecto menor en esta población es que puede haber actividad desacoplada entre las regiones anterior y posterior del cerebro, o los hemisferios izquierdo y derecho. [20] La etiología cerebelosa o de los ganglios basales también es posible.
En pacientes con enfermedad de Alzheimer (EA), se observa un efecto McGurk menor que en aquellos que no la padecen. [21] A menudo, un tamaño reducido del cuerpo calloso produce un proceso de desconexión hemisférica. [21] Se observa una menor influencia del estímulo visual en pacientes con EA, lo que es una razón para el efecto McGurk reducido. [21]
El efecto McGurk no es tan pronunciado en los individuos esquizofrénicos como en los no esquizofrénicos. Sin embargo, no es significativamente diferente en los adultos. [22] La esquizofrenia ralentiza el desarrollo de la integración audiovisual y no le permite alcanzar su pico de desarrollo. Sin embargo, no se observa ninguna degradación. [22] Los esquizofrénicos tienen más probabilidades de depender de las señales auditivas que de las visuales en la percepción del habla. [22]
Las personas con afasia muestran una percepción deteriorada del habla en todas las condiciones (solo visual, solo auditiva y audiovisual) y, por lo tanto, exhibieron un pequeño efecto McGurk. [23] La mayor dificultad para los afásicos está en la condición solo visual, mostrando que utilizan más estímulos auditivos en la percepción del habla. [23]
Un estudio pequeño (N=22 por grupo) no mostró ninguna diferencia aparente entre individuos con trastorno bipolar y aquellos sin él, con respecto al efecto McGurk. Sin embargo, las personas con trastorno bipolar mostraron puntuaciones significativamente más bajas en una tarea de lectura de labios. Esto puede sugerir que las vías neuronales formadas y activadas en la integración de la información auditiva y visual del habla en individuos con trastorno bipolar son diferentes en comparación con aquellas en personas sin ningún trastorno mental. [24]
La discrepancia en la categoría vocálica redujo significativamente la magnitud del efecto McGurk para las respuestas de fusión. [25] Los tokens auditivos /a/ doblados sobre articulaciones visuales /i/ fueron más compatibles que a la inversa. [25] Esto podría deberse a que /a/ tiene una amplia gama de configuraciones articulatorias mientras que /i/ es más limitada, [25] lo que hace que sea mucho más fácil para los sujetos detectar discrepancias en los estímulos. [25] Los contextos vocálicos /i/ producen el efecto más fuerte, mientras que /a/ produce un efecto moderado y /u/ casi no tiene efecto. [26]
El efecto McGurk es más fuerte cuando el lado derecho de la boca del hablante (a la izquierda del espectador) es visible. [27] Las personas tienden a obtener más información visual del lado derecho de la boca del hablante que del izquierdo o incluso de toda la boca. [27] Esto se relaciona con los factores de atención hemisférica analizados en la sección sobre los hemisferios cerebrales anterior.
El efecto McGurk es más débil cuando hay un distractor visual presente al que el oyente está prestando atención. [28] La atención visual modula la percepción del habla audiovisual. [28] Otra forma de distracción es el movimiento del hablante. Se produce un efecto McGurk más fuerte si la cara o la cabeza del hablante están inmóviles, en lugar de moverse. [29]
Se puede observar un fuerte efecto McGurk para las sílabas compuestas por clics vocales, en comparación con efectos débiles para clics aislados. [30] Esto demuestra que el efecto McGurk puede ocurrir en un entorno sin habla. [30] La significación fonológica no es una condición necesaria para que se produzca un efecto McGurk; sin embargo, sí aumenta la fuerza del efecto. [30]
Las mujeres muestran un efecto McGurk más fuerte que los hombres. Las mujeres muestran una influencia visual significativamente mayor en el habla auditiva que los hombres para estímulos visuales breves, pero no hay diferencia aparente para estímulos completos. [29] Otro aspecto relacionado con el género es la cuestión de los rostros y voces masculinos como estímulos en comparación con los rostros y voces femeninas como estímulos. Sin embargo, no hay diferencia en la fuerza del efecto McGurk para ninguna de las situaciones. [31] Si se dobla un rostro masculino con una voz femenina, o viceversa, sigue sin haber diferencia en la fuerza del efecto McGurk. [31] Saber que la voz que escuchas es diferente del rostro que ves, incluso si son de géneros diferentes, no elimina el efecto McGurk. [10]
Los sujetos que están familiarizados con los rostros de los hablantes son menos susceptibles al efecto McGurk que aquellos que no están familiarizados con los rostros de los hablantes. [2] [26] Por otro lado, no hubo diferencias con respecto a la familiaridad de la voz. [26]
La congruencia semántica tuvo un impacto significativo en la ilusión de McGurk. [32] El efecto se experimenta con mayor frecuencia y se califica como más claro en la condición semánticamente congruente en relación con la condición incongruente. [32] Cuando una persona esperaba una determinada apariencia visual o auditiva basándose en la información semántica que la precedía, el efecto McGurk aumentaba considerablemente. [32]
El efecto McGurk se puede observar cuando el oyente es también el hablante o articulador . [33] Al mirarse en el espejo y articular estímulos visuales mientras se escucha otro estímulo auditivo, se puede observar un fuerte efecto McGurk. [33] En la otra condición, donde el oyente dice estímulos auditivos suavemente mientras observa a otra persona articular los gestos visuales conflictivos, todavía se puede ver un efecto McGurk, aunque es más débil. [33]
No es necesaria la sincronía temporal para que se produzca el efecto McGurk. [34] Los sujetos siguen estando fuertemente influenciados por los estímulos auditivos incluso cuando éstos se retrasan 180 milisegundos con respecto a los estímulos visuales (punto en el que el efecto McGurk empieza a debilitarse). [34] Había menos tolerancia a la falta de sincronía si los estímulos auditivos precedían a los estímulos visuales. [34] Para producir un debilitamiento significativo del efecto McGurk, los estímulos auditivos tenían que preceder a los estímulos visuales en 60 milisegundos, o retrasarse 240 milisegundos. [2]
El efecto McGurk se redujo en gran medida cuando la atención se desvió hacia una tarea táctil (tocar algo). [35] El tacto es una percepción sensorial como la visión y la audición, por lo tanto, aumentar la atención al tacto disminuye la atención a los sentidos auditivos y visuales.
Los ojos no necesitan fijarse para integrar la información auditiva y visual en la percepción del habla. [36] No hubo diferencia en el efecto McGurk cuando el oyente se enfocaba en cualquier parte de la cara del hablante. [36] El efecto no aparece si el oyente enfoca más allá de la cara del hablante. [2] Para que el efecto McGurk se vuelva insignificante, la mirada del oyente debe desviarse de la boca del hablante al menos 60 grados. [36]
Cualquiera que sea el idioma, todos los oyentes dependen de la información visual hasta cierto punto en la percepción del habla . Pero la intensidad del efecto McGurk difiere entre idiomas. Los oyentes de holandés, [37] inglés, español, alemán, italiano y turco [38] experimentan un fuerte efecto McGurk; los oyentes japoneses y chinos, más débil. [39] La mayoría de las investigaciones sobre el efecto McGurk entre idiomas se han realizado entre inglés y japonés. Se produce un efecto McGurk menor en los oyentes japoneses que en los oyentes ingleses. [37] [40] [41] [42] [43] [44] La práctica cultural de evitar las caras en los japoneses puede disminuir el efecto McGurk, así como el tono y las estructuras silábicas del idioma. [37] Esta también podría ser la razón por la que los oyentes chinos son menos susceptibles a las señales visuales y, de manera similar a los japoneses, producen un efecto menor que los oyentes ingleses. [37] Los estudios también muestran que los oyentes japoneses no muestran un aumento del desarrollo en la influencia visual después de los seis años, como lo hacen los niños ingleses. [40] [41] Los oyentes japoneses identifican la incompatibilidad entre estímulos visuales y auditivos mejor que los oyentes ingleses. [37] [41] Esta mayor capacidad podría estar relacionada con la falta de grupos consonánticos en japonés . [37] [42] De todos modos, los oyentes de todos los idiomas recurren a estímulos visuales cuando el habla es ininteligible; el efecto McGurk se aplica entonces a ellos por igual. [37] [42] El efecto McGurk funciona con oyentes de todos los idiomas evaluados. [10]
Se han llevado a cabo experimentos con personas con problemas de audición y personas que han tenido implantes cocleares . Estas personas tienden a dar más importancia a la información visual del habla que a la información auditiva. [45] En comparación con las personas con audición normal, esto no es diferente a menos que haya más de una sílaba, como una palabra. [45] Con respecto al experimento de McGurk, las respuestas de los usuarios con implantes cocleares produjeron las mismas respuestas que las de las personas con audición normal cuando un estímulo auditivo bilabial se duplica sobre un estímulo velar visual . [45] Sin embargo, cuando un estímulo auditivo dental se duplica sobre un estímulo visual bilabial , las respuestas son bastante diferentes. El efecto McGurk todavía está presente en personas con problemas de audición o que usan implantes cocleares, aunque es bastante diferente en algunos aspectos.
Midiendo la atención de un bebé a ciertos estímulos audiovisuales , se puede registrar una respuesta que es consistente con el efecto McGurk. [2] [10] [46] [47] [48] Desde solo minutos hasta un par de días de vida, los bebés pueden imitar los movimientos faciales de los adultos, y en cuestión de semanas después del nacimiento, los bebés pueden reconocer los movimientos de los labios y los sonidos del habla. [49] En este punto, la integración de información auditiva y visual puede suceder, pero no a un nivel competente. [49] La primera evidencia del efecto McGurk se puede ver a los cuatro meses de edad; [46] [47] sin embargo, se encuentra más evidencia para los 5 meses. [2] [10] [48] [50] A través del proceso de habituar a un bebé a un cierto estímulo y luego cambiar el estímulo (o parte de él, como ba-voz/va-visual a da-voz/va-visual), se hace evidente una respuesta que simula el efecto McGurk. [10] [48] La fuerza del efecto McGurk muestra un patrón de desarrollo que aumenta a lo largo de la infancia y se extiende hasta la edad adulta. [47] [48]