Un visema es cualquier fono entre varios que se ve igual, por ejemplo, en la lectura de labios.
De manera similar, algunos sonidos son difíciles de diferenciar acústicamente pero se diferencian con mayor facilidad en el rostro.
[2] Así, por ejemplo, en el inglés hablado, /l/ y /r/ pueden ser muy similares (en particular, en determinadas combinaciones, como grass vs.
glass), pero la información visual puede mostrar un contraste más claro.
Algunos lingüistas sostienen que la mejor manera de comprender el habla es como una combinación bimodal de visual y auditiva, y la comprensión se puede ver comprometida si uno de esos dos elementos está ausente, como probaría el llamado efecto McGurk.