Fonética

La fonética es una rama de la lingüística que estudia cómo los humanos producen y perciben los sonidos, o en el caso de las lenguas de signos , los aspectos equivalentes de los signos. ^[1] Los lingüistas que se especializan en estudiar las propiedades físicas del habla son fonetistas . El campo de la fonética se divide tradicionalmente en tres subdisciplinas según las preguntas de investigación involucradas, como cómo los humanos planifican y ejecutan movimientos para producir el habla ( fonética articulatoria ), cómo varios movimientos afectan las propiedades del sonido resultante ( fonética acústica ) o cómo los humanos convierten las ondas sonoras en información lingüística ( fonética auditiva ). Tradicionalmente, la unidad lingüística mínima de la fonética es el fone , un sonido del habla en una lengua que difiere de la unidad fonológica del fonema ; El fonema es una categorización abstracta de los teléfonos y también se define como la unidad más pequeña que discierne el significado entre los sonidos en un idioma determinado. ^[2]

La fonética se ocupa de dos aspectos del habla humana: la producción (la forma en que los humanos producen sonidos) y la percepción (la forma en que se entiende el habla). La modalidad comunicativa de una lengua describe el método mediante el cual una lengua produce y percibe lenguas. Los idiomas con modalidades oral-auditivas, como el inglés, producen el habla oralmente (usando la boca) y perciben el habla auditivamente (usando los oídos). Las lenguas de signos, como la lengua de signos australiana ( Auslan ) y la lengua de signos americana ( ASL ), tienen una modalidad manual-visual, produciendo el habla manualmente (usando las manos) y percibiendo el habla visualmente (usando los ojos). El ASL y algunas otras lenguas de señas tienen además un dialecto manual-manual para uso en señas táctiles por parte de hablantes sordociegos , donde las señas se producen con las manos y también se perciben con las manos.

La producción del lenguaje consta de varios procesos interdependientes que transforman un mensaje no lingüístico en una señal lingüística hablada o por señas. Después de identificar un mensaje que se codificará lingüísticamente, un hablante debe seleccionar las palabras individuales (conocidas como elementos léxicos ) para representar ese mensaje en un proceso llamado selección léxica. Durante la codificación fonológica, a la representación mental de las palabras se le asigna su contenido fonológico como una secuencia de fonemas a producir. Los fonemas se especifican para características articulatorias que denotan objetivos particulares, como labios cerrados o la lengua en un lugar particular. Luego, estos fonemas se coordinan en una secuencia de órdenes musculares que pueden enviarse a los músculos y, cuando estas órdenes se ejecutan correctamente, se producen los sonidos deseados.

Estos movimientos interrumpen y modifican una corriente de aire que da como resultado una onda sonora. La modificación la realizan los articuladores, con diferentes lugares y formas de articulación que producen diferentes resultados acústicos. Por ejemplo, las palabras tack y sack comienzan con sonidos alveolares en inglés, pero difieren en la distancia que separa la lengua de la cresta alveolar. Esta diferencia tiene grandes efectos en la corriente de aire y, por tanto, en el sonido que se produce. De manera similar, la dirección y fuente de la corriente de aire pueden afectar el sonido. El mecanismo de corriente de aire más común es el pulmonar (utiliza los pulmones), pero la glotis y la lengua también se pueden utilizar para producir corrientes de aire.

La percepción del lenguaje es el proceso mediante el cual un oyente decodifica y comprende una señal lingüística. Para percibir el habla, la señal acústica continua debe convertirse en unidades lingüísticas discretas, como fonemas , morfemas y palabras . Para identificar y categorizar correctamente los sonidos, los oyentes priorizan ciertos aspectos de la señal que pueden distinguir de manera confiable entre categorías lingüísticas. Si bien se priorizan ciertas señales sobre otras, muchos aspectos de la señal pueden contribuir a la percepción. Por ejemplo, aunque los lenguajes orales priorizan la información acústica, el efecto McGurk muestra que la información visual se utiliza para distinguir información ambigua cuando las señales acústicas no son fiables.

La fonética moderna tiene tres ramas:

Fonética articulatoria , que aborda la forma en que se producen los sonidos con los articuladores,
Fonética acústica , que aborda los resultados acústicos de diferentes articulaciones, y
Fonética auditiva , que aborda la forma en que los oyentes perciben y comprenden las señales lingüísticas.

Historia

Antigüedad

Los primeros estudios fonéticos conocidos fueron llevados a cabo ya en el siglo VI a. C. por gramáticos sánscritos . ^[3] El erudito hindú Pāṇini se encuentra entre los más conocidos de estos primeros investigadores. Su gramática de cuatro partes, escrita alrededor del 350 a. C., es influyente en la lingüística moderna y todavía representa "la gramática generativa más completa de cualquier idioma escrito hasta ahora". ^[4] Su gramática formó la base de la lingüística moderna y describió varios principios fonéticos importantes, incluida la expresión. Este primer relato describía la resonancia como producida por el tono, cuando las cuerdas vocales están cerradas, o por el ruido, cuando las cuerdas vocales están abiertas. Los principios fonéticos de la gramática se consideran "primitivos" porque son la base de su análisis teórico más que los objetos del análisis teórico en sí mismos, y los principios pueden inferirse de su sistema de fonología. ^[5]

El estudio sánscrito de la fonética se llama Shiksha . El Taittiriya Upanishad , que data del primer milenio antes de Cristo, define Shiksha de la siguiente manera:

¡Om! Te explicaremos el Shiksha.
Sonidos y acentuación, Cantidad (de vocales) y expresión (de consonantes),
Equilibrio (Saman) y conexión (de sonidos), Mucho sobre el estudio de Shiksha. || 1 |

Taittiriya Upanishad 1.2, Shikshavalli, traducido por Paul Deussen ^[6] .

Moderno

Los avances en fonética después de Pāṇini y sus contemporáneos fueron limitados hasta la era moderna, salvo algunas investigaciones limitadas de gramáticos griegos y romanos. En los milenios transcurridos entre los gramáticos indios y la fonética moderna, el enfoque pasó de la diferencia entre el lenguaje hablado y escrito, que era la fuerza impulsora detrás del relato de Pāṇini, y comenzó a centrarse únicamente en las propiedades físicas del habla. El interés sostenido por la fonética comenzó de nuevo alrededor de 1800 EC y el término "fonética" se utilizó por primera vez en el sentido actual en 1841. ^[7]^[3] Con los nuevos avances en la medicina y el desarrollo de dispositivos de grabación de audio y visuales, los conocimientos fonéticos pudieron utilizar y revisar datos nuevos y más detallados. Este primer período de la fonética moderna incluyó el desarrollo de un influyente alfabeto fonético basado en posiciones articulatorias de Alexander Melville Bell . Conocido como habla visible , ganó protagonismo como herramienta en la educación oral de los niños sordos . ^[3]

Antes de la disponibilidad generalizada de equipos de grabación de audio, los fonetistas dependían en gran medida de una tradición de fonética práctica para garantizar que las transcripciones y los hallazgos pudieran ser consistentes entre los fonetistas. Este entrenamiento implicó tanto el entrenamiento del oído (el reconocimiento de los sonidos del habla) como el entrenamiento de la producción (la capacidad de producir sonidos). Se esperaba que los fonetistas aprendieran a reconocer de oído los diversos sonidos del Alfabeto Fonético Internacional y la IPA todavía evalúa y certifica a los hablantes sobre su capacidad para producir con precisión los patrones fonéticos del inglés (aunque han descontinuado esta práctica para otros idiomas). ^[8] Como una revisión de su método de habla visible, Melville Bell desarrolló una descripción de las vocales por altura y fondo, lo que da como resultado 9 vocales cardinales . ^[9] Como parte de su formación en fonética práctica, se esperaba que los fonetistas aprendieran a producir estas vocales cardinales para anclar su percepción y transcripción de estos teléfonos durante el trabajo de campo. ^[8] Este enfoque fue criticado por Peter Ladefoged en la década de 1960 basándose en evidencia experimental donde encontró que las vocales cardinales eran objetivos auditivos más que articulatorios, desafiando la afirmación de que representaban anclajes articulatorios mediante los cuales los fonetistas podían juzgar otras articulaciones. ^[10]

Producción

La producción del lenguaje consta de varios procesos interdependientes que transforman un mensaje no lingüístico en una señal lingüística hablada o por señas. Los lingüistas debaten si el proceso de producción del lenguaje ocurre en una serie de etapas (procesamiento en serie) o si los procesos de producción ocurren en paralelo. Después de identificar un mensaje que se codificará lingüísticamente, un hablante debe seleccionar las palabras individuales (conocidas como elementos léxicos ) para representar ese mensaje en un proceso llamado selección léxica. Las palabras se seleccionan en función de su significado, lo que en lingüística se denomina información semántica . La selección léxica activa el lema de la palabra , que contiene información tanto semántica como gramatical sobre la palabra. ^[11]^[un]

Una vez planificada una expresión, ^[b] pasa por la codificación fonológica. En esta etapa de la producción del lenguaje, a la representación mental de las palabras se les asigna su contenido fonológico como una secuencia de fonemas a producir. Los fonemas se especifican para características articulatorias que denotan objetivos particulares, como labios cerrados o la lengua en un lugar particular. Luego, estos fonemas se coordinan en una secuencia de órdenes musculares que pueden enviarse a los músculos y, cuando estas órdenes se ejecutan correctamente, se producen los sonidos deseados. ^[13] Así, el proceso de producción del mensaje al sonido se puede resumir en la siguiente secuencia: ^[c]

Planificación de mensajes
Selección de lemas
Recuperación y asignación de formas fonológicas de palabras.
Especificación articulatoria
Comandos musculares
Articulación
sonidos del habla

Lugar de articulacion

Los sonidos que se producen por una constricción total o parcial del tracto vocal se llaman consonantes . Las consonantes se pronuncian en el tracto vocal, generalmente en la boca, y la ubicación de esta constricción afecta el sonido resultante. Debido a la estrecha relación entre la posición de la lengua y el sonido resultante, el lugar de articulación es un concepto importante en muchas subdisciplinas de la fonética.

Los sonidos se clasifican en parte por la ubicación de una constricción, así como por la parte del cuerpo que la realiza. Por ejemplo, en inglés las palabras lucha y pensamiento son un par mínimo que difiere sólo en el órgano que realiza la construcción más que en la ubicación de la construcción. La "f" en lucha es una articulación labiodental realizada con el labio inferior contra los dientes. La "th" en el pensamiento es una articulación linguodental que se realiza con la lengua contra los dientes. Las constricciones realizadas por los labios se denominan labiales mientras que las realizadas con la lengua se denominan linguales.

Las constricciones realizadas con la lengua se pueden realizar en varias partes del tracto vocal, clasificadas en términos generales en lugares de articulación coronal, dorsal y radical. Las articulaciones coronales se realizan con la parte anterior de la lengua, las articulaciones dorsales se realizan con la parte posterior de la lengua y las articulaciones radicales se realizan en la faringe . ^[14] Estas divisiones no son suficientes para distinguir y describir todos los sonidos del habla. ^[14] Por ejemplo, en inglés los sonidos [s] y [ʃ] son ambos coronales, pero se producen en diferentes lugares de la boca. Para tener en cuenta esto, se necesitan lugares de articulación más detallados según el área de la boca en la que se produce la constricción. ^[15]

Labial

Las articulaciones que involucran a los labios se pueden realizar de tres maneras diferentes: con ambos labios (bilabial), con un labio y los dientes, por lo que tienen el labio inferior como articulador activo y los dientes superiores como articulador pasivo ^[16] (labiodental) , y con la lengua y el labio superior (linguolabial). ^[17] Dependiendo de la definición utilizada, algunos o todos estos tipos de articulaciones pueden clasificarse en la clase de articulaciones labiales . Las consonantes bilabiales se forman con ambos labios. Al producir estos sonidos, el labio inferior se mueve más para encontrarse con el labio superior, que también se mueve ligeramente hacia abajo, ^[18] aunque en algunos casos la fuerza del aire que se mueve a través de la abertura (abertura entre los labios) puede hacer que los labios se separen más rápido que pueden unirse. ^[19] A diferencia de la mayoría de las otras articulaciones, ambos articuladores están hechos de tejido blando, por lo que es más probable que las paradas bilabiales se produzcan con cierres incompletos que las articulaciones que involucran superficies duras como los dientes o el paladar. Las oclusivas bilabiales también son inusuales porque un articulador en la sección superior del tracto vocal se mueve activamente hacia abajo, mientras el labio superior muestra algún movimiento activo hacia abajo. ^[20] Las consonantes linguolabiales se forman con la lámina de la lengua acercándose o haciendo contacto con el labio superior. Al igual que en las articulaciones bilabiales, el labio superior se mueve ligeramente hacia el articulador más activo. Las articulaciones de este grupo no tienen símbolos propios en el Alfabeto Fonético Internacional, sino que se forman combinando un símbolo apical con un diacrítico ubicándolos implícitamente en la categoría coronal. ^[21]^[22] Existen en varios idiomas indígenas de Vanuatu , como el tangoa .

Las consonantes labiodentales se forman cuando el labio inferior se eleva hasta los dientes superiores. Las consonantes labiodentales suelen ser fricativas , mientras que las nasales labiodentales también son tipológicamente comunes. ^[23] Existe un debate sobre si los verdaderos oclusivos labiodentales ocurren en algún lenguaje natural, ^[24] aunque se informa que varios idiomas tienen oclusivos labiodentales, incluidos el zulú , ^[25] tonga , ^[26] y shubi . ^[24]

Coronal

Las consonantes coronales se forman con la punta o la lámina de la lengua y, debido a la agilidad de la parte anterior de la lengua, representan una variedad no sólo en el lugar sino también en la postura de la lengua. Los lugares de articulación coronales representan las áreas de la boca donde la lengua entra en contacto o se contrae, e incluyen ubicaciones dentales, alveolares y post-alveolares. Las posturas de la lengua que utilizan la punta de la lengua pueden ser apicales si se utiliza la parte superior de la lengua, laminales si se hacen con la lámina de la lengua o subapical si la punta de la lengua está curvada hacia atrás y se utiliza la parte inferior de la lengua. Las coronas son únicas como grupo en el sentido de que se atestiguan todos los tipos de articulación . ^[21]^[27] Las lenguas australianas son bien conocidas por la gran cantidad de contrastes coronales exhibidos dentro y entre las lenguas de la región. ^[28] Las consonantes dentales se forman con la punta o lámina de la lengua y los dientes superiores. Se dividen en dos grupos según la parte de la lengua utilizada para producirlas: las consonantes dentales apicales se producen cuando la punta de la lengua toca los dientes; Las consonantes interdentales se producen con la lámina de la lengua cuando la punta de la lengua sobresale delante de los dientes. No se conoce ningún idioma que utilice ambos de manera contrastiva, aunque pueden existir alofónicamente . Las consonantes alveolares se forman con la punta o la lámina de la lengua en la cresta alveolar justo detrás de los dientes y de manera similar pueden ser apicales o laminales. ^[29]

Desde el punto de vista translingüístico, las consonantes dentales y las consonantes alveolares se contrastan con frecuencia, lo que lleva a una serie de generalizaciones de patrones translingüísticos. Los diferentes lugares de articulación también tienden a contrastarse en la parte de la lengua utilizada para producirlos: la mayoría de las lenguas con topes dentales tienen dientes laminales, mientras que las lenguas con topes apicales suelen tener topes apicales. Los idiomas rara vez tienen dos consonantes en el mismo lugar con un contraste en laminalidad, aunque Taa (ǃXóõ) es un contraejemplo de este patrón. ^[30] Si una lengua tiene solo uno de un tope dental o un tope alveolar, generalmente será laminal si es un tope dental, y el tope generalmente será apical si es un tope alveolar, aunque, por ejemplo, Temne y Búlgaro. ^[31] no siguen este patrón. ^[32] Si una lengua tiene un oclusivo apical y laminal, entonces es más probable que el oclusivo laminal esté africado como en Isoko , aunque Dahalo muestra el patrón opuesto con oclusivas alveolares más africadas. ^[33]

Las consonantes retroflejas tienen varias definiciones diferentes dependiendo de si se le da prominencia a la posición de la lengua o a la posición en el paladar. En general, representan un grupo de articulaciones en las que la punta de la lengua está curvada hasta cierto punto hacia arriba. De esta manera, las articulaciones retroflejas pueden ocurrir en varios lugares diferentes del paladar, incluidas las regiones alveolar, postalveolar y palatina. Si la parte inferior de la punta de la lengua hace contacto con el paladar, es subapical, aunque los sonidos postalveolares apicales también se describen como retroflejos. ^[34] Los ejemplos típicos de oclusivas retroflejas subapicales se encuentran comúnmente en las lenguas dravidianas , y en algunas lenguas indígenas del suroeste de los Estados Unidos, la diferencia contrastiva entre oclusivas dentales y alveolares es una ligera retroflexión de la oclusiva alveolar. ^[35] Acústicamente, la retroflexión tiende a afectar a los formantes superiores. ^[35]

Se ha hecho referencia a las articulaciones que tienen lugar justo detrás de la cresta alveolar, conocidas como consonantes post-alveolares , utilizando varios términos diferentes. Las consonantes postalveolares apicales a menudo se denominan retroflejas, mientras que las articulaciones laminales a veces se denominan palatoalveolares; ^[36] en la literatura australiana, estas paradas laminares a menudo se describen como "palatinas", aunque se producen más adelante que la región del paladar típicamente descrita como palatina. ^[28] Debido a la variación anatómica individual, la articulación precisa de las paradas palatoalveolares (y coronales en general) puede variar ampliamente dentro de una comunidad de habla. ^[37]

Dorsal

Las consonantes dorsales son aquellas consonantes formadas utilizando el cuerpo de la lengua en lugar de la punta o la lámina y normalmente se producen en el paladar, el velo o la úvula. Las consonantes palatinas se forman utilizando el cuerpo de la lengua contra el paladar duro en el paladar. Con frecuencia se contrastan con consonantes velares o uvulares, aunque es raro que un idioma contraste las tres simultáneamente, con Jaqaru como un posible ejemplo de un contraste de tres vías. ^[38] Las consonantes velares se forman utilizando el cuerpo de la lengua contra el velo . Son increíblemente comunes en varios idiomas; Casi todos los idiomas tienen una parada velar. Debido a que tanto las velares como las vocales se forman utilizando el cuerpo de la lengua, se ven muy afectadas por la coarticulación con las vocales y pueden producirse tan adelante como el paladar duro o tan atrás como la úvula. Estas variaciones suelen dividirse en velares anteriores, centrales y posteriores en paralelo con el espacio vocal. ^[39] Pueden ser difíciles de distinguir fonéticamente de las consonantes palatinas, aunque se producen ligeramente detrás del área de las consonantes palatinas prototípicas. ^[40] Las consonantes uvulares se forman cuando el cuerpo de la lengua entra en contacto o se acerca a la úvula. Son poco comunes y se encuentran en aproximadamente el 19 por ciento de los idiomas, y grandes regiones de América y África no tienen idiomas con consonantes uvulares. En idiomas con consonantes uvulares, las oclusivas son más frecuentes seguidas de continuantes (incluidas las nasales). ^[41]

Faríngea y laríngea

Las consonantes formadas por una constricción de la garganta son faríngeas, y las formadas por una constricción en la laringe son laríngeas. Las laringes se forman utilizando las cuerdas vocales, ya que la laringe está demasiado abajo en la garganta para alcanzarla con la lengua. Sin embargo, las faríngeas están lo suficientemente cerca de la boca como para que partes de la lengua puedan alcanzarlas.

Las consonantes radicales utilizan la raíz de la lengua o la epiglotis durante la producción y se producen muy atrás en el tracto vocal. ^[42] Las consonantes faríngeas se forman retrayendo la raíz de la lengua lo suficiente como para casi tocar la pared de la faringe . Debido a dificultades de producción, de esta manera sólo se pueden producir fricativas y aproximantes. ^[43]^[44] Las consonantes epiglotales se forman con la epiglotis y la pared posterior de la faringe. En Dahalo se han registrado paradas epiglotales . ^[44] Las consonantes epiglotales sonoras no se consideran posibles debido a que la cavidad entre la glotis y la epiglotis es demasiado pequeña para permitir la expresión. ^[45]

Las consonantes glotales son aquellas producidas usando las cuerdas vocales en la laringe. Debido a que las cuerdas vocales son la fuente de la fonación y están debajo del tracto vocal oronasal, varias consonantes glotales son imposibles, como una oclusiva glotal sonora. Son posibles tres consonantes glotales, una oclusiva glotal sorda y dos fricativas glotales, y todas están atestiguadas en lenguajes naturales. ^[21] Las oclusivas glotales , producidas al cerrar las cuerdas vocales , son notablemente comunes en los idiomas del mundo. ^[45] Si bien muchos idiomas los usan para demarcar límites de frases, algunos idiomas como el árabe y el huatla mazateco los tienen como fonemas contrastantes. Además, las oclusivas glotales se pueden realizar como laringealización de la siguiente vocal en este idioma. ^[46] Las oclusivas glotales, especialmente entre vocales, generalmente no forman un cierre completo. Las verdaderas oclusivas glotales normalmente ocurren sólo cuando están geminadas . ^[47]

la laringe

La laringe, comúnmente conocida como "caja de la voz", es una estructura cartilaginosa de la tráquea responsable de la fonación . Las cuerdas vocales se mantienen juntas para que vibren o separadas para que no lo hagan. Las posiciones de las cuerdas vocales se logran mediante el movimiento de los cartílagos aritenoides . ^[48] Los músculos laríngeos intrínsecos son responsables de mover los cartílagos aritenoides y de modular la tensión de las cuerdas vocales. ^[49] Si las cuerdas vocales no están lo suficientemente cerca o tensas, vibrarán esporádicamente o no vibrarán en absoluto. Si vibran esporádicamente, se producirá una voz chirriante o entrecortada, según el grado; Si no vibra en absoluto, el resultado será la falta de voz .

Además de posicionar correctamente las cuerdas vocales, también debe haber aire que fluya a través de ellas o no vibrarán. La diferencia de presión a través de la glotis necesaria para la sonorización se estima en 1 – 2 cm H ₂ O (98,0665 – 196,133 pascales). ^[50] El diferencial de presión puede caer por debajo de los niveles requeridos para la fonación debido a un aumento de la presión por encima de la glotis (presión superglótica) o una disminución de la presión por debajo de la glotis (presión subglótica). La presión subglótica la mantienen los músculos respiratorios . La presión supraglótica, sin constricciones ni articulaciones, es aproximadamente igual a la presión atmosférica . Sin embargo, debido a que las articulaciones (especialmente las consonantes) representan constricciones del flujo de aire, la presión en la cavidad detrás de esas constricciones puede aumentar, lo que resulta en una presión supraglótica más alta. ^[51]

Acceso léxico

Según el modelo de acceso léxico se emplean dos etapas diferentes de cognición; por ello, este concepto se conoce como teoría del acceso léxico en dos etapas. La primera etapa, la selección léxica, proporciona información sobre los elementos léxicos necesarios para construir la representación a nivel funcional. Estos elementos se recuperan de acuerdo con sus propiedades semánticas y sintácticas específicas, pero las formas fonológicas aún no están disponibles en esta etapa. La segunda etapa, recuperación de formas de palabras, proporciona la información necesaria para construir la representación a nivel posicional. ^[52]

Modelos articulatorios

Al producir el habla, los articuladores se mueven y contactan lugares particulares en el espacio, lo que produce cambios en la señal acústica. Algunos modelos de producción del habla toman esto como base para modelar la articulación en un sistema de coordenadas que puede ser interno al cuerpo (intrínseco) o externo (extrínseco). Los sistemas de coordenadas intrínsecos modelan el movimiento de los articuladores como posiciones y ángulos de las articulaciones del cuerpo. Los modelos de coordenadas intrínsecas de la mandíbula suelen utilizar de dos a tres grados de libertad para representar la traslación y la rotación. Estos enfrentan problemas para modelar la lengua que, a diferencia de las articulaciones de la mandíbula y los brazos, es un hidrostato muscular —como la trompa de un elefante— que carece de articulaciones. ^[53] Debido a las diferentes estructuras fisiológicas, las trayectorias de movimiento de la mandíbula son líneas relativamente rectas durante el habla y la masticación, mientras que los movimientos de la lengua siguen curvas. ^[54]

Los movimientos en línea recta se han utilizado para argumentar que las articulaciones están planificadas en un espacio extrínseco en lugar de intrínseco, aunque los sistemas de coordenadas extrínsecos también incluyen espacios de coordenadas acústicos, no solo espacios de coordenadas físicos. ^[53] Los modelos que suponen que los movimientos se planifican en el espacio extrínseco se topan con el problema inverso de explicar las ubicaciones de los músculos y las articulaciones que producen la ruta observada o la señal acústica. El brazo, por ejemplo, tiene siete grados de libertad y 22 músculos, por lo que múltiples configuraciones articulares y musculares diferentes pueden conducir a la misma posición final. Para los modelos de planificación en el espacio acústico extrínseco, también se aplica el mismo problema de mapeo uno a muchos, sin un mapeo único desde los objetivos físicos o acústicos hasta los movimientos musculares necesarios para lograrlos. Sin embargo, las preocupaciones sobre el problema inverso pueden ser exageradas, ya que el habla es una habilidad altamente aprendida que utiliza estructuras neurológicas que evolucionaron para ese propósito. ^[55]

El modelo del punto de equilibrio propone una solución al problema inverso argumentando que los objetivos de movimiento deben representarse como la posición de los pares de músculos que actúan sobre una articulación. ^[d] Es importante destacar que los músculos se modelan como resortes y el objetivo es el punto de equilibrio para el sistema resorte-masa modelado. Al utilizar resortes, el modelo del punto de equilibrio puede explicar fácilmente la compensación y la respuesta cuando se interrumpen los movimientos. Se consideran un modelo de coordenadas porque suponen que estas posiciones de los músculos se representan como puntos en el espacio, puntos de equilibrio, donde converge la acción elástica de los músculos. ^[56]^[57]

Los enfoques gestuales de la producción del habla proponen que las articulaciones se representen como patrones de movimiento en lugar de coordenadas particulares para alcanzar. La unidad mínima es un gesto que representa un grupo de "patrones de movimiento articulatorio funcionalmente equivalentes que se controlan activamente con referencia a un objetivo determinado relevante para el habla (por ejemplo, un cierre bilabial)". ^[58] Estos grupos representan estructuras coordinativas o "sinergias" que ven los movimientos no como movimientos musculares individuales sino como agrupaciones de músculos dependientes de la tarea que trabajan juntos como una sola unidad. ^[59]^[60] Esto reduce los grados de libertad en la planificación de la articulación, un problema especialmente en los modelos de coordenadas intrínsecas, que permiten cualquier movimiento que logre el objetivo del habla, en lugar de codificar los movimientos particulares en la representación abstracta. La coarticulación está bien descrita por los modelos gestuales, ya que las articulaciones a velocidades de habla más rápidas pueden explicarse como compuestos de gestos independientes a velocidades de habla más lentas. ^[61]

Acústica

Los sonidos del habla se crean mediante la modificación de una corriente de aire que da como resultado una onda sonora. La modificación la realizan los articuladores, con diferentes lugares y formas de articulación que producen diferentes resultados acústicos. Debido a que la postura del tracto vocal, no sólo la posición de la lengua, puede afectar el sonido resultante, la forma de articulación es importante para describir el sonido del habla. Las palabras tack y sack comienzan con sonidos alveolares en inglés, pero difieren en la distancia que separa la lengua de la cresta alveolar. Esta diferencia tiene grandes efectos en la corriente de aire y, por tanto, en el sonido que se produce. De manera similar, la dirección y fuente de la corriente de aire pueden afectar el sonido. El mecanismo de corriente de aire más común es el pulmonar (utiliza los pulmones), pero la glotis y la lengua también se pueden utilizar para producir corrientes de aire.

Tipos de voz y fonación

Una distinción importante entre los sonidos del habla es si son sonoros. Los sonidos se expresan cuando las cuerdas vocales comienzan a vibrar en el proceso de fonación. Se pueden producir muchos sonidos con o sin fonación, aunque las limitaciones físicas pueden dificultar o imposibilitar la fonación para algunas articulaciones. Cuando se expresan las articulaciones, la principal fuente de ruido es la vibración periódica de las cuerdas vocales. Las articulaciones como las oclusivas sordas no tienen una fuente acústica y se notan por su silencio, pero otros sonidos sordos como las fricativas crean su propia fuente acústica independientemente de la fonación.

La fonación está controlada por los músculos de la laringe y los idiomas utilizan más detalles acústicos que la voz binaria. Durante la fonación, las cuerdas vocales vibran a un ritmo determinado. Esta vibración da como resultado una forma de onda acústica periódica que comprende una frecuencia fundamental y sus armónicos. La frecuencia fundamental de la onda acústica se puede controlar ajustando los músculos de la laringe, y los oyentes perciben esta frecuencia fundamental como tono. Los idiomas utilizan la manipulación del tono para transmitir información léxica en lenguajes tonales, y muchos idiomas utilizan el tono para marcar información prosódica o pragmática.

Para que las cuerdas vocales vibren, deben estar en la posición adecuada y debe haber aire fluyendo por la glotis. ^[50] Los tipos de fonación se modelan en un continuo de estados glotales desde completamente abierto (sordo) hasta completamente cerrado (oclusiva glotal). La posición óptima para la vibración y el tipo de fonación más utilizado en el habla, la voz modal, se encuentra en el medio de estos dos extremos. Si la glotis es un poco más ancha, se produce una voz entrecortada, mientras que al acercar las cuerdas vocales se produce una voz chirriante. ^[62]

El patrón de fonación normal utilizado en el habla típica es la voz modal, donde las cuerdas vocales se mantienen juntas con una tensión moderada. Las cuerdas vocales vibran como una sola unidad de forma periódica y eficiente con un cierre glotal completo y sin aspiración. ^[63] Si se separan más, no vibran y, por lo tanto, producen teléfonos sin voz. Si se mantienen firmemente juntos producen una parada glotal. ^[62]

Si las cuerdas vocales se mantienen un poco más separadas que en la voz modal, producen tipos de fonación como voz entrecortada (o murmullo) y voz susurrante. La tensión a través de los ligamentos vocales ( cuerdas vocales ) es menor que en la sonorización modal, lo que permite que el aire fluya más libremente. Tanto la voz entrecortada como la voz susurrante existen en un continuo caracterizado vagamente como que va desde la forma de onda más periódica de la voz entrecortada hasta la forma de onda más ruidosa de la voz susurrante. Acústicamente, ambos tienden a amortiguar el primer formante con una voz susurrante que muestra desviaciones más extremas. ^[64]

Mantener las cuerdas vocales más juntas produce una voz chirriante. La tensión a través de las cuerdas vocales es menor que en la voz modal, pero se mantienen muy juntas, lo que hace que solo vibren los ligamentos de las cuerdas vocales. ^[e] Los pulsos son muy irregulares, con tono y amplitud de frecuencia bajos. ^{[sesenta y cinco]}

Algunos idiomas no mantienen una distinción de sonorización para algunas consonantes, ^[f] pero todos los idiomas usan sonorización hasta cierto punto. Por ejemplo, no se conoce ningún idioma que tenga un contraste de sonoridad fonémica para las vocales con todas las vocales conocidas canónicamente expresadas. ^[g] Otras posiciones de la glotis, como la voz entrecortada y chirriante, se utilizan en varios idiomas, como Jalapa Mazatec , para contrastar fonemas, mientras que en otros idiomas, como el inglés, existen alofónicamente.

Hay varias formas de determinar si un segmento es sonoro o no; la más sencilla es sentir la laringe durante el habla y notar cuándo se sienten las vibraciones. Se pueden obtener mediciones más precisas mediante el análisis acústico de un espectrograma o corte espectral. En un análisis espectrográfico, los segmentos sonoros muestran una barra de sonoridad, una región de alta energía acústica, en las bajas frecuencias de los segmentos sonoros. ^[66] Al examinar un empalme espectral, el espectro acústico en un momento dado, un modelo de la vocal pronunciada, invierte el filtrado de la boca produciendo el espectro de la glotis. Luego se ajusta un modelo computacional de la señal glotal sin filtrar a la señal acústica filtrada inversa para determinar las características de la glotis. ^[67] El análisis visual también está disponible utilizando equipos médicos especializados como ultrasonido y endoscopia. ^[66]^[h]

vocales

Las vocales se clasifican en términos generales según el área de la boca en la que se producen, pero debido a que se producen sin una constricción en el tracto vocal, su descripción precisa se basa en la medición de correlatos acústicos de la posición de la lengua. La ubicación de la lengua durante la producción de vocales cambia las frecuencias en las que resuena la cavidad, y son estas resonancias, conocidas como formantes , las que se miden y utilizan para caracterizar las vocales.

La altura de la vocal se refiere tradicionalmente al punto más alto de la lengua durante la articulación. ^[68] El parámetro de altura se divide en cuatro niveles principales: alto (cerrado), cerrado-medio, abierto-medio y bajo (abierto). Las vocales cuya altura está en el medio se denominan medias. Las vocales cerradas ligeramente abiertas y las vocales abiertas ligeramente cerradas se denominan casi cerradas y casi abiertas, respectivamente. Las vocales más bajas no sólo se articulan con la lengua bajada, sino también bajando la mandíbula. ^[69]

Si bien la IPA implica que hay siete niveles de altura de las vocales, es poco probable que un idioma determinado pueda contrastar mínimamente los siete niveles. Chomsky y Halle sugieren que sólo hay tres niveles, ^[70] aunque parecen necesarios cuatro niveles de altura vocálica para describir el danés y es posible que algunas lenguas incluso necesiten cinco. ^[71]

La vocal posterior se divide en tres niveles: anterior, central y posterior. Los idiomas no suelen contrastar mínimamente más de dos niveles de retroceso vocal. Algunos idiomas que afirman tener una distinción de tres vías incluyen el nimborano y el noruego . ^[72]

En la mayoría de los idiomas, los labios durante la producción de vocales se pueden clasificar como redondeados o no redondeados (abiertos), aunque se han descrito otros tipos de posiciones de los labios, como compresión y protrusión. La posición de los labios se correlaciona con la altura y la parte posterior: las vocales anteriores y bajas tienden a no ser redondeadas, mientras que las vocales posteriores y altas suelen ser redondeadas. ^[73] Las vocales emparejadas en la tabla IPA tienen la vocal extendida a la izquierda y la vocal redondeada a la derecha. ^[74]

Junto con las características vocales universales descritas anteriormente, algunas lenguas tienen características adicionales como nasalidad , longitud y diferentes tipos de fonación como sorda o chirriante . En ocasiones se requieren gestos linguales más especializados como roticidad , raíz avanzada de la lengua , faringalización , estridencia y fricación para describir una determinada vocal. ^[75]

Modo de articulación

Conocer el lugar de articulación no es suficiente para describir completamente una consonante; la forma en que se produce la estenosis es igualmente importante. Los modos de articulación describen exactamente cómo el articulador activo modifica, estrecha o cierra el tracto vocal. ^[76]

Las oclusivas (también conocidas como explosivas) son consonantes en las que la corriente de aire está completamente obstruida. La presión se acumula en la boca durante la estenosis, que luego se libera como un pequeño estallido de sonido cuando los articuladores se separan. El velo se eleva para que el aire no pueda fluir a través de la cavidad nasal. Si el velo se baja y permite que el aire fluya a través de la nariz, se produce una parada nasal. Sin embargo, los fonetistas casi siempre se refieren a las oclusivas nasales simplemente como "nasales". ^[76] Las africadas son una secuencia de oclusivas seguidas de una fricativa en el mismo lugar. ^[77]

Las fricativas son consonantes en las que la corriente de aire se vuelve turbulenta al obstruir parcial, pero no completamente, parte del tracto vocal. ^[76] Las sibilantes son un tipo especial de fricativa en la que la corriente de aire turbulenta se dirige hacia los dientes, ^[78] creando un silbido agudo. ^[79]

Las nasales (a veces denominadas oclusivas nasales) son consonantes en las que hay un cierre en la cavidad bucal y el velo desciende, lo que permite que el aire fluya a través de la nariz. ^[80]

En una aproximación , los articuladores se acercan, pero no hasta el punto de permitir una corriente de aire turbulenta. ^[79]

Las laterales son consonantes en las que la corriente de aire está obstruida a lo largo del centro del tracto vocal, lo que permite que la corriente de aire fluya libremente en uno o ambos lados. ^[79] Las laterales también se han definido como consonantes en las que la lengua se contrae de tal manera que la corriente de aire es mayor alrededor de los lados que sobre el centro de la lengua. ^[81] La primera definición no permite que el aire fluya sobre la lengua.

Los trinos son consonantes en las que la corriente de aire pone en movimiento la lengua o los labios. ^[82] La estenosis se forma de tal manera que la corriente de aire provoca un patrón repetitivo de apertura y cierre de los articuladores blandos. ^[83] Los trinos apicales suelen consistir en dos o tres períodos de vibración. ^[84]

Los golpecitos y aleteos son gestos únicos, rápidos, generalmente apicales , en los que la lengua se lanza contra el paladar, comparable a una parada muy rápida. ^[82] Estos términos a veces se usan indistintamente, pero algunos fonetistas hacen una distinción. ^[85] En un golpe, la lengua entra en contacto con el paladar en un solo movimiento, mientras que en un colgajo la lengua se mueve tangencialmente al paladar, golpeándolo al pasar.

Durante un mecanismo de corriente de aire glotal , la glotis se cierra, atrapando una masa de aire. Esto permite que el aire restante en el tracto vocal se mueva por separado. Un movimiento ascendente de la glotis cerrada sacará este aire, lo que dará como resultado una consonante eyectiva . Alternativamente, la glotis puede bajar, aspirando más aire hacia la boca, lo que da como resultado una consonante implosiva . ^[86]

Los clics son paradas en las que el movimiento de la lengua hace que se succione aire en la boca, esto se conoce como corriente de aire velarica . ^[87] Durante el clic, el aire se enrarece entre dos cierres articulatorios, produciendo un fuerte sonido de "clic" cuando se libera el cierre anterior. La liberación del cierre anterior se denomina afluencia de clic. La liberación del cierre posterior, que puede ser velar o uvular, es el eflujo del clic. Los clics se utilizan en varias familias de lenguas africanas, como las lenguas khoisan y bantú . ^[88]

Sistema pulmonar y subglótico

Los pulmones impulsan casi toda la producción del habla y su importancia en la fonética se debe a que crean presión para los sonidos pulmonares. Los tipos de sonido más comunes en todos los idiomas son la salida pulmonar, donde se exhala aire de los pulmones. ^[89] Lo contrario es posible, aunque no se sabe de ninguna lengua que tenga sonidos ingresivos pulmonares como fonemas. ^[90] Muchas lenguas, como el sueco, las utilizan para articulaciones paralingüísticas , como afirmaciones, en varias lenguas genética y geográficamente diversas. ^[91] Tanto los sonidos egresivos como los ingresivos se basan en mantener las cuerdas vocales en una postura particular y usar los pulmones para aspirar aire a través de las cuerdas vocales para que vibren (sonoras) o no vibren (sordas). ^[89] Las articulaciones pulmonares están restringidas por el volumen de aire que se puede exhalar en un ciclo respiratorio determinado, conocido como capacidad vital .

Los pulmones se utilizan para mantener dos tipos de presión simultáneamente con el fin de producir y modificar la fonación. Para producir fonación, los pulmones deben mantener una presión de 3 a 5 cm H ₂ O más alta que la presión por encima de la glotis. Sin embargo, se realizan ajustes pequeños y rápidos a la presión subglótica para modificar el habla en función de características suprasegmentales como el estrés. Se utilizan varios músculos torácicos para realizar estos ajustes. Debido a que los pulmones y el tórax se estiran durante la inhalación, las fuerzas elásticas de los pulmones por sí solas pueden producir diferenciales de presión suficientes para la fonación en volúmenes pulmonares superiores al 50 por ciento de la capacidad vital. ^[92] Por encima del 50 por ciento de la capacidad vital, los músculos respiratorios se utilizan para "controlar" las fuerzas elásticas del tórax para mantener un diferencial de presión estable. Por debajo de ese volumen, se utilizan para aumentar la presión subglótica exhalando aire activamente.

Durante el habla, el ciclo respiratorio se modifica para adaptarse a las necesidades tanto lingüísticas como biológicas. La exhalación, generalmente alrededor del 60 por ciento del ciclo respiratorio en reposo, aumenta a aproximadamente el 90 por ciento del ciclo respiratorio. Debido a que las necesidades metabólicas son relativamente estables, el volumen total de aire movido en la mayoría de los casos del habla sigue siendo aproximadamente el mismo que el de la respiración tranquila. ^[93] Los aumentos en la intensidad del habla de 18 dB (una conversación en voz alta) tienen un impacto relativamente pequeño en el volumen de aire que se mueve. Debido a que sus sistemas respiratorios no están tan desarrollados como los de los adultos, los niños tienden a utilizar una mayor proporción de su capacidad vital en comparación con los adultos, con inhalaciones más profundas. ^[94]

Teoría fuente-filtro

El modelo fuente-filtro del habla es una teoría de la producción del habla que explica el vínculo entre la postura del tracto vocal y las consecuencias acústicas. Según este modelo, el tracto vocal puede modelarse como una fuente de ruido acoplada a un filtro acústico. ^[95] La fuente de ruido en muchos casos es la laringe durante el proceso de expresión, aunque otras fuentes de ruido se pueden modelar de la misma manera. La forma del tracto vocal supraglótico actúa como filtro y las diferentes configuraciones de los articuladores dan como resultado diferentes patrones acústicos. Estos cambios son predecibles. El tracto vocal se puede modelar como una secuencia de tubos, cerrados en un extremo, con diámetros variables, y mediante el uso de ecuaciones de resonancia acústica se puede derivar el efecto acústico de una postura articulatoria. ^[96] El proceso de filtrado inverso utiliza este principio para analizar el espectro fuente producido por las cuerdas vocales durante la expresión. Al tomar la inversa de un filtro previsto, el efecto acústico del tracto vocal supraglótico se puede deshacer dando el espectro acústico producido por las cuerdas vocales. ^[97] Esto permite el estudio cuantitativo de los distintos tipos de fonación.

Percepción

La percepción del lenguaje es el proceso mediante el cual un oyente decodifica y comprende una señal lingüística. ^[i] Para percibir el habla, la señal acústica continua debe convertirse en unidades lingüísticas discretas, como fonemas , morfemas y palabras . ^[98] Para identificar y categorizar correctamente los sonidos, los oyentes priorizan ciertos aspectos de la señal que pueden distinguir de manera confiable entre categorías lingüísticas. ^[99] Si bien se priorizan ciertas señales sobre otras, muchos aspectos de la señal pueden contribuir a la percepción. Por ejemplo, aunque los lenguajes orales priorizan la información acústica, el efecto McGurk muestra que la información visual se utiliza para distinguir información ambigua cuando las señales acústicas no son fiables. ^[100]

Si bien los oyentes pueden utilizar una variedad de información para segmentar la señal del habla, la relación entre la señal acústica y la percepción de categorías no es un mapeo perfecto. Debido a la coarticulación , los ambientes ruidosos y las diferencias individuales, existe un alto grado de variabilidad acústica dentro de las categorías. ^[101] Conocido como el problema de la invariancia perceptiva , los oyentes son capaces de percibir categorías de manera confiable a pesar de la variabilidad en la instanciación acústica. ^[102] Para hacer esto, los oyentes se adaptan rápidamente a nuevos hablantes y cambiarán sus límites entre categorías para que coincidan con las distinciones acústicas que hace su interlocutor. ^[103]

Audición

Cómo los sonidos llegan desde la fuente hasta el cerebro

La audición, el proceso de oír sonidos, es la primera etapa de la percepción del habla. Los articuladores provocan cambios sistemáticos en la presión del aire que viajan en forma de ondas sonoras hasta el oído del oyente. Luego, las ondas sonoras golpean el tímpano del oyente y lo hacen vibrar. La vibración del tímpano se transmite a través de los huesecillos —tres pequeños huesos del oído medio— hasta la cóclea . ^[104] La cóclea es un tubo lleno de líquido en forma de espiral dividido longitudinalmente por el órgano de Corti que contiene la membrana basilar . La membrana basilar aumenta de espesor a medida que viaja a través de la cóclea, lo que provoca que diferentes frecuencias resuenen en diferentes lugares. Este diseño tonotópico permite que el oído analice el sonido de forma similar a una transformada de Fourier . ^[105]

La vibración diferencial del basilar hace que las células ciliadas dentro del órgano de Corti se muevan. Esto provoca la despolarización de las células ciliadas y, en última instancia, la conversión de la señal acústica en una señal neuronal. ^[106] Si bien las células ciliadas no producen potenciales de acción por sí mismas, liberan neurotransmisores en las sinapsis con las fibras del nervio auditivo , que sí producen potenciales de acción. De esta manera, los patrones de oscilaciones en la membrana basilar se convierten en patrones espaciotemporales de disparos que transmiten información sobre el sonido al tronco del encéfalo . ^[107]

Prosodia

Además de las consonantes y vocales, la fonética también describe las propiedades del habla que no se localizan en segmentos sino en unidades mayores del habla, como sílabas y frases . La prosodia incluye características auditivas como el tono , la velocidad del habla , la duración y el volumen . Los idiomas utilizan estas propiedades en diferentes grados para implementar el acento , los acentos tonales y la entonación ; por ejemplo, el acento en inglés y español se correlaciona con cambios en el tono y la duración, mientras que el acento en galés se correlaciona más consistentemente con el tono que la duración y el acento en tailandés. sólo se correlaciona con la duración. ^[108]

Teorías de la percepción del habla.

Las primeras teorías de la percepción del habla, como la teoría motora, intentaron resolver el problema de la invariancia perceptiva argumentando que la percepción y la producción del habla estaban estrechamente vinculadas. En su forma más fuerte, la teoría motora sostiene que la percepción del habla requiere que el oyente acceda a la representación articulatoria de los sonidos; ^[109] para categorizar adecuadamente un sonido, un oyente aplica ingeniería inversa a la articulación que produciría ese sonido y, al identificar estos gestos, puede recuperar la categoría lingüística deseada. ^[110] Si bien hallazgos como el efecto McGurk y estudios de casos de pacientes con lesiones neurológicas han brindado apoyo a la teoría motora, experimentos adicionales no han respaldado la forma fuerte de teoría motora, aunque hay cierto apoyo para formas más débiles de teoría motora que afirman una relación no determinista entre producción y percepción. ^[110]^[111]^[112]

Las teorías sucesoras de la percepción del habla se centran en las señales acústicas de las categorías de sonido y pueden agruparse en dos categorías amplias: teorías abstraccionistas y teorías episódicas. ^[113] En las teorías abstraccionistas, la percepción del habla implica la identificación de un objeto léxico idealizado basado en una señal reducida a sus componentes necesarios y la normalización de la señal para contrarrestar la variabilidad del hablante. Las teorías episódicas como el modelo ejemplar sostienen que la percepción del habla implica acceder a recuerdos detallados (es decir, recuerdos episódicos ) de señales escuchadas previamente. El problema de la invariancia perceptiva es explicado por las teorías episódicas como una cuestión de familiaridad: la normalización es un subproducto de la exposición a distribuciones más variables en lugar de un proceso discreto como afirman las teorías abstraccionistas. ^[113]

Subdisciplinas

Fonética acustica

La fonética acústica se ocupa de las propiedades acústicas de los sonidos del habla. La sensación del sonido es causada por fluctuaciones de presión que hacen que el tímpano se mueva. El oído transforma este movimiento en señales neuronales que el cerebro registra como sonido. Las formas de onda acústica son registros que miden estas fluctuaciones de presión. ^[114]

Fonética articulatoria

La fonética articulatoria se ocupa de las formas en que se producen los sonidos del habla.

Fonética auditiva

La fonética auditiva estudia cómo los humanos perciben los sonidos del habla. Debido a las características anatómicas del sistema auditivo que distorsionan la señal del habla, los humanos no percibimos los sonidos del habla como registros acústicos perfectos. Por ejemplo, las impresiones auditivas de volumen , medidas en decibelios (dB), no coinciden linealmente con la diferencia de presión sonora. ^[115]

La discrepancia entre los análisis acústicos y lo que escucha el oyente es especialmente notable en los sonidos del habla que tienen mucha energía de alta frecuencia, como ciertas fricativas. Para conciliar este desajuste, se han desarrollado modelos funcionales del sistema auditivo. ^[116]

Describir sonidos

Los lenguajes humanos utilizan muchos sonidos diferentes y, para compararlos, los lingüistas deben poder describir los sonidos de una manera independiente del lenguaje. Los sonidos del habla se pueden describir de varias maneras. Lo más común es que los sonidos del habla se denominen a los movimientos de la boca necesarios para producirlos. Las consonantes y las vocales son dos categorías generales que los fonetistas definen por los movimientos de un sonido del habla. Descriptores más detallados son parámetros como el lugar de articulación. El lugar de articulación , la forma de articulación y la sonorización se utilizan para describir consonantes y son las divisiones principales de la tabla de consonantes del Alfabeto Fonético Internacional . Las vocales se describen por su altura, dorso y redondeo. El lenguaje de señas se describe utilizando un conjunto de parámetros similar pero distinto para describir los signos: ubicación, movimiento, forma de la mano, orientación de la palma y características no manuales. Además de las descripciones articulatorias, los sonidos utilizados en las lenguas orales se pueden describir utilizando su acústica. Dado que la acústica es una consecuencia de la articulación, ambos métodos de descripción son suficientes para distinguir sonidos y la elección entre sistemas depende de la característica fonética que se investiga.

Las consonantes son sonidos del habla que se articulan con un cierre total o parcial del tracto vocal . Generalmente se producen mediante la modificación de una corriente de aire exhalada desde los pulmones. Los órganos respiratorios utilizados para crear y modificar el flujo de aire se dividen en tres regiones: el tracto vocal (supralaríngeo), la laringe y el sistema subglótico. La corriente de aire puede ser egresiva (fuera del tracto vocal) o ingresiva (dentro del tracto vocal). En los sonidos pulmonares, la corriente de aire es producida por los pulmones en el sistema subglótico y pasa a través de la laringe y el tracto vocal. Los sonidos glotálicos utilizan una corriente de aire creada por los movimientos de la laringe sin flujo de aire desde los pulmones. Las consonantes de clic se articulan mediante la rarefacción del aire usando la lengua, seguido de la liberación del cierre delantero de la lengua.

Las vocales son sonidos silábicos del habla que se pronuncian sin ninguna obstrucción en el tracto vocal. ^[117] A diferencia de las consonantes, que generalmente tienen lugares de articulación definidos, las vocales se definen en relación con un conjunto de vocales de referencia llamadas vocales cardinales . Se necesitan tres propiedades para definir las vocales: altura de la lengua, dorso de la lengua y redondez de los labios. Las vocales que se articulan con una cualidad estable se denominan monoftongos ; una combinación de dos vocales separadas en una misma sílaba es un diptongo . ^[118] En el IPA , las vocales están representadas en una forma trapezoidal que representa la boca humana: el eje vertical representa la boca desde el suelo hasta el techo y el eje horizontal representa la dimensión anverso-posterior. ^[119]

Transcripción

La transcripción fonética es un sistema de transcripción telefónica que se produce en un idioma, ya sea oral o de signos . El sistema de transcripción fonética más conocido, el Alfabeto Fonético Internacional (IPA), proporciona un conjunto estandarizado de símbolos para teléfonos orales. ^[120]^[121] La naturaleza estandarizada de la IPA permite a sus usuarios transcribir de manera precisa y consistente los teléfonos de diferentes idiomas, dialectos e idiolectos . ^[120]^[122]^[123] La IPA es una herramienta útil no solo para el estudio de la fonética sino también para la enseñanza de idiomas, la actuación profesional y la patología del habla . ^[122]

Si bien ninguna lengua de signos tiene un sistema de escritura estandarizado, los lingüistas han desarrollado sus propios sistemas de notación que describen la forma, la ubicación y el movimiento de la mano. El Sistema de Notación de Hamburgo (HamNoSys) es similar al IPA en que permite distintos niveles de detalle. Algunos sistemas de notación como KOMVA y el sistema Stokoe fueron diseñados para su uso en diccionarios; También utilizan letras alfabéticas del idioma local para las formas de las manos, mientras que HamNoSys representa la forma de las manos directamente. SignWriting pretende ser un sistema de escritura fácil de aprender para lenguas de signos, aunque aún no ha sido adoptado oficialmente por ninguna comunidad sorda. ^[124]

Las lenguas de signos

A diferencia de las lenguas habladas, las palabras en las lenguas de signos se perciben con los ojos en lugar de con los oídos. Los signos se articulan con las manos, la parte superior del cuerpo y la cabeza. Los principales articuladores son las manos y los brazos. Las partes relativas del brazo se describen con los términos proximal y distal . Proximal se refiere a una parte más cercana al torso mientras que una parte distal está más alejada de él. Por ejemplo, un movimiento de muñeca es distal en comparación con un movimiento de codo. Debido a que requieren menos energía, los movimientos distales generalmente son más fáciles de producir. Varios factores, como la flexibilidad muscular o el hecho de ser considerado tabú , restringen lo que puede considerarse un signo. ^[125] Los firmantes nativos no miran las manos de sus interlocutores. En cambio, su mirada está fijada en el rostro. Debido a que la visión periférica no está tan enfocada como el centro del campo visual, los signos articulados cerca de la cara permiten percibir diferencias más sutiles en el movimiento y la ubicación de los dedos. ^[126]

A diferencia de las lenguas habladas, las lenguas de signos tienen dos articuladores idénticos: las manos. Los firmantes pueden utilizar la mano que prefieran sin interrumpir la comunicación. Debido a limitaciones neurológicas universales, los signos a dos manos generalmente tienen el mismo tipo de articulación en ambas manos; esto se conoce como condición de simetría. ^[125] La segunda restricción universal es la condición de dominancia, que sostiene que cuando hay dos formas de manos involucradas, una mano permanecerá estacionaria y tendrá un conjunto de formas de manos más limitado en comparación con la mano dominante en movimiento. ^[127] Además, es común que una mano en un signo de dos manos se suelte durante conversaciones informales, un proceso conocido como caída débil. ^[125] Al igual que las palabras en los idiomas hablados, la coarticulación puede hacer que los signos influyan en la forma de cada uno. Los ejemplos incluyen las formas de las manos de los signos vecinos que se vuelven más similares entre sí ( asimilación ) o una caída débil (un caso de eliminación ). ^[128]

Ver también

Referencias

Notas

^ Los lingüistas debaten si estas etapas pueden interactuar o si ocurren en serie (compárese con Dell y Reich (1981) y Motley, Camden y Baars (1982)). Para facilitar la descripción, el proceso de producción del lenguaje se describe como una serie de etapas independientes, aunque la evidencia reciente muestra que esto es inexacto. ^[12] Para obtener más descripciones de los modelos de activación interactiva, consulte Jaeger, Furth & Hilliard (2012).
^ o después de que se haya planificado parte de un enunciado; véase Gleitman et al. (2007) para evidencia de producción antes de que un mensaje haya sido completamente planeado
^ adaptado de Sedivy (2019, p. 411) y Boersma (1998, p. 11)
^ Véase Feldman (1966) para conocer la propuesta original.
^ Consulte #La laringe para obtener más información sobre la anatomía de la fonación.
^ El hawaiano, por ejemplo, no contrasta las explosivas sonoras y sordas.
^ Hay idiomas, como el japonés , donde las vocales se producen como sordas en determinados contextos.
^ Consulte #Modelos articulatorios para obtener más información sobre modelado acústico.
^ Al igual que ocurre con la producción del habla, la naturaleza de la señal lingüística varía según la modalidad del lenguaje . La señal puede ser acústica para el habla oral, visual para las lenguas de signos o táctil para las lenguas de signos táctiles manuales. Para simplificar, aquí se describe el habla acústica; para la percepción del lenguaje de señas específicamente, consulte Lenguaje de señas # Percepción de señas .

Citas

^ O'Grady 2005, pag. 15.
^ Lynch, Mateo (7 de abril de 2021). "Las diferencias entre un teléfono, un fonema y un alófono". El Edvocate . Consultado el 6 de febrero de 2023 .
^ abc Caffrey 2017.
^ Kiparsky 1993, pag. 2918.
^ Kiparsky 1993, págs. 2922-3.
^ Deussen, Paul (1980). Sesenta Upanishads del Veda, Volumen I. Motilal Banarasidass. pag. 222.ISBN _ 978-8120814684.
^ Diccionario de inglés Oxford 2018.
^ ab Roach 2015.
^ Ladefoged 1960, pag. 388.
^ Ladefoged 1960.
^ Dell y O'Seaghdha 1992.
^ Sedivy 2019, pag. 439.
^ Boersma 1998.
^ ab Ladefoged 2001, pág. 5.
^ Ladefoged y Maddieson 1996, pág. 9.
^ "IPA: Labiodentales". inicio.cc.umanitoba.ca . Consultado el 6 de febrero de 2023 .
^ Ladefoged y Maddieson 1996, pág. dieciséis.
^ Maddieson 1993.
^ Fujimura 1961.
^ Ladefoged y Maddieson 1996, págs. 16-17.
^ abc Asociación Fonética Internacional 2015.
^ Ladefoged y Maddieson 1996, pág. 18.
^ Ladefoged y Maddieson 1996, págs. 17-18.
^ ab Ladefoged y Maddieson 1996, pág. 17.
^ Doque 1926.
^ Guthrie 1948, pag. 61.
^ Ladefoged y Maddieson 1996, págs. 19-31.
^ ab Ladefoged y Maddieson 1996, pág. 28.
^ Ladefoged y Maddieson 1996, págs. 19-25.
^ Ladefoged y Maddieson 1996, págs. 20, 40-1.
^ Scatton 1984, pág. 60.
^ Ladefoged y Maddieson 1996, pág. 23.
^ Ladefoged y Maddieson 1996, págs.
^ Ladefoged y Maddieson 1996, págs. 25, 27–8.
^ ab Ladefoged y Maddieson 1996, pág. 27.
^ Ladefoged y Maddieson 1996, págs.
^ Ladefoged y Maddieson 1996, pág. 32.
^ Ladefoged y Maddieson 1996, pág. 35.
^ Ladefoged y Maddieson 1996, págs.
^ Keating y Lahiri 1993, pág. 89.
^ Maddieson 2013.
^ Ladefoged y Maddieson 1996, pág. 11.
^ Logia 2009, pag. 33.
^ ab Ladefoged y Maddieson 1996, pág. 37.
^ ab Ladefoged y Maddieson 1996, pág. 38.
^ Ladefoged y Maddieson 1996, pág. 74.
^ Ladefoged y Maddieson 1996, pág. 75.
^ Ladefoged 2001, pag. 123.
^ Seikel, Drumright y King 2016, pág. 222.
^ ab Ohala 1997, pág. 1.
^ Chomsky y Halle 1968, págs. 300–301.
^ Altmann 2002.
^ ab Löfqvist 2010, pag. 359.
^ Munhall, Ostry y Flanagan 1991, pág. 299 y siguientes.
^ Löfqvist 2010, pag. 360.
^ Bizzi y col. 1992.
^ Löfqvist 2010, pag. 361.
^ Saltzman y Munhall 1989.
^ Mattingly 1990.
^ Löfqvist 2010, págs. 362–4.
^ Löfqvist 2010, pag. 364.
^ ab Gordon y Ladefoged 2001.
^ Gobl y Ní Chasaide 2010, pag. 399.
^ Gobl y Ní Chasaide 2010, pag. 400-401.
^ Gobl y Ní Chasaide 2010, pag. 401.
^ ab Dawson y Phelan 2016.
^ Gobl & Ní Chasaide 2010, págs. 388 y siguientes .
^ Ladefoged y Maddieson 1996, pág. 282.
^ Logia 2009, pag. 39.
^ Chomsky y Halle 1968.
^ Ladefoged y Maddieson 1996, pág. 289.
^ Ladefoged y Maddieson 1996, pág. 290.
^ Ladefoged y Maddieson 1996, pág. 292-295.
^ Logia 2009, pag. 40.
^ Ladefoged y Maddieson 1996, pág. 298.
^ abc Ladefoged y Johnson 2011, pág. 14.
^ Ladefoged y Johnson 2011, pág. 67.
^ Ladefoged y Maddieson 1996, pág. 145.
^ abc Ladefoged y Johnson 2011, pág. 15.
^ Ladefoged y Maddieson 1996, pág. 102.
^ Ladefoged y Maddieson 1996, pág. 182.
^ ab Ladefoged y Johnson 2011, pág. 175.
^ Ladefoged y Maddieson 1996, pág. 217.
^ Ladefoged y Maddieson 1996, pág. 218.
^ Ladefoged y Maddieson 1996, pág. 230-231.
^ Ladefoged y Johnson 2011, pág. 137.
^ Ladefoged y Maddieson 1996, pág. 78.
^ Ladefoged y Maddieson 1996, pág. 246-247.
^ ab Ladefoged 2001, pág. 1.
^ Eklund 2008, pag. 237.
^ Eklund 2008.
^ Seikel, Drumright y King 2016, pág. 176.
^ Seikel, Drumright y King 2016, pág. 171.
^ Seikel, Drumright y King 2016, págs. 168–77.
^ Johnson 2008, pag. 83–5.
^ Johnson 2008, pag. 104–5.
^ Johnson 2008, pag. 157.
^ Sedivy 2019, pag. 259–60.
^ Sedivy 2019, pag. 269.
^ Sedivy 2019, pag. 273.
^ Sedivy 2019, pag. 259.
^ Sedivy 2019, pag. 260.
^ Sedivy 2019, pag. 274–85.
^ Johnson 2003, pag. 46–7.
^ Johnson 2003, pag. 47.
^ Schacter, Gilbert y Wegner 2011, pág. 158–9.
^ Yost 2003, pag. 130.
^ Cutler 2005.
^ Sedivy 2019, pag. 289.
^ ab Galantucci, Fowler y Turvey 2006.
^ Sedivy 2019, pag. 292–3.
^ Patrón, Devlin y Lametti 2017.
^ ab Goldinger 1996.
^ Johnson 2003, pag. 1.
^ Johnson 2003, pag. 46-49.
^ Johnson 2003, pag. 53.
^ Ladefoged y Maddieson 1996, pág. 281.
^ Gussenhoven y Jacobs 2017, pag. 26-27.
^ Logia 2009, pag. 38.
^ ab O'Grady 2005, pág. 17.
^ Asociación Fonética Internacional 1999.
^ ab Ladefoged 2005.
^ Ladefoged y Maddieson 1996.
^ Panadero y col. 2016, pág. 242-244.
^ abc Baker y col. 2016, pág. 229-235.
^ Panadero y col. 2016, pág. 236.
^ Panadero y col. 2016, pág. 286.
^ Panadero y col. 2016, pág. 239.

Trabajos citados

Abercrombie, D. (1967). Elementos de Fonética General . Edimburgo: Chicago, Aldine Pub. Co.
Altmann, Gerry (2002). Psicolingüística: conceptos críticos en psicología . Londres: Routledge. ISBN 978-0415229906. OCLC 48014482.
Panadero, Ana; van den Bogaerde, Beppie; Pfau, Roland; Schermer, Trude (2016). La lingüística de las lenguas de signos . Ámsterdam/Filadelfia: John Benjamins Publishing Company. ISBN 978-90-272-1230-6.
Baumbach, EJ M (1987). Gramática analítica de Tsonga . Pretoria: Universidad de Sudáfrica.
Bizzi, E.; Hogan, N.; Mussa-Ivaldi, F.; Giszter, S. (1992). "¿Utiliza el sistema nervioso el control del punto de equilibrio para guiar los movimientos articulares únicos y múltiples?". Ciencias del comportamiento y del cerebro . 15 (4): 603–13. doi :10.1017/S0140525X00072538. PMID 23302290.
Bock, Kathryn; Nivel, Willem (2002). Atlmann, Gerry (ed.). Psicolingüística: conceptos críticos en psicología . vol. 5. Nueva York: Routledge. págs. 405–407. ISBN 978-0-415-26701-4.
Boersma, Paul (1998). Fonología funcional: formalización de las interacciones entre impulsos articulatorios y perceptivos . La Haya: Holland Academic Graphics. ISBN 9055690546. OCLC 40563066.
Caffrey, Cait (2017). "Fonética". Enciclopedia de prensa de Salem . Prensa de Salem.
Catford, JC (2001). Una introducción práctica a la fonética (2ª ed.). Prensa de la Universidad de Oxford. ISBN 978-0-19-924635-9.
Chomsky, Noam; Halle, Morris (1968). Patrón de sonido del inglés . Harper y Row.
Cutler, Ana (2005). "Estrés léxico" (PDF) . En Pisoni, David B.; Remez, Robert (eds.). El manual de percepción del habla . Blackwell. págs. 264–289. doi :10.1002/9780470757024.ch11. ISBN 978-0-631-22927-8. OCLC 749782145 . Consultado el 29 de diciembre de 2019 .
Dawson, esperanza; Phelan, Michael, eds. (2016). Archivos de idiomas: materiales para una introducción a la lingüística (12ª ed.). Prensa de la Universidad Estatal de Ohio. ISBN 978-0-8142-5270-3.
Dell, Gary; O'Seaghdha, Padraig (1992). "Etapas de acceso léxico en la producción del lenguaje". Cognición . 42 (1–3): 287–314. doi :10.1016/0010-0277(92)90046-k. PMID 1582160. S2CID 37962027.
Dell, Gary; Reich, Peter (1981). "Etapas en la producción de oraciones: un análisis de datos de errores del habla". Revista de Memoria y Lenguaje . 20 (6): 611–629. doi :10.1016/S0022-5371(81)90202-4.
Doke, Clemente M (1926). La fonética de la lengua zulú . Estudios bantúes. Johannesburgo: Wiwatersrand University Press.
Eklund, Robert (2008). "Fonación ingresiva pulmonar: características, distribución y función diacrónica y sincrónica en la producción de sonidos animales y humanos y en el habla humana". Revista de la Asociación Fonética Internacional . 38 (3): 235–324. doi :10.1017/S0025100308003563. S2CID 146616135.
Feldman, Anatol G. (1966). "Sintonización funcional del sistema nervioso con control del movimiento o mantenimiento de una postura estable, III: Análisis mecanográfico de la ejecución por el hombre de la tarea motora más simple". Biofísica . 11 : 565–578.
Fujimura, Osamu (1961). "Oclusiva bilabial y consonantes nasales: un estudio cinematográfico y sus implicaciones acústicas". Revista de investigación del habla y la audición . 4 (3): 233–47. doi :10.1044/jshr.0403.233. PMID 13702471.
Galantucci, Bruno; Fowler, Carol; Turvey, Michael (2006). "Revisión de la teoría motora de la percepción del habla". Boletín y revisión psiconómica . 13 (3): 361–377. doi :10.3758/BF03193857. PMC 2746041 . PMID 17048719.
Gleitman, Lila; enero, David; Nappa, Rebeca; Trueswell, John (2007). "Sobre el toma y daca entre la aprehensión de un evento y la formulación de un enunciado". Revista de Memoria y Lenguaje . 57 (4): 544–569. doi :10.1016/j.jml.2007.01.007. PMC 2151743 . PMID 18978929.
Gobl, Christer; Ní Chasaide, Ailbhe (2010). "Variación de la fuente de voz y sus funciones comunicativas". El manual de ciencias fonéticas (2ª ed.). págs. 378–424.
Goldinger, Stephen (1996). "Palabras y voces: huellas episódicas en la memoria de identificación y reconocimiento de palabras habladas". Revista de psicología experimental: aprendizaje, memoria y cognición . 22 (5): 1166–83. doi :10.1037/0278-7393.22.5.1166. PMID 8926483.
Gordon, Mateo; Ladefoged, Peter (2001). "Tipos de fonación: una descripción translingüística". Revista de Fonética . 29 (4): 383–406. doi :10.1006/jpho.2001.0147.
Guthrie, Malcolm (1948). La clasificación de las lenguas bantúes . Londres: Oxford University Press.
Gussenhoven, Carlos; Jacobs, Haike (2017). Comprensión de la fonología (Cuarta ed.). Londres y Nueva York: Routledge. ISBN 9781138961418. OCLC 958066102.
Salón, Tracy Alan (2001). "Introducción: Representaciones fonológicas e implementación fonética de rasgos distintivos". En Hall, Tracy Alan (ed.). Teoría del rasgo distintivo . de Gruyter. págs. 1–40.
Halle, Morris (1983). "Sobre los rasgos distintivos y su implementación articulatoria". Lenguaje natural y teoría lingüística . 1 (1): 91-105. doi :10.1007/BF00210377. S2CID 170466631.
Hardcastle, William; Laver, Juan; Gibbon, Fiona, eds. (2010). El manual de ciencias fonéticas (2ª ed.). Wiley-Blackwell. ISBN 978-1-405-14590-9.
Asociación Fonética Internacional (1999). Manual de la Asociación Fonética Internacional . Prensa de la Universidad de Cambridge.
Asociación Fonética Internacional (2015). Alfabeto Fonético Internacional . Asociación Fonética Internacional.
Jaeger, Florian; Furth, Katrina; Hilliard, Caitlin (2012). "La superposición fonológica afecta la selección léxica durante la producción de oraciones". Revista de psicología experimental: aprendizaje, memoria y cognición . 38 (5): 1439-1449. doi :10.1037/a0027862. PMID 22468803.
Jakobson, romano; Fant, Gunnar; Halle, Morris (1976). Preliminares del análisis del habla: las características distintivas y sus correlatos . Prensa del MIT. ISBN 978-0-262-60001-9.
Johnson, Keith (2003). Fonética acústica y auditiva (2ª ed.). Pub Blackwell. ISBN 1405101229. OCLC 50198698.
Johnson, Keith (2011). Fonética acústica y auditiva (3ª ed.). Wiley-Blackwell. ISBN 978-1-444-34308-3.
Jones, Daniel (1948). "La escuela de fonética de Londres". Zeitschrift für Phonetik . 11 (3/4): 127–135.(Reimpreso en Jones, WE; Laver, J., eds. (1973). Fonética en lingüística . Longman. págs. 180-186.)
Keating, Patricia; Lahiri, Aditi (1993). "Velares frontales, velares palatalizados y palatales". Fonética . 50 (2): 73-101. doi :10.1159/000261928. PMID 8316582. S2CID 3272781.
Kingston, John (2007). "La interfaz fonética-fonología". En DeLacy, Paul (ed.). El manual de fonología de Cambridge . Prensa de la Universidad de Cambridge. ISBN 978-0-521-84879-4.
Kiparsky, Paul (1993). "Lingística paniniana". En Asher, RE (ed.). Enciclopedia de Lenguas y Lingüística . Oxford: Pérgamo.
Ladefoged, Peter (1960). "El valor de las declaraciones fonéticas". Idioma . 36 (3): 387–96. doi :10.2307/410966. JSTOR 410966.
Ladefoged, Peter (2001). Un curso de fonética (4ª ed.). Boston: Thomson/Wadsworth . ISBN 978-1-413-00688-9.
Ladefoged, Peter (2005). Un curso de fonética (5ª ed.). Boston: Thomson/Wadsworth . ISBN 978-1-413-00688-9.
Ladefoged, Peter ; Johnson, Keith (2011). Un curso de fonética (6ª ed.). Wadsworth. ISBN 978-1-42823126-9.
Ladefoged, Peter; Maddieson, Ian (1996). Los sonidos de los idiomas del mundo . Oxford: Blackwell. ISBN 978-0-631-19815-4.
Nivel, Willem (1999). "Una teoría del acceso léxico en la producción del habla". Ciencias del comportamiento y del cerebro . 22 (1): 3–6. doi :10.1017/s0140525x99001776. hdl : 11858/00-001M-0000-0013-3E7A-A . PMID 11301520. S2CID 152230066.
Logia, Ken (2009). Una introducción crítica a la fonética . Nueva York: Continuum International Publishing Group. ISBN 978-0-8264-8873-2.
Löfqvist, Anders (2010). "Teorías y modelos de producción del habla". Manual de ciencias fonéticas (2ª ed.). págs. 353–78.
Maddieson, Ian (1993). "Investigando las articulaciones de Ewe con articulografía electromagnética". Forschungberichte des Intituts für Phonetik und Sprachliche Kommunikation der Universität München . 31 : 181–214.
Maddieson, Ian (2013). "Consonantes uvulares". En Secadora, Matthew S.; Haspelmath, Martín (eds.). El Atlas mundial de estructuras lingüísticas en línea . Leipzig: Instituto Max Planck de Antropología Evolutiva.
Mattingly, Ignacio (1990). "El carácter global de los gestos fonéticos". Revista de Fonética . 18 (3): 445–52. doi : 10.1016/S0095-4470(19)30372-9 .
Abigarrado, Michael; Camden, Carl; Baars, Bernard (1982). "Formulación encubierta y edición de anomalías en la producción del habla: evidencia de deslices lingüísticos provocados experimentalmente". Revista de aprendizaje verbal y comportamiento verbal . 21 (5): 578–594. doi :10.1016/S0022-5371(82)90791-5.
Munhall, K.; Ostry, D; Flanagan, J. (1991). "Coordinar espacios en la planificación del discurso". Revista de Fonética . 19 (3–4): 293–307. doi :10.1016/S0095-4470(19)30346-8.
O'Connor, JD (1973). Fonética . Pelícano. págs. 16-17. ISBN 978-0140215601.
O'Grady, William (2005). Lingüística contemporánea: una introducción (5ª ed.). Bedford/St. El de Martín. ISBN 978-0-312-41936-3.
Ohala, John (1997). "Aerodinámica de la fonología". Actas de la Conferencia Internacional de Lingüística de Seúl . 92 .
"Fonética, n." Diccionario de inglés Oxford en línea . Prensa de la Universidad de Oxford. 2018.
Roach, Peter (2015). "Entrenamiento Práctico de Fonética". Pedro Roach . Consultado el 10 de mayo de 2019 .
Saltzman, Elliot; Munhall, Kevin (1989). "Enfoque dinámico de los patrones gestuales en la producción del habla" (PDF) . Psicología Ecológica . 1 (4): 333–82. doi :10.1207/s15326969eco0104_2. Archivado desde el original (PDF) el 28 de octubre de 2020 . Consultado el 23 de agosto de 2018 .
Scatton, Ernest (1984). Una gramática de referencia del búlgaro moderno . Eslava. ISBN 978-0893571238.
Schacter, Daniel; Gilberto, Daniel; Wegner, Daniel (2011). "Sensación y percepción" . En Charles Linsmeiser (ed.). Psicología . Editores dignos. ISBN 978-1-4292-3719-2.
Schiller, Niels; Bles, Mart; Jansma, Bernadette (2003). "Seguimiento del curso temporal de la codificación fonológica en la producción del habla: un estudio del potencial cerebral relacionado con eventos". Investigación cognitiva del cerebro . 17 (3): 819–831. doi :10.1016/s0926-6410(03)00204-0. hdl : 11858/00-001M-0000-0013-17B1-A . PMID 14561465.
Sedivy, Julie (2019). Lenguaje en mente: una introducción a la psicolingüística (2ª ed.). Prensa de la Universidad de Oxford. ISBN 978-1605357058.
Seikel, J. Antonio; Drumright, David; Rey, Douglas (2016). Anatomía y fisiología del habla, el lenguaje y la audición (5ª ed.). Cengaje. ISBN 978-1-285-19824-8.
Patrón, Jeremy; Devlin, José; Lametti, Daniel (2017). "El oído que oye siempre se encuentra cerca de la lengua que habla: revisión del papel del sistema motor en la percepción del habla". Cerebro y lenguaje . 164 : 77-105. doi : 10.1016/j.bandl.2016.10.004 . PMID 27821280.
Stearns, Peter; Adas, Michael; Schwartz, Estuardo; Gilbert, Marc Jason (2001). Civilizaciones del mundo (3ª ed.). Nueva York: Longman. ISBN 978-0-321-04479-2.
Trask, RL (1996). Diccionario de fonética y fonología . Abingdon: Routledge. ISBN 978-0-415-11261-1.
Yost, William (2003). "Audición". En Alice F. Healy; Robert W. Proctor (eds.). Manual de Psicología: Psicología experimental . John Wiley e hijos. pag. 130.ISBN _ 978-0-471-39262-0.

enlaces externos

Wikisource tiene el texto del artículo " Fonética " de The New Student's Reference Work .

Medios relacionados con la fonética en Wikimedia Commons
Colección de recursos fonéticos de la Universidad de Carolina del Norte.
"Una pequeña enciclopedia de fonética" de Peter Roach .
Pink Trombone, un simulador de articulación interactivo de Neil Thapen.