El término fonación tiene significados ligeramente diferentes según el subcampo de la fonética . Entre algunos fonetistas, la fonación es el proceso por el cual las cuerdas vocales producen ciertos sonidos a través de una vibración cuasi periódica . Esta es la definición utilizada entre quienes estudian la anatomía y la fisiología laríngea y la producción del habla en general. Los fonetistas de otros subcampos, como la fonética lingüística, llaman a este proceso sonorización , y usan el término fonación para referirse a cualquier estado oscilatorio de cualquier parte de la laringe que modifica la corriente de aire, de la cual la sonorización es solo un ejemplo. Las fonaciones sordas y supraglóticas se incluyen en esta definición.
El proceso fonatorio, o sonorización, ocurre cuando el aire es expulsado de los pulmones a través de la glotis , creando una caída de presión a través de la laringe. Cuando esta caída se vuelve lo suficientemente grande, las cuerdas vocales comienzan a oscilar. La caída de presión mínima requerida para lograr la fonación se llama presión umbral de fonación (PTP), [1] [2] y para los humanos con cuerdas vocales normales, es de aproximadamente 2-3 cm H 2 O. El movimiento de las cuerdas vocales durante la oscilación es principalmente lateral, aunque también hay un componente superior. Sin embargo, casi no hay movimiento a lo largo de la longitud de las cuerdas vocales. La oscilación de las cuerdas vocales sirve para modular la presión y el flujo del aire a través de la laringe, y este flujo de aire modulado es el componente principal del sonido de la mayoría de los fonemas sonoros .
El sonido que produce la laringe es una serie armónica . En otras palabras, consta de un tono fundamental (llamado frecuencia fundamental, la principal señal acústica para el tono percibido ) acompañado de sobretonos armónicos, que son múltiplos de la frecuencia fundamental. [3] Según la teoría de la fuente-filtro , el sonido resultante excita la cámara de resonancia que es el tracto vocal para producir los sonidos del habla individuales.
Las cuerdas vocales no oscilarán si no están lo suficientemente cerca una de otra, no están bajo suficiente tensión o bajo demasiada tensión, o si la caída de presión a través de la laringe no es suficientemente grande. [4] En lingüística, un fono se llama sordo si no hay fonación durante su ocurrencia. [5] En el habla, los fonos sordos se asocian con cuerdas vocales que son alargadas, muy tensas y colocadas lateralmente (abducidas) en comparación con las cuerdas vocales durante la fonación. [6]
La frecuencia fundamental, la principal señal acústica para el tono percibido , se puede variar a través de una variedad de medios. Los cambios a gran escala se logran aumentando la tensión en las cuerdas vocales a través de la contracción del músculo cricotiroideo . Los cambios más pequeños en la tensión se pueden efectuar mediante la contracción del músculo tiroaritenoideo o cambios en la posición relativa de los cartílagos tiroides y cricoides , como puede ocurrir cuando se baja o se levanta la laringe, ya sea voluntariamente o mediante el movimiento de la lengua a la que está unida la laringe a través del hueso hioides. [6] Además de los cambios de tensión, la frecuencia fundamental también se ve afectada por la caída de presión a través de la laringe, que se ve afectada principalmente por la presión en los pulmones, y también variará con la distancia entre las cuerdas vocales. La variación en la frecuencia fundamental se utiliza lingüísticamente para producir entonación y tono .
Actualmente existen dos teorías principales sobre cómo se inicia la vibración de las cuerdas vocales : la teoría mioelástica y la teoría aerodinámica . [7] Estas dos teorías no están en disputa entre sí y es muy posible que ambas teorías sean verdaderas y operen simultáneamente para iniciar y mantener la vibración. Una tercera teoría, la teoría neurocronáxica , estuvo muy de moda en la década de 1950, pero desde entonces ha sido en gran parte desacreditada.
La teoría mioelástica afirma que cuando las cuerdas vocales se juntan y se les aplica presión respiratoria, permanecen cerradas hasta que la presión que hay debajo de ellas, la presión subglótica, es suficiente para separarlas, lo que permite que escape el aire y reduce la presión lo suficiente como para que la tensión muscular vuelva a juntar los pliegues. La presión se acumula una vez más hasta que las cuerdas se separan y el ciclo completo se repite una y otra vez. La velocidad a la que las cuerdas se abren y se cierran, el número de ciclos por segundo, determina el tono de la fonación. [8]
La teoría aerodinámica se basa en la ley de energía de Bernoulli en fluidos . La teoría establece que cuando una corriente de aire fluye a través de la glotis mientras los cartílagos aritenoides se mantienen unidos (por la acción de los músculos interaritenoideos), se crea un efecto de empuje-tracción en los tejidos de las cuerdas vocales que mantiene una oscilación autosostenida. El empuje se produce durante la apertura glótica, cuando la glotis es convergente, y el tirón se produce durante el cierre glótico, cuando la glotis es divergente. [1] Tal efecto provoca una transferencia de energía desde el flujo de aire a los tejidos de las cuerdas vocales que supera las pérdidas por disipación y sostiene la oscilación. [2] La cantidad de presión pulmonar necesaria para comenzar la fonación está definida por Titze como la presión umbral de oscilación. [1] Durante el cierre glótico, el flujo de aire se corta hasta que la presión de la respiración separa los pliegues y el flujo comienza de nuevo, lo que hace que los ciclos se repitan. [8] El libro de texto titulado Teoría aerodinámica mioelástica de la fonación [7] de Ingo Titze atribuye a Janwillem van den Berg la creación de la teoría y proporciona un desarrollo matemático detallado de la misma.
Esta teoría afirma que la frecuencia de la vibración de las cuerdas vocales está determinada por la cronaxia del nervio recurrente y no por la presión de la respiración o la tensión muscular. Los defensores de esta teoría pensaban que cada vibración de las cuerdas vocales se debía a un impulso de los nervios laríngeos recurrentes y que el centro acústico del cerebro regulaba la velocidad de la vibración de las cuerdas vocales. [8] Los científicos del habla y la voz abandonaron esta teoría hace tiempo, ya que se ha demostrado que los músculos no pueden contraerse lo suficientemente rápido para lograr la vibración. Además, las personas con cuerdas vocales paralizadas pueden producir fonación, lo que no sería posible según esta teoría. La fonación que se produce en laringes extirpadas tampoco sería posible según esta teoría.
En los tratamientos fonéticos lingüísticos de la fonación, como los de Peter Ladefoged , se consideraba que la fonación era una cuestión de puntos en un continuo de tensión y cierre de las cuerdas vocales. En ocasiones se describían mecanismos más intrincados, pero eran difíciles de investigar y, hasta hace poco, el estado de la glotis y la fonación se consideraban casi sinónimos. [9] [ página necesaria ]
Si las cuerdas vocales están completamente relajadas, con los cartílagos aritenoides separados para un flujo de aire máximo, las cuerdas no vibran. Esta es la fonación sorda , y es extremadamente común con las obstruyentes . Si los aritenoides se presionan juntos para el cierre glótico , las cuerdas vocales bloquean el flujo de aire, produciendo sonidos oclusivos como la oclusión glótica . En el medio hay un punto dulce de máxima vibración. También se ha demostrado la existencia de una forma glótica óptima para facilitar la fonación, en la que la presión pulmonar requerida para iniciar la vibración de las cuerdas vocales es mínima. [4] Esta es la voz modal , y es el estado normal para las vocales y sonorantes en todos los idiomas del mundo. Sin embargo, la apertura de los cartílagos aritenoides, y por lo tanto la tensión en las cuerdas vocales, es una de grado entre los puntos finales de abierto y cerrado, y hay varias situaciones intermedias utilizadas por varios idiomas para producir sonidos contrastantes. [9] [ página necesaria ]
Por ejemplo, el gujarati tiene vocales con una fonación parcialmente laxa llamada voz entrecortada o voz murmurada (transcrita en el AFI con una diéresis en subíndice ◌̤ ), mientras que el birmano tiene vocales con una fonación parcialmente tensa llamada voz chirriante o voz laringealizada (transcrita en el AFI con una tilde en subíndice ◌̰ ). El dialecto jalapa del mazateco es inusual al contrastar ambas con la voz modal en una distinción de tres vías. (El mazateco es una lengua tonal, por lo que la glotis hace varias distinciones tonales simultáneamente con las distinciones de fonación). [9] [ página necesaria ]
El javanés no tiene voz modal en sus oclusivas , pero contrasta con otros dos puntos a lo largo de la escala de fonación, con desviaciones más moderadas de la voz modal, llamadas voz floja y voz rígida . Las consonantes "turbias" en shanghainés son voz floja; contrastan con las consonantes tenuis y aspiradas. [9] [ página necesaria ]
Aunque cada lengua puede ser algo diferente, es conveniente clasificar estos grados de fonación en categorías discretas. Una serie de siete oclusivas alveolares, con fonaciones que van desde una glotis abierta/laxa hasta una glotis cerrada/tensa, son:
Los diacríticos del IPA under-ring y subscript wedge , comúnmente llamados "sordos" y "sonoros", a veces se añaden al símbolo de un sonido sonoro para indicar estados más laxos/abiertos (flojos) y tensos/cerrados (rígidos) de la glotis, respectivamente. (Irónicamente, añadir el diacrítico "sonoro" al símbolo de una consonante sonora indica una sonorización menos modal, no más, porque un sonido sonoro modal ya está completamente sonoro, en su punto óptimo, y cualquier tensión adicional en las cuerdas vocales amortigua su vibración.) [9] [ página necesaria ]
El alsaciano , como varias lenguas germánicas, tiene una fonación tipológicamente inusual en sus oclusivas. Las consonantes transcritas /b̥/, /d̥/, /ɡ̊/ (ambiguamente llamadas "lenis") son parcialmente sonoras: las cuerdas vocales están posicionadas como para sonorizar, pero en realidad no vibran. Es decir, técnicamente son sordas, pero sin la glotis abierta que suele asociarse con las oclusivas sordas. Contrastan tanto con las sonoras modalizadas /b, d, ɡ/ como con las sordas modalizadas /p, t, k/ en los préstamos franceses, así como con la palabra aspirada /kʰ/ inicialmente. [9] [ página necesaria ]
Si los cartílagos aritenoides se separan para permitir el paso de un flujo de aire turbulento, el resultado es una fonación susurrante si las cuerdas vocales están aducidas, y una fonación de voz susurrante (murmullo) si las cuerdas vocales vibran modalmente. La fonación susurrante se escucha en muchas producciones del francés oui!, y las vocales "sordas" de muchos idiomas norteamericanos en realidad se susurran. [10]
Desde hace tiempo se ha observado que en muchas lenguas, tanto fonológica como históricamente, las consonantes glotales [ʔ, ɦ, h] no se comportan como otras consonantes. Fonéticamente, no tienen otra manera o lugar de articulación que el estado de la glotis: cierre glotal para [ʔ] , voz entrecortada para [ɦ] y corriente de aire abierta para [h] . Algunos fonetistas han descrito estos sonidos como no glotales ni consonánticos, sino como ejemplos de fonación pura, al menos en muchas lenguas europeas. Sin embargo, en las lenguas semíticas parecen ser consonantes glotales verdaderas. [9] [ página necesaria ]
En las últimas décadas se ha hecho evidente que la fonación puede involucrar a toda la laringe, con hasta seis válvulas y músculos que trabajan de forma independiente o en conjunto. Desde la glotis hacia arriba, estas articulaciones son: [11]
Hasta el desarrollo de la laringoscopia de fibra óptica , no se podía observar la participación completa de la laringe durante la producción del habla, y las interacciones entre los seis articuladores laríngeos aún no se comprenden bien. Sin embargo, al menos dos fonaciones supraglóticas parecen estar muy extendidas en los idiomas del mundo. Se trata de la voz áspera (voz "ventricular" o "apretada"), que implica una constricción general de la laringe, y la voz faucalizada (voz "hueca" o "bostezante"), que implica una expansión general de la laringe. [11]
El dialecto bor de los dinka tiene una voz modal contrastiva, entrecortada, faucalizada y áspera en sus vocales, así como tres tonos. Los diacríticos ad hoc empleados en la literatura son una comilla doble subíndice para la voz faucalizada, [a͈] , y el subrayado para la voz áspera, [a̠] . [11] Algunos ejemplos son:
Otros idiomas con estos contrastes son el Bai (voz modal, entrecortada y áspera), el Kabiye (voz áspera y entrecortada, antes vista como ±ATR ) y el Somalí (voz entrecortada y áspera). [11]
Los elementos de la articulación o fonación laríngea pueden aparecer ampliamente en las lenguas del mundo como detalles fonéticos incluso cuando no son fonémicamente contrastivos. Por ejemplo, se ha observado actividad simultánea glótica, ventricular y aritenoidea (para algo distinto de las consonantes epiglóticas ) en tibetano , coreano , nuuchahnulth , nlaka'pamux , tailandés , sui , amis , pame , árabe , tigriña , cantonés y yi . [11]
En idiomas como el francés y el portugués , todas las obstruyentes aparecen en pares, una sonora modal y otra sorda: [b] [d] [g] [v] [z] [ʒ] → [p] [t] [k] [f] [s] [ʃ].
En inglés , cada fricativa sonora corresponde a una sorda. Sin embargo, para los pares de oclusivas inglesas , la distinción se especifica mejor como tiempo de inicio de la voz en lugar de simplemente voz: en posición inicial, /bdg/ son solo parcialmente sonoras (la sonorización comienza durante la retención de la consonante), y /ptk/ son aspiradas (la sonorización comienza solo mucho después de su liberación). Ciertos morfemas ingleses tienen alomorfos sonoros y sordos , como: las terminaciones plurales, verbales y posesivas escritas -s (sonoras en kids /kɪdz/ pero sordas en kits /kɪts/ ), y la terminación de tiempo pasado escrita -ed (sonora en buzzed /bʌzd/ pero sorda en fished /fɪʃt/ ).
Algunas lenguas europeas, como el finés , no tienen obstruyentes sonoras , sino pares de consonantes largas y cortas. Fuera de Europa, la falta de distinción sonora es común; de hecho, en las lenguas australianas es casi universal.
En fonología , un registro es una combinación de tono y fonación vocálica en un único parámetro fonológico. Por ejemplo, entre sus vocales, el birmano combina la voz modal con el tono bajo, la voz entrecortada con el tono descendente, la voz chirriante con el tono alto y el cierre glótico con el tono alto. Estos cuatro registros contrastan entre sí, pero no se encuentra ninguna otra combinación de fonación (modal, entrecortada, entrecortada, cerrada) y tono (alto, bajo, descendente).
Entre los pedagogos vocales y los patólogos del habla, un registro vocal también se refiere a una fonación particular limitada a un rango particular de tono , que posee una calidad de sonido característica. [12] El término "registro" puede usarse para varios aspectos distintos de la voz humana: [8]
En la patología del habla se identifican cuatro combinaciones de estos elementos: el registro vocal de fritura , el registro modal , el registro de falsete y el registro de silbido .