stringtranslate.com

Formante

Espectrograma de las vocales del inglés americano [i, u, ɑ] que muestra los formantes F 1 y F 2

En la ciencia del habla y la fonética , un formante es el máximo espectral amplio que resulta de una resonancia acústica del tracto vocal humano . [1] [2] En acústica , un formante suele definirse como un pico amplio, o máximo local, en el espectro. [3] [4] Para los sonidos armónicos, con esta definición, la frecuencia del formante a veces se toma como la del armónico que es más aumentado por una resonancia. La diferencia entre estas dos definiciones reside en si los "formantes" caracterizan los mecanismos de producción de un sonido o el sonido producido en sí. En la práctica, la frecuencia de un pico espectral difiere ligeramente de la frecuencia de resonancia asociada, excepto cuando, por suerte, los armónicos están alineados con la frecuencia de resonancia, o cuando la fuente de sonido es mayoritariamente no armónica, como en los susurros y los crujidos vocales .

Se puede decir que una habitación tiene formantes característicos de esa habitación en particular, debido a sus resonancias, es decir, a la forma en que el sonido se refleja en sus paredes y objetos. Los formantes de habitación de esta naturaleza se refuerzan a sí mismos enfatizando frecuencias específicas y absorbiendo otras, como lo explota, por ejemplo, Alvin Lucier en su pieza I Am Sitting in a Room . En el procesamiento digital de señales acústicas , la forma en que una colección de formantes (como una habitación) afecta a una señal se puede representar mediante una respuesta al impulso .

Tanto en el habla como en las salas, los formantes son rasgos característicos de las resonancias del espacio. Se dice que son excitados por fuentes acústicas como la voz y dan forma (filtran) a los sonidos de las fuentes, pero no son fuentes en sí mismas.

Historia

Desde un punto de vista acústico, la fonética tenía un serio problema con la idea de que la longitud efectiva del tracto vocal cambiaba las vocales. [5] De hecho, cuando cambia la longitud del tracto vocal, todos los resonadores acústicos formados por las cavidades bucales se escalan, y también lo hacen sus frecuencias de resonancia. Por lo tanto, no estaba claro cómo las vocales podían depender de las frecuencias cuando hablantes con diferentes longitudes de tracto vocal, por ejemplo cantantes bajos y sopranos , pueden producir sonidos que se perciben como pertenecientes a la misma categoría fonética. Tenía que haber alguna manera de normalizar la información espectral que sustentaba la identidad vocálica. Hermann sugirió una solución a este problema en 1894, acuñando el término "formante". Una vocal, según él, es un fenómeno acústico especial, que depende de la producción intermitente de un rasgo parcial especial, o "formante", o "característico". La frecuencia del "formante" puede variar un poco sin alterar el carácter de la vocal. Por ejemplo, en el caso de la “e larga” ( ee o iy ), el “formante” de frecuencia más baja puede variar de 350 a 440 Hz incluso en la misma persona. [6]

Fonética

Los formantes son componentes de frecuencia distintivos de la señal acústica producida por el habla, los instrumentos musicales [8] o el canto . La información que los humanos necesitan para distinguir entre los sonidos del habla se puede representar de forma puramente cuantitativa especificando picos en el espectro de frecuencia. La mayoría de estos formantes se producen por resonancia de tubos y cámaras , pero algunos tonos de silbido se derivan del colapso periódico de las zonas de baja presión del efecto Venturi . [9]

El formante con la frecuencia más baja se llama F 1 , el segundo F 2 , el tercero F 3 , y así sucesivamente. La frecuencia fundamental o tono de la voz a veces se denomina F 0 , pero no es un formante. La mayoría de las veces, los dos primeros formantes, F 1 y F 2 , son suficientes para identificar la vocal. La relación entre la calidad de la vocal percibida y las dos primeras frecuencias del formante se puede apreciar escuchando "vocales artificiales" que se generan al pasar un tren de clics (para simular el tren de pulsos glóticos) a través de un par de filtros de paso de banda (para simular resonancias del tracto vocal). Las vocales anteriores tienen un F 2 más alto , mientras que las vocales bajas tienen un F 1 más alto . El redondeo de los labios tiende a bajar F 1 y F 2 en las vocales posteriores y F 2 y F 3 en las vocales anteriores. [10]

Las consonantes nasales suelen tener un formante adicional alrededor de los 2500 Hz. La [l] líquida suele tener un formante extra a 1500 Hz, mientras que el sonido "r" inglés ( [ɹ] ) se distingue por un formante de tercera muy bajo (muy por debajo de los 2000 Hz).

Las oclusivas (y, en cierta medida, las fricativas ) modifican la colocación de los formantes en las vocales circundantes. Los sonidos bilabiales (como /b/ y /p/ en "ball" o "sap") causan una disminución de la frecuencia de los formantes; en los espectrogramas, los sonidos velares ( /k/ y /ɡ/ en inglés) casi siempre muestran que F 2 y F 3 se juntan en un "pinzamiento velar" antes del velar y se separan del mismo "pinzamiento" cuando se libera el velar; los sonidos alveolares ( /t/ y /d/ en inglés ) causan menos cambios sistemáticos en los formantes vocálicos vecinos, dependiendo parcialmente de qué vocal esté presente exactamente. La evolución temporal de estos cambios en las frecuencias de los formantes vocálicos se conoce como "transiciones de formantes".

En el habla sonora normal, la vibración subyacente producida por las cuerdas vocales se asemeja a una onda de dientes de sierra , rica en armónicos . Si la frecuencia fundamental o (más a menudo) uno de los armónicos es más alta que una frecuencia de resonancia del sistema, entonces la resonancia será excitada sólo débilmente y el formante que normalmente imparte esa resonancia se perderá en su mayor parte. Esto es más evidente en el caso de las cantantes de ópera soprano , que cantan en tonos lo suficientemente altos como para que sus vocales se vuelvan muy difíciles de distinguir.

El control de las resonancias es un componente esencial de la técnica vocal conocida como canto de armónicos , en la que el intérprete canta un tono fundamental bajo y crea resonancias agudas para seleccionar armónicos superiores , dando la impresión de que se cantan varios tonos a la vez.

Los espectrogramas se pueden utilizar para visualizar los formantes. En los espectrogramas, puede resultar difícil distinguir los formantes de los armónicos que se producen de forma natural cuando se canta. Sin embargo, se pueden escuchar los formantes naturales en forma de vocal mediante técnicas atonales como el vocal fry .

Estimación de formantes

Los formantes, ya sea que se consideren resonancias acústicas del tracto vocal o máximos locales en el espectro del habla, como los filtros de paso de banda , se definen por su frecuencia y por su ancho espectral ( ancho de banda ).

Existen diferentes métodos para obtener esta información. Las frecuencias de los formantes, en su definición acústica, pueden estimarse a partir del espectro de frecuencias del sonido, utilizando un espectrograma (en la figura) o un analizador de espectro. Sin embargo, para estimar las resonancias acústicas del tracto vocal (es decir, la definición de formantes del habla) a partir de una grabación de voz, se puede utilizar la codificación predictiva lineal . Un enfoque intermedio consiste en extraer la envolvente espectral neutralizando la frecuencia fundamental [11] y, solo entonces, buscar máximos locales en la envolvente espectral.

Gráficas de formantes

Diagrama de formantes vocálicos promedio

Los dos primeros formantes son importantes para determinar la calidad de las vocales, y se dice con frecuencia que corresponden a las dimensiones abierta/cerrada (o baja/alta) y anterior/posterior (que tradicionalmente se han asociado con la forma y la posición de la lengua ). Así, el primer formante F 1 tiene una frecuencia más alta para una vocal abierta o baja como [a] y una frecuencia más baja para una vocal cerrada o alta como [i] o [u] ; y el segundo formante F 2 tiene una frecuencia más alta para una vocal anterior como [i] y una frecuencia más baja para una vocal posterior como [u] . [12] [13]

Las vocales casi siempre tienen cuatro o más formantes distinguibles, y a veces más de seis. Sin embargo, los dos primeros formantes son los más importantes para determinar la calidad vocálica y a menudo se representan gráficamente uno contra el otro en los diagramas vocálicos, [14] aunque esta simplificación no logra captar algunos aspectos de la calidad vocálica, como el redondeo. [15]

Muchos autores han abordado el problema de encontrar una alineación óptima de las posiciones de las vocales en los gráficos de formantes con las del cuadrilátero vocálico convencional. El trabajo pionero de Ladefoged [16] utilizó la escala Mel porque se afirmaba que esta escala se correspondía más estrechamente con la escala auditiva del tono que con la medida acústica de la frecuencia fundamental expresada en hercios. Dos alternativas a la escala Mel son la escala Bark y la escala de frecuencia ERB . [17] Otra estrategia ampliamente adoptada es trazar la diferencia entre F 1 y F 2 en lugar de F 2 en el eje horizontal. [ cita requerida ]

Formante del cantante

Los estudios del espectro de frecuencia de hablantes entrenados y cantantes clásicos , especialmente cantantes masculinos, indican un formante claro alrededor de 3000 Hz (entre 2800 y 3400 Hz) que está ausente en el habla o en los espectros de hablantes o cantantes no entrenados. Se cree que está asociado con una o más de las resonancias más altas del tracto vocal. [18] [19] Es este aumento de energía a 3000 Hz lo que permite que los cantantes sean escuchados y entendidos por encima de una orquesta . Este formante se desarrolla activamente a través del entrenamiento vocal , por ejemplo a través de los llamados ejercicios de voce di strega o "voz de bruja" [20] y es causado por una parte del tracto vocal que actúa como resonador . [21] En la música clásica y la pedagogía vocal, este fenómeno también se conoce como squillo .

Véase también

Referencias

  1. ^ Titze, IR (1994). Principios de producción de voz, Prentice Hall, ISBN  978-0-13-717893-3 .
  2. ^ Titze, IR, Baken, RJ Bozeman, KW, Granqvist, S. Henrich, N., Herbst, CT, Howard, DM, Hunter, EJ, Kaelin, D., Kent, RD, Löfqvist, A., McCoy, S ., Miller, DG, Noé, H., Scherer, RC, Smith, JR, Story, BH, Švec, JG, Ternström, S. y Wolfe, J. (2015) "Hacia un consenso sobre la notación simbólica de armónicos, resonancias , y formantes en la vocalización." J. acústico. Soc. América. 137, 3005–3007.
  3. ^ Jeans, JH (1938) Ciencia y música, reimpreso por Dover, 1968.
  4. ^ Secretaría de Normas, Sociedad Acústica de América, (1994). ANSI S1.1-1994 (R2004) Terminología acústica estándar nacional estadounidense, (12.41) Sociedad Acústica de América, Melville, NY.
  5. ^ Hermann, Ludimar (1894). Phonophotographische Untersuchungen [ Estudios fonofotográficos ] (en alemán) (5ª ed.).
  6. ^ McKendrick, JG (1903). Fonética experimental. En Informe anual de la junta de regentes de la institución Smithsonian para el año que finalizó el 30 de junio de 1902 (págs. 241-259). Institución Smithsonian.
  7. ^ Catford, JC (1988) Una introducción práctica a la fonética , Oxford University Press, pág. 161. ISBN 978-0198242178 
  8. ^ Reuter, Christoph (2009): El papel de las posiciones de los formantes y las micromodulaciones en la mezcla y el enmascaramiento parcial de instrumentos musicales. En: Journal of the Acoustical Society of America (JASA), vol. 126,4, p. 2237
  9. ^ Flanagan, James L. (1972). Análisis del habla, síntesis y percepción. doi :10.1007/978-3-662-01562-9. ISBN 978-3-662-01564-3.
  10. ^ Thomas, Erik R. (2011). Sociofonética: una introducción . Palgrave Macmillan. pág. 145. ISBN. 978-0-230-22455-1.
  11. ^ Kawahara, Hideki; Masuda-Katsuse, Ikuyo; de Cheveigné, Alain (abril de 1999). "Reestructuración de representaciones del habla mediante un suavizado de frecuencia-tiempo adaptativo al tono y una extracción de F0 basada en frecuencia instantánea: posible papel de una estructura repetitiva en los sonidos". Speech Communication . 27 (3–4): 187–207. doi :10.1016/S0167-6393(98)00085-5.
  12. ^ Ladefoged, Peter (2006) Un curso de fonética (quinta edición) , Boston, MA: Thomson Wadsworth, pág. 188. ISBN 1-4130-2079-8 
  13. ^ Ladefoged, Peter (2001) Vocales y consonantes: una introducción a los sonidos del lenguaje , Maldern, MA: Blackwell, pág. 40. ISBN 0-631-21412-7 
  14. ^ Deterding, David (1997) 'Los formantes de vocales monoftongas en la pronunciación estándar del inglés británico del sur', Journal of the International Phonetic Association , 27, págs. 47-55.
  15. ^ Hayward, Katrina (2000) Fonética experimental , Harlow, Reino Unido: Pearson, pág. 149. ISBN 0-582-29137-2 
  16. ^ Ladefoged, P. (1967). Tres áreas de fonética experimental . Oxford. pág. 87.
  17. ^ Hayward, K. (2000). Fonética experimental . Longman. ISBN 0-582-29137-2.
  18. ^ Sundberg, J. (1974). "Interpretación articulatoria del 'formante cantado'", Journal of the Acoustical Society of America , 55, 838–844.
  19. ^ Bele, Irene Velsvik (diciembre de 2006). "El formante del hablante". J. Voice . 20 (4): 555–578. doi :10.1016/j.jvoice.2005.07.001. PMID  16325374.
  20. ^ Frisell, Anthony (2007). Voz de barítono . Boston: Branden Books. pág. 84. ISBN 978-0-8283-2181-5.
  21. ^ Sundberg, Johan (1987). La ciencia de la voz cantada . DeKalb, Ill: Northern Illinois University Press . ISBN 0-87580-542-6.

Enlaces externos