stringtranslate.com

formante

Espectrograma de las vocales del inglés americano [i, u, ɑ] que muestra los formantes F 1 y F 2

En ciencias del habla y fonética , un formante es el máximo espectral amplio que resulta de una resonancia acústica del tracto vocal humano . [1] [2] En acústica , un formante generalmente se define como un pico amplio, o máximo local, en el espectro. [3] [4] Para los sonidos armónicos, con esta definición, la frecuencia del formante a veces se toma como la del armónico que se ve más aumentado por una resonancia. La diferencia entre estas dos definiciones reside en si los "formantes" caracterizan los mecanismos de producción de un sonido o el sonido producido en sí. En la práctica, la frecuencia de un pico espectral difiere ligeramente de la frecuencia de resonancia asociada, excepto cuando, por suerte, los armónicos están alineados con la frecuencia de resonancia, o cuando la fuente de sonido es en su mayor parte no armónica, como en los susurros y las frituras vocales .

Se puede decir que una habitación tiene formantes característicos de esa habitación en particular, debido a sus resonancias, es decir, a la forma en que el sonido se refleja en sus paredes y objetos. Los formantes de habitación de esta naturaleza se refuerzan a sí mismos enfatizando frecuencias específicas y absorbiendo otras, como lo explota, por ejemplo, Alvin Lucier en su pieza Estoy sentado en una habitación . En el procesamiento de señales digitales acústicas , la forma en que un conjunto de formantes (como una habitación) afecta una señal se puede representar mediante una respuesta de impulso .

Tanto en el discurso como en las salas, los formantes son rasgos característicos de las resonancias del espacio. Se dice que son excitados por fuentes acústicas como la voz, y dan forma (filtran) los sonidos de las fuentes, pero no son fuentes en sí mismas.

Historia

Desde un punto de vista acústico, la fonética tenía un serio problema con la idea de que la longitud efectiva del tracto vocal cambiaba las vocales. [5] De hecho, cuando cambia la longitud del tracto vocal, todos los resonadores acústicos formados por las cavidades bucales se escalan, al igual que sus frecuencias de resonancia. Por lo tanto, no estaba claro cómo las vocales podrían depender de las frecuencias cuando hablantes con diferentes longitudes de tracto vocal, por ejemplo, cantantes de bajo y soprano , pueden producir sonidos que se perciben como pertenecientes a la misma categoría fonética. Tenía que haber alguna manera de normalizar la información espectral que sustenta la identidad vocal. Hermann sugirió una solución a este problema en 1894, acuñando el término "formante". Una vocal, según él, es un fenómeno acústico especial, que depende de la producción intermitente de un rasgo parcial especial, o "formante", o "característico". La frecuencia del “formante” puede variar un poco sin alterar el carácter de la vocal. Para la “e larga” ( ee o iy ), por ejemplo, el “formante” de frecuencia más baja puede variar de 350 a 440 Hz incluso en la misma persona. [6]

Fonética

Los formantes son componentes de frecuencia distintivos de la señal acústica producida por el habla, los instrumentos musicales [8] o el canto . La información que los humanos necesitan para distinguir los sonidos del habla se puede representar de forma puramente cuantitativa especificando picos en el espectro de frecuencias. La mayoría de estos formantes se producen por resonancia de tubos y cámaras , pero algunos silbidos se derivan del colapso periódico de las zonas de baja presión del efecto Venturi . [9]

El formante con menor frecuencia se llama F 1 , el segundo F 2 , el tercero F 3 , y así sucesivamente. La frecuencia fundamental o tono de la voz a veces se denomina F 0 , pero no es un formante. En la mayoría de los casos, los dos primeros formantes, F 1 y F 2 , son suficientes para identificar la vocal. La relación entre la calidad vocal percibida y las dos primeras frecuencias formantes se puede apreciar escuchando "vocales artificiales" que se generan al pasar un tren de clics (para simular el tren de pulsos glotales) a través de un par de filtros de paso de banda (para simular el tracto vocal). resonancias). Las vocales anteriores tienen F 2 más alta , mientras que las vocales bajas tienen F 1 más alta . El redondeo de labios tiende a bajar F 1 y F 2 en las vocales posteriores y F 2 y F 3 en las vocales anteriores. [10]

Las consonantes nasales suelen tener un formante adicional alrededor de 2500 Hz. El líquido [l] suele tener un formante adicional a 1500 Hz, mientras que el sonido "r" inglés ( [ɹ] ) se distingue por un tercer formante muy bajo (muy por debajo de 2000 Hz).

Las oclusivas (y, hasta cierto punto, las fricativas ) modifican la ubicación de los formantes en las vocales circundantes. Los sonidos bilabiales (como /b/ y /p/ en "ball" o "sap") provocan una disminución de los formantes; en los espectrogramas, los sonidos velares ( /k/ y /ɡ/ en inglés) casi siempre muestran que F 2 y F 3 se juntan en un 'pellizco velar' antes de la velar y se separan del mismo 'pellizco' cuando se libera la velar; Los sonidos alveolares (en inglés /t/ y /d/ ) provocan menos cambios sistemáticos en los formantes de vocales vecinas, dependiendo en parte de exactamente qué vocal está presente. El curso temporal de estos cambios en las frecuencias de los formantes vocales se denomina "transiciones de formantes".

En el habla sonora normal, la vibración subyacente producida por las cuerdas vocales se asemeja a una onda en dientes de sierra , rica en matices armónicos . Si la frecuencia fundamental o (más a menudo) uno de los sobretonos es mayor que una frecuencia de resonancia del sistema, entonces la resonancia sólo se excitará débilmente y el formante normalmente impartido por esa resonancia se perderá en su mayor parte. Esto es más evidente en el caso de las cantantes de ópera soprano , que cantan en tonos lo suficientemente altos como para que sus vocales resulten muy difíciles de distinguir.

El control de las resonancias es un componente esencial de la técnica vocal conocida como canto de armónicos , en la que el intérprete canta un tono fundamental bajo y crea resonancias agudas para seleccionar los armónicos superiores , dando la impresión de que se cantan varios tonos a la vez.

Se pueden utilizar espectrogramas para visualizar formantes. En los espectrogramas, puede resultar difícil distinguir los formantes de los armónicos que ocurren naturalmente cuando uno canta. Sin embargo, se pueden escuchar los formantes naturales en forma de vocal mediante técnicas atonales como la fritura vocal .

Estimación de formantes

Los formantes, ya sean resonancias acústicas del tracto vocal o máximos locales en el espectro del habla, como filtros de paso de banda , se definen por su frecuencia y por su ancho espectral ( ancho de banda ).

Existen diferentes métodos para obtener esta información. Las frecuencias de los formantes, en su definición acústica, pueden estimarse a partir del espectro de frecuencias del sonido, utilizando un espectrograma (en la figura) o un analizador de espectro. Sin embargo, para estimar las resonancias acústicas del tracto vocal (es decir, la definición de formantes del habla) a partir de una grabación de voz, se puede utilizar codificación predictiva lineal . Un enfoque intermedio consiste en extraer la envolvente espectral neutralizando la frecuencia fundamental [11] y sólo entonces buscar máximos locales en la envolvente espectral.

Parcelas de formantes

Diagrama de formantes vocales promedio.

Los dos primeros formantes son importantes para determinar la calidad de las vocales y con frecuencia se dice que corresponden a las dimensiones abierta/cerrada (o baja/alta) y anterior/posterior (que tradicionalmente se han asociado con la forma y posición de la lengua ). . Así, el primer formante F 1 tiene una frecuencia más alta para una vocal abierta o baja como [a] y una frecuencia más baja para una vocal cerrada o alta como [i] o [u] ; y el segundo formante F 2 tiene una frecuencia más alta para una vocal anterior como [i] y una frecuencia más baja para una vocal posterior como [u] . [12] [13]

Las vocales casi siempre tendrán cuatro o más formantes distinguibles y, a veces, más de seis. Sin embargo, los dos primeros formantes son los más importantes para determinar la calidad de las vocales y, a menudo, se comparan entre sí en los diagramas de vocales, [14] aunque esta simplificación no logra captar algunos aspectos de la calidad de las vocales, como el redondeo. [15]

Muchos escritores han abordado el problema de encontrar una alineación óptima de las posiciones de las vocales en las gráficas de formantes con las del cuadrilátero vocal convencional. El trabajo pionero de Ladefoged [16] utilizó la escala Mel porque se afirmaba que esta escala correspondía más estrechamente a la escala auditiva de tono que a la medida acústica de la frecuencia fundamental expresada en Hertz. Dos alternativas a la escala Mel son la escala Bark y la escala de tasa ERB . [17] Otra estrategia ampliamente adoptada es trazar la diferencia entre F 1 y F 2 en lugar de F 2 en el eje horizontal. [ cita necesaria ]

formante del cantante

Los estudios del espectro de frecuencias de hablantes y cantantes clásicos entrenados , especialmente cantantes masculinos, indican un formante claro alrededor de 3000 Hz (entre 2800 y 3400 Hz) que está ausente en el habla o en los espectros de hablantes o cantantes no entrenados. Se cree que está asociado con una o más de las resonancias superiores del tracto vocal. [18] [19] Es este aumento de energía a 3000 Hz lo que permite que los cantantes sean escuchados y comprendidos en una orquesta . Este formante se desarrolla activamente mediante el entrenamiento vocal , por ejemplo mediante los llamados ejercicios de voce di strega o "voz de bruja" [20] y se debe a que una parte del tracto vocal actúa como resonador . [21] En música clásica y pedagogía vocal, este fenómeno también se conoce como squillo .

Ver también

Referencias

  1. ^ Titzé, IR (1994). Principios de producción de voz, Prentice Hall, ISBN  978-0-13-717893-3 .
  2. ^ Titze, IR, Baken, RJ Bozeman, KW, Granqvist, S. Henrich, N., Herbst, CT, Howard, DM, Hunter, EJ, Kaelin, D., Kent, RD, Löfqvist, A., McCoy, S ., Miller, DG, Noé, H., Scherer, RC, Smith, JR, Story, BH, Švec, JG, Ternström, S. y Wolfe, J. (2015) "Hacia un consenso sobre la notación simbólica de armónicos, resonancias , y formantes en la vocalización." J. acústico. Soc. America. 137, 3005–3007.
  3. ^ Jeans, JH (1938) Ciencia y música, reimpreso por Dover, 1968.
  4. ^ Secretaría de Normas, Sociedad Acústica de América, (1994). ANSI S1.1-1994 (R2004) Terminología acústica estándar nacional estadounidense, (12.41) Acoustical Society of America, Melville, NY.
  5. ^ Hermann, Ludimar (1894). Phonophotographische Untersuchungen [ Estudios fonofotográficos ] (en alemán) (5ª ed.).
  6. ^ McKendrick, JG (1903). Fonética experimental. En Informe anual de la junta de regentes de la institución Smithsonian correspondiente al año que finalizó el 30 de junio de 1902 (págs. 241-259). Institución Smithsonian.
  7. ^ Catford, JC (1988) Una introducción práctica a la fonética , Oxford University Press, p. 161. ISBN 978-0198242178 
  8. ^ Reuter, Christoph (2009): El papel de las posiciones de los formantes y las micromodulaciones en la combinación y el enmascaramiento parcial de instrumentos musicales. En: Revista de la Sociedad Estadounidense de Acústica (JASA), vol. 126,4, pág. 2237
  9. ^ Flanagan, James L. (1972). Análisis del habla, síntesis y percepción. doi :10.1007/978-3-662-01562-9. ISBN 978-3-662-01564-3.
  10. ^ Thomas, Erik R. (2011). Sociofonética: una introducción . Palgrave Macmillan. pag. 145.ISBN _ 978-0-230-22455-1.
  11. ^ Kawahara, Hideki; Masuda-Katsuse, Ikuyo; de Cheveigné, Alain (abril de 1999). "Reestructuración de las representaciones del habla utilizando un suavizado de tiempo-frecuencia adaptable al tono y una extracción F0 basada en frecuencia instantánea: posible papel de una estructura repetitiva en los sonidos". Comunicación del habla . 27 (3–4): 187–207. doi :10.1016/S0167-6393(98)00085-5.
  12. ^ Ladefoged, Peter (2006) Un curso de fonética (quinta edición) , Boston, MA: Thomson Wadsworth, p. 188. ISBN 1-4130-2079-8 
  13. ^ Ladefoged, Peter (2001) Vocales y consonantes: una introducción a los sonidos del lenguaje , Maldern, MA: Blackwell, p. 40. ISBN 0-631-21412-7 
  14. ^ Deterding, David (1997) 'Los formantes de las vocales monoptongo en la pronunciación estándar del inglés británico del sur', Revista de la Asociación Fonética Internacional , 27, págs.
  15. ^ Hayward, Katrina (2000) Fonética experimental , Harlow, Reino Unido: Pearson, p. 149. ISBN 0-582-29137-2 
  16. ^ Ladefoged, P. (1967). Tres áreas de la fonética experimental . Oxford. pag. 87.
  17. ^ Hayward, K. (2000). Fonética Experimental . Longman. ISBN 0-582-29137-2.
  18. ^ Sundberg, J. (1974). "Interpretación articulatoria del 'formante de canto'", Revista de la Sociedad Acústica de América , 55, 838–844.
  19. ^ Bele, Irene Velsvik (diciembre de 2006). "El formante del hablante". J. Voz . 20 (4): 555–578. doi :10.1016/j.jvoice.2005.07.001. PMID  16325374.
  20. ^ Frisell, Anthony (2007). Voz Barítono . Boston: Libros Branden. pag. 84.ISBN _ 978-0-8283-2181-5.
  21. ^ Sundberg, Johan (1987). La ciencia de la voz cantante . DeKalb, enfermo: Prensa de la Universidad del Norte de Illinois . ISBN 0-87580-542-6.

enlaces externos