stringtranslate.com

Fonética acústica

La fonética acústica es un subcampo de la fonética que se ocupa de los aspectos acústicos de los sonidos del habla . La fonética acústica investiga las características del dominio del tiempo, como la amplitud cuadrática media de una forma de onda , su duración, su frecuencia fundamental o las características del dominio de la frecuencia, como el espectro de frecuencia , o incluso las características espectrotemporales combinadas y la relación de estas propiedades con otras ramas de la fonética (por ejemplo, la fonética articulatoria o auditiva ) y con conceptos lingüísticos abstractos como los fonemas , las frases o los enunciados.

El estudio de la fonética acústica mejoró enormemente a finales del siglo XIX con la invención del fonógrafo de Edison . El fonógrafo permitía grabar la señal de voz y luego procesarla y analizarla. Al reproducir la misma señal de voz del fonógrafo varias veces, filtrándola cada vez con un filtro de paso de banda diferente , se podía construir un espectrograma del enunciado del habla. Una serie de artículos de Ludimar Hermann publicados en Pflügers Archiv en las últimas dos décadas del siglo XIX investigaron las propiedades espectrales de las vocales y las consonantes utilizando el fonógrafo de Edison, y fue en estos artículos donde se introdujo por primera vez el término formante . Hermann también reprodujo grabaciones de vocales realizadas con el fonógrafo de Edison a diferentes velocidades para distinguir entre las teorías de producción de vocales de Willis y Wheatstone .

El desarrollo de la industria telefónica permitió avances adicionales en la fonética acústica (por cierto, el padre de Alexander Graham Bell , Alexander Melville Bell , era fonetista). Durante la Segunda Guerra Mundial , el trabajo en los Laboratorios Telefónicos Bell (que inventaron el espectrógrafo ) facilitó enormemente el estudio sistemático de las propiedades espectrales de los sonidos del habla periódicos y aperiódicos, las resonancias del tracto vocal y los formantes vocálicos , la calidad de la voz , la prosodia , etc.

Los residuos de predicción lineal integrados (ILPR) fueron una característica eficaz propuesta por TV Ananthapadmanabha en 1995, que se aproxima mucho a la señal de la fuente de voz. [1] Esto demostró ser muy eficaz en la estimación precisa de las épocas o el instante de cierre glótico. [2] AG Ramakrishnan et al. demostraron en 2015 que los coeficientes de transformada de coseno discretos del ILPR contienen información del hablante que complementa los coeficientes cepstrales de frecuencia mel. [3] El índice de plosión es otra característica escalar del dominio del tiempo que fue introducida por TV Ananthapadmanabha et al. para caracterizar la transición de cierre-ráfaga de consonantes oclusivas. [4]

En un nivel teórico, la acústica del habla puede modelarse de una manera análoga a los circuitos eléctricos . Lord Rayleigh fue uno de los primeros en reconocer que la nueva teoría eléctrica podía usarse en acústica, pero no fue hasta 1941 que el modelo de circuito se usó de manera efectiva, en un libro de Chiba y Kajiyama llamado "La vocal: su naturaleza y estructura". (Este libro de autores japoneses que trabajaban en Japón se publicó en inglés en el apogeo de la Segunda Guerra Mundial). En 1952, Roman Jakobson , Gunnar Fant y Morris Halle escribieron "Preliminaries to Speech Analysis", una obra seminal que unía la fonética acústica y la teoría fonológica. A este pequeño libro le siguió en 1960 "Acoustic Theory of Speech Production", de Fant, que ha seguido siendo la principal base teórica para la investigación acústica del habla tanto en la academia como en la industria. (El propio Fant estaba muy involucrado en la industria telefónica). Otros importantes creadores de este campo incluyen a Kenneth N. Stevens , que escribió "Fonética acústica", Osamu Fujimura y Peter Ladefoged .

Véase también

Bibliografía

Referencias

  1. ^ TV Ananthapadmanabha, "Factores acústicos que determinan la calidad percibida de la voz", en Fisiología de las cuerdas vocales - Control de calidad de la voz, O. Fujimura y M. Hirano, Eds. San Diego, Cal.: Singualr publishing group, 1995, cap. 7, págs. 113-126.
  2. ^ AP Prathosh, TV Ananthapadmanabha y AG Ramakrishnan, "Extracción de época basada en predicción lineal residual integrada utilizando índice de explosión", IEEE Transactions on Audio, Speech, and Language Processing, 2013, Vol. 21, Iss. 12, págs. 2471-2480.
  3. ^ AG Ramakrishnan, B Abhiram y SR Mahadeva Prasanna, "Caracterización de la fuente de voz utilizando la transformada de coseno discreta sincrónica de tono para la identificación del hablante", Journal of the Acoustical Society of America Express Letters, vol. 137(), págs., 2015.
  4. ^ TV Ananthapadmanabha, AP Prathosh, AG Ramakrishnan, "Detección de las transiciones de ráfaga de cierre de oclusivas y africadas en el habla continua utilizando el índice de plosión", Journal of the Acoustical Society of America, Vol. 137, 2015.

Enlaces externos