stringtranslate.com

Fonética acustica

La fonética acústica es un subcampo de la fonética que se ocupa de los aspectos acústicos de los sonidos del habla . La fonética acústica investiga características en el dominio del tiempo, como la amplitud cuadrática media de una forma de onda , su duración, su frecuencia fundamental , o características en el dominio de la frecuencia, como el espectro de frecuencias , o incluso características espectrotemporales combinadas y la relación de estas propiedades con otras ramas de la fonética ( por ejemplo, fonética articulatoria o auditiva ), y a conceptos lingüísticos abstractos como fonemas , frases o enunciados.

El estudio de la fonética acústica mejoró enormemente a finales del siglo XIX con la invención del fonógrafo de Edison . El fonógrafo permitió grabar la señal del habla para luego procesarla y analizarla. Reproduciendo la misma señal de voz del fonógrafo varias veces, filtrándola cada vez con un filtro de paso de banda diferente , se podría construir un espectrograma de la expresión del habla. Una serie de artículos de Ludimar Hermann publicados en Pflügers Archiv en las dos últimas décadas del siglo XIX investigaron las propiedades espectrales de vocales y consonantes utilizando el fonógrafo de Edison, y fue en estos artículos donde se introdujo por primera vez el término formante . Hermann también reprodujo grabaciones de vocales realizadas con el fonógrafo de Edison a diferentes velocidades para distinguir entre las teorías de producción de vocales de Willis y Wheatstone .

Otros avances en la fonética acústica fueron posibles gracias al desarrollo de la industria telefónica . (Por cierto, el padre de Alexander Graham Bell , Alexander Melville Bell , era fonetista.) Durante la Segunda Guerra Mundial , el trabajo en los Laboratorios Bell Telephone (que inventaron el espectrógrafo ) facilitó en gran medida el estudio sistemático de las propiedades espectrales del habla periódica y aperiódica. sonidos, resonancias del tracto vocal y formantes vocálicos , calidad de la voz , prosodia , etc.

Los residuos de predicción lineal integrados (ILPR) fueron una característica eficaz propuesta por TV Ananthapadmanabha en 1995, que se aproxima mucho a la señal de la fuente de voz. [1] Esto demostró ser muy eficaz en la estimación precisa de las épocas o del instante de cierre glotal. [2] AG Ramakrishnan et al. mostró en 2015 que los coeficientes de transformada de coseno discretos del ILPR contienen información del hablante que complementa los coeficientes cepstrales de frecuencia mel. [3] El índice de explosión es otra característica escalar en el dominio del tiempo que fue introducida por TV Ananthapadmanabha et al. para caracterizar la transición cierre-estallido de consonantes oclusivas. [4]

A nivel teórico, la acústica del habla se puede modelar de forma análoga a los circuitos eléctricos . Lord Rayleigh fue uno de los primeros en reconocer que la nueva teoría eléctrica podía usarse en acústica, pero no fue hasta 1941 que el modelo de circuito se utilizó efectivamente, en un libro de Chiba y Kajiyama llamado "La vocal: su naturaleza y estructura". . (Este libro escrito por autores japoneses que trabajaban en Japón se publicó en inglés en el apogeo de la Segunda Guerra Mundial.) En 1952, Roman Jakobson , Gunnar Fant y Morris Halle escribieron "Preliminares para el análisis del habla", un trabajo fundamental que vincula la fonética acústica y la fonológica. teoría juntos. A este pequeño libro le siguió en 1960 la "Teoría acústica de la producción del habla" de Fant, que sigue siendo la principal base teórica para la investigación de la acústica del habla tanto en la academia como en la industria. (El propio Fant estaba muy involucrado en la industria telefónica). Otros creadores importantes del campo incluyen a Kenneth N. Stevens, quien escribió "Acoustic Phonetics", Osamu Fujimura y Peter Ladefoged .

Ver también

Bibliografía

Referencias

  1. ^ TV Ananthapadmanabha, "Factores acústicos que determinan la calidad de la voz percibida", en Fisiología de las cuerdas vocales: control de la calidad de la voz, O.Fujimura y M. Hirano, Eds. San Diego, Cal.: Grupo editorial Singualr, 1995, cap. 7, págs. 113-126.
  2. ^ AP Prathosh, TV Ananthapadmanabha y AG Ramakrishnan, "Extracción de época basada en predicción lineal integrada residual utilizando índice de explosión", IEEE Transactions on Audio, Speech, and Language Processing, 2013, vol. 21, edición. 12, págs. 2471-2480.
  3. ^ AG Ramakrishnan, B Abhiram y SR Mahadeva Prasanna, "Caracterización de la fuente de voz mediante transformada de coseno discreta sincrónica de tono para la identificación del hablante", Journal of the Acoustical Society of America Express Letters, vol. 137(), págs., 2015.
  4. ^ TV Ananthapadmanabha, AP Prathosh, AG Ramakrishnan, "Detección de las transiciones de cierre-estallido de paradas y africadas en habla continua utilizando el índice de explosión", Revista de la Sociedad Acústica de América, vol. 137, 2015.

enlaces externos