stringtranslate.com

Kenneth N. Stevens

Kenneth Noble Stevens (24 de marzo de 1924 [1] - 19 de agosto de 2013) fue profesor de ingeniería eléctrica y ciencias de la computación de la cátedra Clarence J. LeBel y profesor de ciencias de la salud y tecnología en el laboratorio de investigación de electrónica del MIT . Stevens fue jefe del grupo de comunicación del habla [2] en el laboratorio de investigación de electrónica (RLE) del MIT y fue uno de los científicos líderes a nivel mundial en fonética acústica .

Recibió la Medalla Nacional de Ciencias del presidente Bill Clinton en 1999 y el Premio IEEE James L. Flanagan de procesamiento de voz y audio en 2004.

Murió en 2013 por complicaciones de la enfermedad de Alzheimer . [3]

Educación

Educación temprana

Ken Stevens nació en Toronto el 23 de marzo de 1924. [4] Su hermano mayor, Pete, nació en Inglaterra; Ken nació cuatro años después, poco después de que la familia emigrara a Canadá. Su ambición de niño era convertirse en médico, porque admiraba a un tío que era médico. [5] Asistió a la escuela secundaria en una escuela adjunta al departamento de educación de la Universidad de Toronto .

Stevens asistió a la facultad de ingeniería de la Universidad de Toronto con una beca completa. Vivió en casa durante sus años de estudiante. Aunque Stevens no pudo luchar en la Segunda Guerra Mundial debido a su discapacidad visual, su hermano estuvo fuera durante toda la guerra; sus padres sintonizaban todas las noches la BBC para recibir actualizaciones. [5] Stevens se especializó en ingeniería física en la universidad, [6] cubriendo temas desde el diseño de máquinas motorizadas hasta física básica, que era impartida por el departamento de física. Durante los veranos trabajó en la industria de defensa, incluido un verano en una empresa que estaba desarrollando radares. Recibió sus títulos de SB y SM en 1945. [7]

Stevens había sido profesor desde sus años de estudiante universitario, cuando impartía clases sobre economía doméstica que involucraban algún aspecto de la física. [5] Después de recibir su título de maestría, se quedó en la Universidad de Toronto como instructor, enseñando cursos a jóvenes que regresaban de la guerra, incluido su propio hermano mayor. [5] Fue miembro de la Fundación Ontario de 1945 a 1946, luego trabajó como instructor en la Universidad de Toronto hasta 1948. [7]

Durante su investigación de maestría, Stevens se interesó en la teoría de control y tomó cursos del departamento de matemáticas aplicadas, donde uno de sus profesores le recomendó que postulara al MIT para realizar estudios de doctorado.

Estudios de doctorado

Poco después de que Stevens fuera admitido en el MIT, un nuevo profesor llamado Leo Beranek se dio cuenta de que Stevens había estudiado acústica. Beranek se puso en contacto con Stevens en Toronto para preguntarle si quería ser profesor asistente en el nuevo curso de acústica de Beranek, y Stevens aceptó. Poco después, Beranek se puso en contacto con Stevens de nuevo para ofrecerle un puesto de investigación en un nuevo proyecto de habla, que Stevens también aceptó. El Laboratorio de Radiación del MIT (edificio 20) se convirtió, después de la guerra, en el Laboratorio de Investigación de Electrónica (RLE); entre otros laboratorios, el RLE albergó el nuevo Laboratorio de Acústica de Beranek.

En noviembre de 1949, [8] la oficina contigua a la de Ken fue cedida a un estudiante de doctorado visitante de Suecia llamado Gunnar Fant , con quien formó una amistad y colaboración que duraría más de medio siglo. Stevens se centró en el estudio de las vocales durante su investigación doctoral; en 1950 publicó un breve artículo en el que sostenía que la autocorrelación podía utilizarse para discriminar vocales, [9] mientras que su tesis doctoral de 1952 informó de resultados perceptuales para vocales sintetizadas utilizando un conjunto de resonadores electrónicos. [10] Fant convenció a Stevens de que un modelo de línea de transmisión del tracto vocal era más flexible que un modelo de resonador y los dos publicaron este trabajo juntos en 1953. [11]

Ken atribuye a Fant la asociación entre el Departamento de Lingüística y el Laboratorio de Investigación de Electrónica del MIT. [5] Roman Jakobson , un fonólogo de Harvard , tenía una oficina en el MIT en 1957, mientras que Morris Halle se unió al Departamento de Lingüística del MIT y se trasladó al RLE en 1951. Las colaboraciones de Stevens con Halle comenzaron con la acústica, [12] pero crecieron para centrarse en la forma en que la acústica y la articulación organizan los sistemas de sonido del lenguaje. [13] [14] [15]

Stevens defendió su tesis doctoral en 1952; su comité doctoral incluía a su asesor Leo Beranek , así como a JCR Licklider y Walter A. Rosenblith . [5] Después de recibir su doctorado, Stevens fue a trabajar en Bolt, Beranek and Newman (ahora BBN Technologies ) en Harvard Square. [5] A principios de la década de 1950, Beranek decidió retirarse de la facultad del MIT para trabajar a tiempo completo en BBN. ​​Sabía que a Stevens le encantaba enseñar, por lo que lo animó a postularse para un puesto en la facultad del MIT. Stevens así lo hizo y se unió a la facultad en 1954.

Investigación, docencia y servicio

Contribuciones científicas

Stevens es más conocido por sus contribuciones a los campos de la fonología , la percepción del habla y la producción del habla . El libro más conocido de Stevens, Acoustic Phonetics, [16] está organizado de acuerdo con las características distintivas del sistema fonológico de Stevens.

Contribuciones a la fonología

Stevens es quizás mejor conocido por su propuesta de una teoría que responde a la pregunta: ¿Por qué los sonidos de los idiomas del mundo (sus fonemas o segmentos) son tan similares entre sí? Al aprender por primera vez un idioma extranjero, uno se sorprende por las notables diferencias que pueden existir entre el sistema de sonido de un idioma y el de cualquier otro. Stevens puso patas arriba la percepción del estudiante: en lugar de preguntar por qué los idiomas son diferentes, preguntó, si el sistema de sonido de cada idioma es completamente arbitrario, ¿por qué los idiomas son tan similares? Su respuesta es la teoría cuántica del habla . [17] La ​​teoría cuántica está respaldada por una teoría del cambio del lenguaje, desarrollada en colaboración con Samuel Jay Keyser , que postula la existencia de características redundantes o de mejora. [18]

La metodología de Stevens en la investigación de los sonidos del habla se organiza en tres pasos. El primer paso es utilizar la física (principalmente modelos de tubos) para modelar la forma de los articuladores (por ejemplo, las formas de la cavidad frontal y posterior, redondeo o no de los labios, etc.). Con base en los modelos de tubos articulatorios, se pueden calcular las frecuencias de resonancia, que son las frecuencias de los formantes. Una vez calculadas las frecuencias de resonancia, se recopilan los datos del habla y se analizan para compararlos con los cálculos teóricos. Esta segunda etapa es principalmente experimental, donde los elementos de interés generalmente se registran de forma aislada y/o se incluyen en una frase portadora controlada, generalmente hablada por varios hablantes nativos del idioma, tanto hombres como mujeres. La clave para la recopilación de datos es controlar tantos factores como sea posible para que la evidencia acústica de interés pueda investigarse con una cantidad mínima de artefactos. La última etapa de la investigación es comparar los resultados de los datos con las predicciones teóricas y dar cuenta de las diferencias que se produzcan. Las diferencias a veces se pueden explicar por el hecho de que los modelos de tubos suelen simplificarse para no tener en cuenta la pérdida debida a la suavidad de las paredes vocales (aunque se pueden añadir resistencias al modelo teórico). El sistema subglótico también puede afectar al sistema productivo del tracto vocal cuando la abertura glótica es grande (consulte la investigación sobre la resonancia subglótica en los efectos del habla). Las predicciones del modelo teórico pueden dar predicciones generales sobre lo que se puede esperar encontrar en el habla real, y la evidencia del habla real también puede ayudar a refinar el modelo original y brindar una mejor comprensión de la producción de sonidos del habla.

La teoría cuántica pretende describir de forma elegante (utilizando la física) y organizar todas las características acústicas de todos los sonidos posibles en una matriz (véase el capítulo cinco de Fonética acústica). La restricción última de todos los sonidos del habla es el propio sistema articulatorio físico, lo que apoya la afirmación de que solo puede haber un conjunto finito de sonidos entre los idiomas. La razón por la que el conjunto de sonidos del habla es finito es que, si bien el movimiento de los articuladores es continuo, solo ciertas configuraciones tienden a ser articulatoriamente y/o acústicamente estables, lo que da lugar a frecuencias fijas para los formantes que forman sonidos que son relativamente universales para todos los idiomas (es decir, vocales y consonantes). Por lo tanto, cada sonido acústico puede describirse mediante un puñado de características definitorias (normalmente binarias). Por ejemplo, la redondez de los labios (ya sea activada o desactivada) es una característica. La altura de la lengua (ya sea alta o baja) es otra característica. Además de estas características definitorias que sirven como descripción esencial de los sonidos acústicos, también hay características potenciadoras que ayudan a hacer que los sonidos sean más reconocibles. Para cada una de estas características, se puede aplicar la metodología de Stevens para utilizar primero un modelo de tubo para modelar los articuladores y predecir las frecuencias de resonancia, luego recopilar datos para examinar las propiedades acústicas de esa característica y, finalmente, reconciliar con el modelo teórico y resumir las propiedades acústicas de esa característica.

Para introducirse en el mundo de la ciencia del habla, se puede leer primero el libro "The Speech Chain" de Denes P. y Pinson E., en el que se ofrece una visión general de la producción y transmisión del habla. Se introducen los espectrogramas y las frecuencias de los formantes , que son la principal descripción acústica de los segmentos de sonido.

elglotis

A medida que las cuerdas vocales vibran, las bocanadas de aire son empujadas a través del tracto vocal (filtradas) y producen sonido. Esta fuente de sonido se modela como una fuente de corriente en un circuito que modela la producción de sonido. Los cambios en el tracto vocal provocarían cambios en el sonido que se produce. La frecuencia de vibración de las cuerdas vocales femeninas tiende a ser más alta que la de los hombres, lo que da a las voces femeninas un tono más alto que las masculinas.

Las investigaciones (Hanson, HM 1997) han demostrado que existe una diferencia entre cómo vibran las cuerdas vocales de mujeres y hombres; hay una mayor amplitud en la glotis femenina, lo que da a las voces femeninas una calidad más susurrante que a las masculinas.

El sistema subglótico

El sistema subglótico se refiere al sistema que se encuentra debajo de la glotis en el cuerpo humano. Incluye la tráquea , los bronquios y los pulmones . Es esencialmente un sistema fijo, por lo que no cambia para cada hablante individual. Los resultados de la investigación han demostrado que durante la fase abierta del ciclo glótico (cuando la glotis está abierta), se introduce un acoplamiento debido al sistema subglótico, que se manifiesta acústicamente como pares polo/cero en el dominio de frecuencia. Se plantea la hipótesis de que estos pares polo/cero introducidos por el acoplamiento sirven como regiones prohibidas o inestables en los espectros, y sirven como límites naturales para las características vocálicas como +front o +back.

En el caso de los varones adultos, se han medido (mediante métodos invasivos) frecuencias de resonancia de su sistema subglótico de 600, 1550 y 2200 Hz (Acoustic Phonetics, pág. 197, Ishizaka et. al., Crane & Boves). Las frecuencias de resonancia subglótica de las mujeres son ligeramente superiores debido a sus menores dimensiones. Una forma no invasiva de medir estos picos es utilizar un acelerómetro colocado por encima de la escotadura esternal (Henke) para registrar la aceleración de la piel durante la fonación. La vibración capturaría las frecuencias de resonancia por debajo de la glotis (del sistema subglótico).

eltracto vocal

El tracto vocal se refiere al conducto que está por encima de la glotis, hasta la apertura de los labios. Por lo general, se utiliza un modelo de dos tubos para modelar el tracto vocal, uno que captura la dimensión (área de sección transversal y longitud) de la cavidad posterior, el otro modela la cavidad frontal. Las frecuencias resonantes calculadas a partir del modelo de tubo son las frecuencias de formantes. Para producir la vocal schwa /ə/, el tracto vocal está relativamente abierto desde la glotis hasta la boca, por lo que el modelo de tubo puede considerarse como un tubo abierto relativamente uniforme, lo que hace que las frecuencias resonantes (o formantes) estén uniformemente separadas. La radiación en la boca haría que estas frecuencias resonantes fueran aproximadamente un cinco por ciento más bajas. (Acústica Fonética, pág. 139) Los tractos vocales femeninos (promedio de 14,1 cm) son en promedio más cortos que los tractos vocales masculinos (promedio de 17,7 cm), lo que hace que tengan frecuencias de formantes más altas que los masculinos.

Como las paredes del tracto vocal son blandas, se pierde energía en el tracto vocal, lo que aumenta el ancho de banda de los formantes.

elcavidad nasal

Cuando el puerto velofaríngeo se abre durante la producción de ciertos sonidos, como /n/ y /m/, se introduce un acoplamiento debido a la cavidad naval, lo que le da al sonido de salida una calidad nasal.

Contribuciones a la percepción del habla

La teoría cuántica sugiere que el inventario fonológico de una lengua se define principalmente por las características acústicas de cada segmento, con límites especificados por la correspondencia acústico-articulatoria. La implicación es que los segmentos fonológicos deben tener algún tipo de invariancia acústica. [19] Blumstein y Stevens [20] demostraron lo que parecía ser una relación invariante entre el espectro acústico y el sonido percibido: al agregar energía al espectro de ráfaga de "pa" en una frecuencia particular, es posible convertirlo en "ta" o "ka" respectivamente, dependiendo de la frecuencia. La presencia de la energía adicional causa la percepción de la consonante lingual; su ausencia causa la percepción de la labial.

El trabajo reciente de Stevens ha reestructurado la teoría de la invariancia acústica en un modelo perceptivo jerárquico superficial: el modelo de puntos de referencia acústicos y características distintivas .

Contribuciones a la producción del habla

En 1962, durante un año sabático en la KTH de Suecia, Stevens se ofreció como voluntario para participar en los experimentos de cinerradiografía que estaba llevando a cabo Sven Öhman. Las películas cinerradiográficas de Stevens se encuentran entre las más difundidas; existen copias en formato laserdisc y algunas están disponibles en Internet. [21]

Tras regresar al MIT, Stevens aceptó supervisar la investigación de un estudiante de odontología llamado Joseph S. Perkell. El conocimiento de Perkell sobre anatomía oral le permitió calcar las radiografías de Stevens en papel y publicar los resultados. [22]

Otras contribuciones al estudio de la producción del habla incluyen un modelo mediante el cual se puede predecir la forma espectral de la excitación del habla turbulenta (dependiendo de las dimensiones del chorro turbulento) y trabajos relacionados con las configuraciones de las cuerdas vocales que conducen a diferentes modos de fonación. [23]

De hecho, las propiedades espectrales (formantes, ancho de banda de los formantes, otras características glóticas) de todos los fonemas sonoros posibles en todos los idiomas se pueden modelar y predecir teóricamente utilizando modelos de resonadores basados ​​en la física. Los resonadores de tubo básicos se pueden utilizar para dar una predicción general de los formantes de las vocales. Se utiliza un refinamiento adicional del modelo básico añadiendo resistencias y/o condensadores al modelo para representar las pérdidas de energía debido a las paredes del tracto vocal. El acoplamiento acústico debido al sistema subglótico también se puede modelar añadiendo tubos adicionales al modelo del tracto vocal original, introduciendo polos/ceros en los espectros que representan los efectos del acoplamiento subglótico. (Las ubicaciones de estos pares polo/cero son las frecuencias resonantes del sistema subglótico). Las características glóticas como el tono vocal (F0), el cociente abierto (H1-H2) y el grado de respiración (H1-A3) también se pueden modelar y medir a partir de los espectros. (Hanson y Stevens).

Stevens como mentor

Stevens se unió al MIT como profesor asistente en 1954. [24] Se convirtió en profesor asociado en 1957, profesor titular en 1963 y fue designado profesor titular de la Cátedra Clarence J. Lebel en 1977. [7] Uno de sus colaboradores de larga data, Dennis Klatt (que escribió DECtalk mientras trabajaba en el laboratorio de Stevens), dijo que "Como líder, Ken es conocido por su devoción a los estudiantes y su milagrosa capacidad para dirigir un laboratorio ajetreado mientras parece que lo gestiona según un principio de anarquía benévola". [4]

La primera tesis doctoral que Stevens firmó en el MIT fue la de su compañero de estudios, James L. Flanagan , en 1955. Flanagan comenzó la escuela de posgrado en el MIT el mismo año que Stevens, pero sin un título de maestría previo; obtuvo su maestría en 1950 bajo la supervisión de Beranek, luego terminó su tesis doctoral bajo la supervisión de Stevens en 1955. [25]

Stevens estimó en 2001 que había supervisado aproximadamente cuarenta candidatos a doctorado. [5]

Con motivo de la recepción de la Medalla de Oro de la Sociedad Acústica de América , en 1995, sus colegas escribieron sobre el Grupo de Oratoria de Stevens que "durante su existencia de casi cuatro décadas" "ha sido sobresaliente en el apoyo que ha brindado a las mujeres investigadoras, muchas de las cuales han llegado a ocupar los escalones superiores de los laboratorios de investigación en todo el mundo". [4] Los colegas se han referido al laboratorio de Stevens como un "tesoro nacional" [6]

Servicio profesional

Stevens participó activamente en la Sociedad Acústica de Estados Unidos desde que era estudiante de posgrado. Fue miembro del consejo ejecutivo de 1963 a 1966, [26] vicepresidente de 1971 a 1972 y presidente de la Sociedad de 1976 a 1977. [27] Es miembro de la ASA. En 1983 recibió su Medalla de Plata en Comunicación Oral y en 1995 recibió la Medalla de Oro de la sociedad. [4]

Stevens también participó activamente en el IEEE , donde ocupó el rango de IEEE Life Fellow. En 2004, Ken Stevens y Gunnar Fant fueron los primeros ganadores conjuntos del premio IEEE James L. Flanagan Speech and Audio Processing Award . [28]

Stevens fue miembro de la Academia Estadounidense de Artes y Ciencias , miembro de la Academia Nacional de Ingeniería , [29] miembro de la Academia Nacional de Ciencias , [30] y en 1999 recibió la Medalla Nacional de Ciencias de los Estados Unidos . [6]

Referencias

  1. ^ según los papeles de naturalización y lo que él dijo, nació el 23 de marzo de 1924.
  2. ^ "Grupo de comunicación del habla del MIT".
  3. ^ "Kenneth Stevens, profesor emérito de la Escuela de Ingeniería Eléctrica y Computación, muere a los 89 años". mit.edu . 23 de agosto de 2013.
  4. ^ abcd «Medalla de oro de la Sociedad Americana de Acústica, 1995: Kenneth N. Stevens». Archivado desde el original el 27 de junio de 2007. Consultado el 2 de julio de 2013 .
  5. ^ abcdefgh "Transcripción de la historia oral del AIP — Dr. Kenneth Stevens". Archivado desde el original el 28 de agosto de 2013. Consultado el 2 de julio de 2013 .
  6. ^ abc "D. Halber, "El profesor de RLE Kenneth Stevens gana la Medalla Nacional de Ciencias", 1 de enero de 2000. Enero de 2000.
  7. ^ abc "Currículum vitae de Sensimetrics Consulting, Kenneth N. Stevens".
  8. ^ "Gunnar Fant, "Fonética y fonología en los últimos 50 años", presentado en "Del sonido al sentido: más de 50 años de descubrimientos en la comunicación oral", junio de 2004" (PDF) .
  9. ^ "KN Stevens, "Análisis de autocorrelación de los sonidos del habla", J. Acoust. Soc. Am. 22:769–771, 1950". Archivado desde el original el 2 de julio de 2013.
  10. ^ KN Stevens, "La percepción de sonidos moldeados por circuitos resonantes", 1952. OCLC 15508683  .
  11. ^ "Stevens, KN, Kasowski, S. y Fant, G. (1953) Un análogo eléctrico del tracto vocal, Journal of the Acoustical Society of America 25, 734–742". Archivado desde el original el 2 de julio de 2013.
  12. ^ Halle, Morris; Kenneth N. Stevens (1959). "Análisis por síntesis". Proc. Seminario sobre compresión y procesamiento del habla. Vol. 2.
  13. ^ Stevens, Kenneth N.; Morris Halle (1967). "Observaciones sobre el análisis por síntesis y características distintivas". Modelos para la percepción del habla y la forma visual, págs. 88-102. MIT Press. ISBN 9780262230261.
  14. ^ Halle, Morris; Kenneth N. Stevens (2002) [Primera edición en 1971]. "Una nota sobre las características laríngeas", págs. 45-61. Mouton de Gruyter. ISBN 9783110171433.
  15. ^ Halle, Morris; Kenneth N. Stevens (1979). "Algunas reflexiones sobre las bases teóricas de la fonética". Frontiers of speech communication research, págs. 335-349. Academic Press. ISBN 9780124498501.
  16. ^ KN Stevens (2000). Fonética acústica. Estudios actuales en lingüística. MIT Press. ISBN 9780262194044.
  17. ^ KN Stevens (1968). La naturaleza cuántica del habla: evidencia a partir de datos articulatorios y acústicos.
  18. ^ KN Stevens; SJ Keyser (1989). ""Características primarias y su mejora en las consonantes", Language 65(1):81–106". Language . 65 (1): 81–106. doi :10.2307/414843. JSTOR  414843.
  19. ^ SE Blumstein; KN Stevens (1979). ""Invariancia acústica en la producción del habla: evidencia de mediciones de las características espectrales de las consonantes oclusivas", J. Acoust. Soc. Am. 66(4):1001-1017". Archivado desde el original el 2 de julio de 2013.
  20. ^ SE Blumstein; KN Stevens (1980). ""Invariancia perceptual y espectros de inicio de consonantes oclusivas en diferentes entornos vocálicos", J. Acoust. Soc. Am. 67(2):648–662". Archivado desde el original el 2 de julio de 2013.
  21. ^ "Película de rayos X de Ken Stevens en YouTube". YouTube . Archivado desde el original el 14 de diciembre de 2021.
  22. ^ Joseph S. Perkell (1969). Fisiología de la producción del habla: resultados e implicaciones de un estudio cineradiográfico cuantitativo (Monografía de investigación) . MIT Press. ISBN 978-0262661706.
  23. ^ Stevens, Kenneth N.; 平野実; Fundación, Voz (1981). Fisiología de las cuerdas vocales, 1980, Minoru Hirano y Kenneth N. Stevens, eds . Prensa de la Universidad de Tokio. ISBN 978-0860082811.
  24. ^ "Del sonido al sentido: más de 50 años de descubrimientos en la comunicación oral". 11 de mayo de 2004.
  25. ^ Frederik Nebeker (8 de abril de 1997). "Historia oral del IEEE: James L. Flanagan".
  26. ^ "Funcionarios y miembros pasados ​​y presentes del Consejo Ejecutivo de la Sociedad Acústica de América".[ enlace muerto permanente ]
  27. ^ "Archivo Visual Emilio Segre, Galería de Presidentes de Sociedades Miembro".
  28. ^ "Red de Historia Global del IEEE, Kenneth N. Stevens". 2 de febrero de 2016.
  29. ^ "Miembros de la NAE: Dr. Kenneth N. Stevens".
  30. ^ "Alberts lanza un desafío a los nuevos miembros de la NAS". The Scientist . 8 de junio de 1998.

Enlaces externos