Tecnologías Lessac

Lessac Technologies, Inc. (LTI) es una empresa estadounidense que desarrolla software de síntesis de voz , licencia tecnología y vende novelas sintetizadas como archivos MP3. ^[1] La firma tiene actualmente siete patentes concedidas ^[2]^[3]^[4]^[5]^[6]^[7]^[8] y tres más pendientes por sus métodos automatizados de conversión de texto digital en habla con sonido humano, reconociendo con mayor precisión el habla humana y generando el texto que representa las palabras y frases de dicha habla, además de reconocer el estado emocional del hablante.

La tecnología LTI se basa en parte en el trabajo del fallecido Arthur Lessac , profesor de teatro en la Universidad Estatal de Nueva York y creador del entrenamiento kinesensico de Lessac, y LTI ha obtenido derechos exclusivos para explotar las obras protegidas por derechos de autor de Arthur Lessac en los campos de la síntesis y el reconocimiento de voz . Basándose en la idea de que la música es habla y el habla es música, el trabajo y los libros de Lessac se centraron en las energías del cuerpo y del habla y en cómo se relacionan entre sí. El sistema de anotación textual de Arthur Lessac, que se desarrolló originalmente para ayudar a los actores, cantantes y oradores a marcar guiones para prepararse para la actuación, está adaptado en el sistema de síntesis de voz de LTI como la representación básica del discurso que se va a sintetizar (Lessemes), en contraste con muchos otros sistemas que utilizan una representación fonética. ^[9]^[10]^[11]

El software de LTI tiene dos componentes principales: (1) un front-end lingüístico que convierte texto simple en una secuencia de símbolos gráficos prosódicos y fonosensoriales (Lessemes) basados en el sistema de anotación de Arthur Lessac, que especifican las unidades de habla que se sintetizarán; (2) un back-end de procesamiento de señales que toma los Lessemes como datos acústicos y produce habla sintetizada con sonido humano como salida, utilizando selección de unidades y concatenación.

El sistema de texto a voz de LTI quedó en segundo lugar en el Blizzard Challenge mundial de 2011 y 2012. El equipo que obtuvo el primer lugar en 2011 también empleó la tecnología "front-end" de LTI, pero con su propio back-end. ^[12]^[13] El Blizzard Challenge, realizado por el Language Technologies Institute de la Carnegie Mellon University , fue ideado como una forma de evaluar las técnicas de síntesis de voz haciendo que diferentes grupos de investigación construyeran voces a partir de las mismas grabaciones de actores de voz y compararan los resultados a través de pruebas de escucha.

LTI fue fundada en 2000 por H. Donald Wilson (presidente), abogado, empresario de LexisNexis y socio comercial de Arthur Lessac, y Gary A. Marple (inventor principal), después de que Marple sugiriera que el entrenamiento de voz kinesiológico de Arthur Lessac podría ser aplicable a la lingüística computacional. Tras la muerte de Wilson en 2006, su sobrino John Reichenbach se convirtió en el director ejecutivo de la empresa.

Referencias

^ “Los primeros audiolibros con voz sintética”, por el analista de la industria Walt Tetschner en el boletín mensual de la industria ASRNews
^ 8 de mayo de 2012 (#8,175,879) Anotación de texto con efectos del sistema para prosodia expresiva en síntesis y reconocimiento de voz: "Lessac+Technologies"
^ 25 de enero de 2011 (#7,877,259) Códigos de texto de voz y su uso en sistemas de voz computarizados: "Lessac+Technologies"
^ 9 de octubre de 2007 (#7,280,964) "Método Lessac+Technologies para reconocer el lenguaje hablado con reconocimiento de colores del lenguaje: "
^ 8 de noviembre de 2005 (#6,963,841) Método de entrenamiento del habla con base de datos de pronunciación adecuada alternativa:
^ 8 de marzo de 2005 (#6,865,533) Texto a voz:
^ 25 de enero de 2005 (#6,847,931) Análisis expresivo en la conversión computarizada de texto a voz:
^ 22 de junio de 2012 (Notificación de concesión de la solicitud n.º US 11/909.514) Un sintetizador de voz computarizado para sintetizar voz a partir de texto:
^ M. Munro, S. Turner, A. Munro y K. Campbell [Eds.] (2010), Escritos colectivos sobre el trabajo de voz y cuerpo de Lessac: un Festschrift, Llumina Press. ISBN 1605943436 (específicamente el capítulo titulado “Uso de Lessemas en la síntesis de texto a voz” por R. Nitisaroj y GA Marple)
^ “TTS está encontrando su camino” por Lauren Shopp, publicado el 1 de noviembre de 2007): http://www.speechtechmag.com/Articles/Editorial/Feature/TTS-Is-Finding-Its-Way-40067.aspx; ver párrafos 5 a 7 de “Definición de expresión”
^ Lessac, Arthur (1997). El uso y entrenamiento de la voz humana: un enfoque biodinámico de la vida vocal (3.ª ed.) . Mountain View, CA: Mayfield Pub., pp. xv, 291 pág.: ill.; 22 cm., ISBN 1-55934-696-5 . LCCN 96018629; y Lessac, Arthur (1981, c1978), Sabiduría corporal: el uso y entrenamiento del cuerpo humano (1.ª ed.) . Nueva York, NY: Drama Book Specialists., pp. vii, 278 pág.: ill.; 27 cm., ISBN 0-89676-070-7 . LCCN 81005472. OCLC 7671791.
^ *“Datos del Blizzard Challenge 2011... proporcionados por Lessac Technologies” (información incluida en la página de SynSig sobre el Blizzard Challenge 2011): http://www.synsig.org/index.php/Blizzard_Challenge_2011
^ Participación en el Desafío Blizzard: http://festvox.org/blizzard/bc2011/LESSAC_Blizzard2011.pdf

Enlaces externos

Sitio web de la empresa