Lessac Technologies, Inc. (LTI) es una empresa estadounidense que desarrolla software de síntesis de voz , licencia tecnología y vende novelas sintetizadas como archivos MP3. [1] La firma tiene actualmente siete patentes concedidas [2] [3] [4] [5] [6] [7] [8] y tres más pendientes por sus métodos automatizados de conversión de texto digital en habla con sonido humano, reconociendo con mayor precisión el habla humana y generando el texto que representa las palabras y frases de dicha habla, además de reconocer el estado emocional del hablante.
La tecnología LTI se basa en parte en el trabajo del fallecido Arthur Lessac , profesor de teatro en la Universidad Estatal de Nueva York y creador del entrenamiento kinesensico de Lessac, y LTI ha obtenido derechos exclusivos para explotar las obras protegidas por derechos de autor de Arthur Lessac en los campos de la síntesis y el reconocimiento de voz . Basándose en la idea de que la música es habla y el habla es música, el trabajo y los libros de Lessac se centraron en las energías del cuerpo y del habla y en cómo se relacionan entre sí. El sistema de anotación textual de Arthur Lessac, que se desarrolló originalmente para ayudar a los actores, cantantes y oradores a marcar guiones para prepararse para la actuación, está adaptado en el sistema de síntesis de voz de LTI como la representación básica del discurso que se va a sintetizar (Lessemes), en contraste con muchos otros sistemas que utilizan una representación fonética. [9] [10] [11]
El software de LTI tiene dos componentes principales: (1) un front-end lingüístico que convierte texto simple en una secuencia de símbolos gráficos prosódicos y fonosensoriales (Lessemes) basados en el sistema de anotación de Arthur Lessac, que especifican las unidades de habla que se sintetizarán; (2) un back-end de procesamiento de señales que toma los Lessemes como datos acústicos y produce habla sintetizada con sonido humano como salida, utilizando selección de unidades y concatenación.
El sistema de texto a voz de LTI quedó en segundo lugar en el Blizzard Challenge mundial de 2011 y 2012. El equipo que obtuvo el primer lugar en 2011 también empleó la tecnología "front-end" de LTI, pero con su propio back-end. [12] [13] El Blizzard Challenge, realizado por el Language Technologies Institute de la Carnegie Mellon University , fue ideado como una forma de evaluar las técnicas de síntesis de voz haciendo que diferentes grupos de investigación construyeran voces a partir de las mismas grabaciones de actores de voz y compararan los resultados a través de pruebas de escucha.
LTI fue fundada en 2000 por H. Donald Wilson (presidente), abogado, empresario de LexisNexis y socio comercial de Arthur Lessac, y Gary A. Marple (inventor principal), después de que Marple sugiriera que el entrenamiento de voz kinesiológico de Arthur Lessac podría ser aplicable a la lingüística computacional. Tras la muerte de Wilson en 2006, su sobrino John Reichenbach se convirtió en el director ejecutivo de la empresa.