El Festival Speech Synthesis System es un sistema general de síntesis de voz multilingüe desarrollado originalmente por Alan W. Black , Paul Taylor y Richard Caley [1] en el Centro de Investigación de Tecnología del Habla (CSTR) de la Universidad de Edimburgo . La Universidad Carnegie Mellon y otros sitios también han realizado contribuciones sustanciales . Se distribuye bajo una licencia de software libre similar a la licencia BSD .
Ofrece un sistema completo de conversión de texto a voz con varias API , así como un entorno para el desarrollo e investigación de técnicas de síntesis de voz. Está escrito en C++ con un intérprete de comandos similar a Scheme para personalización y extensión general. [2]
Festival está diseñado para admitir varios idiomas y viene con soporte para inglés ( pronunciación británica y estadounidense ), galés y español . Existen paquetes de voz para varios otros idiomas, como español castellano , checo , finlandés , hindi , italiano , maratí , polaco , ruso y telugu .
El proyecto Festvox tiene como objetivo hacer que la creación de nuevas voces sintéticas sea más sistemática y esté mejor documentada, [3] haciendo posible que cualquiera pueda crear una nueva voz. Se distribuye bajo una licencia de software libre similar a la licencia MIT .
Festvox es un conjunto de herramientas de Alan W. Black y Kevin Lenzo para crear voces sintéticas para festivales. Incluye un tutorial paso a paso con ejemplos en el documento llamado "Creación de voces sintéticas". [4]
Flite es un pequeño motor de síntesis de voz en tiempo de ejecución desarrollado en la Universidad Carnegie Mellon , derivado tanto de Festival como de Festvox. [5]
Hay un complemento de Festival para GStreamer . Festival está preinstalado para varias distribuciones de Linux .