Las voces de texto a voz de Microsoft son sintetizadores de voz que se proporcionan para su uso con aplicaciones que utilizan Microsoft Speech API (SAPI) o Microsoft Speech Server Platform. Existen versiones de cliente, servidor y móviles de las voces de texto a voz de Microsoft. Las voces de cliente se envían con los sistemas operativos Windows; las voces de servidor están disponibles para su descarga para su uso con aplicaciones de servidor como Speech Server, Lync, etc., tanto para plataformas de cliente como de servidor de Windows, y las voces móviles suelen enviarse con versiones más recientes.
Microsoft Sam es la voz masculina de texto a voz predeterminada en Microsoft Windows 2000 y Windows XP . La utiliza Narrador , el programa lector de pantalla integrado en el sistema operativo.
Microsoft Mike y Microsoft Mary son voces masculinas y femeninas opcionales, respectivamente, que se pueden descargar desde el sitio web de Microsoft. Michael y Michelle también son voces masculinas y femeninas opcionales autorizadas por Microsoft de Lernout & Hauspie y están disponibles a través de Microsoft Office XP y Microsoft Office 2003 o Microsoft Reader .
Existen versiones SAPI 4 y SAPI 5 de estas voces de conversión de texto a voz. Las voces SAPI 4 solo están disponibles en Windows 2000 y sistemas operativos posteriores basados en Windows NT. Las versiones redistribuibles de las voces SAPI 4 estaban disponibles para su descarga en los sistemas operativos Windows 9x , sin embargo, ya no se ofrecen desde el sitio web de Microsoft. Si bien las versiones SAPI 5 de Microsoft Mike y Microsoft Mary solo se pueden descargar como un módulo de combinación , [1] las versiones instalables se pueden instalar en los sistemas de los usuarios finales mediante aplicaciones de voz como Microsoft Reader.
Los patrones de habla de las versiones SAPI 4 y SAPI 5 de las voces de texto a voz son diferentes entre sí. Las versiones SAPI 4 de Microsoft Sam, Microsoft Mike y Microsoft Mary se pueden utilizar en Windows XP, Windows Vista y posteriores con un programa de terceros (como Speakonia y TTSReader) instalado en la máquina que admita estos sistemas operativos. Además, las voces de Michael y Michelle de Lernout & Hauspie también funcionarán en Windows Vista y posteriores si se descargan y utilizan las versiones SAPI 4 de las voces en inglés británico con un programa de terceros como Speakonia (por el contrario, dichas voces también son compatibles con XP y anteriores).
A partir de Windows Vista y Windows 7 , la voz predeterminada en inglés es Microsoft Anna . Es una voz femenina exclusiva de SAPI 5 y está diseñada para sonar más natural que Microsoft Sam. [2] Microsoft Streets & Trips 2006 y versiones posteriores instalan la voz Microsoft Anna en los sistemas Windows XP para la función de indicaciones de voz. No hay voces masculinas incluidas con Windows Vista y Windows 7, y ni Microsoft Mike ni Mary funcionarán en Windows 7.
Una voz femenina llamada Microsoft Lili que reemplaza la voz masculina SAPI 5 anterior "Microsoft Simplified Chinese" está disponible en las versiones en chino de Windows Vista y Windows 7. También se puede obtener en versiones no chinas de Windows 7 o Vista instalando el paquete de idioma chino .
En 2010, Microsoft lanzó las nuevas voces compatibles con Speech Platform para reconocimiento de voz y conversión de texto a voz para su uso con aplicaciones cliente y servidor. Estas voces están disponibles en 26 idiomas [3] y se pueden instalar en sistemas operativos cliente y servidor de Windows. Las voces de Speech Platform, a diferencia de las voces de SAPI 5, son exclusivamente femeninas; nunca se lanzaron voces masculinas.
En Windows 8 , hay tres nuevas voces de cliente (de escritorio): Microsoft David (hombre en EE. UU.), Hazel (mujer en el Reino Unido) y Zira (mujer en EE. UU.), que tienen como objetivo sonar más naturales que Microsoft Anna. Las versiones de servidor de estas voces están disponibles a través de la plataforma de voz mencionada anteriormente para sistemas operativos anteriores a Windows 8. Hay otras voces disponibles para versiones de idiomas específicos de Windows 8 o Windows 8.1 . [4]
A diferencia de Windows 7 o Vista, no se puede usar ningún programa de terceros para Microsoft Anna porque no existe una API oficial de Anna Voice para descargar (especialmente porque Microsoft Anna solo estaba disponible en SAPI 5 y no había ninguna versión SAPI 4 de la voz disponible).
En Windows 10 , Microsoft Hazel se eliminó del paquete de idioma inglés de EE. UU. y están disponibles las voces de Microsoft para dispositivos móviles (teléfonos y tabletas) (Microsoft Mark y Microsoft Zira). Son las mismas voces que se encuentran en Windows Phone 8, Windows Phone 8.1 y Windows 10 Mobile .
Además de estas voces, también hay paquetes de idiomas disponibles para una variedad de voces similares a las de Windows 8 y 8.1. Ninguna de estas voces coincide con la voz de texto a voz de Cortana que se puede encontrar en Windows Phone 8.1, Windows 10 y Windows 10 Mobile.
En un intento por unificar su software con Windows 10 , todas las plataformas actuales de Microsoft utilizan las mismas voces de texto a voz, excepto Microsoft David y algunas otras.
Todos los paquetes de voz para dispositivos móviles tienen una combinación de voces masculinas y femeninas, mientras que la mayoría de los paquetes de voz para computadoras de escritorio tienen solo voces femeninas. Todas las voces para dispositivos móviles se han vuelto universales y cualquier usuario que descargue el paquete de idioma de esa elección tendrá una voz masculina y una femenina adicionales por paquete.
En Windows 10, el sistema incluye una voz de texto a voz oculta llamada Microsoft Eva Mobile. Los usuarios pueden descargar un archivo de registro preconfigurado desde el sitio web windowsreport.com. Se cree que Microsoft Eva fue la primera voz de Cortana hasta que Microsoft la reemplazó por la voz de Jen Taylor en la mayoría de las áreas.
Estas voces se actualizan con Windows para que suenen más naturales que en la versión original, como se ve en las versiones minoristas actualizadas de Windows 10.
Windows 11 introdujo tres nuevas "voces naturales" a partir de la versión 22H2: Microsoft Aria, Jenny y Guy. [5] Estas voces naturales están pensadas para sonar más naturales que las voces de texto a voz anteriores y se basan en las de la plataforma de computación en la nube Azure de Microsoft . Solo están disponibles a través del Narrador y, actualmente, no están disponibles para su uso por parte de ningún programa fuera de él a partir de 2024 , incluidas todas las aplicaciones propias y de terceros.[actualizar]
Las voces de Windows 10 ahora se reclasifican como "voces heredadas", sin embargo, David todavía se usaba como predeterminado para el cliente de escritorio.