Un navegador de voz es una aplicación de software que presenta una interfaz de usuario de voz interactiva al usuario de una manera análoga al funcionamiento de un navegador web que interpreta el lenguaje de marcado de hipertexto (HTML). Los documentos de diálogo interpretados por el navegador de voz suelen estar codificados en lenguajes de marcado basados en estándares, como Voice Dialog Extensible Markup Language (VoiceXML), un estándar del World Wide Web Consortium .
Un navegador de voz presenta la información de forma auditiva, mediante la reproducción de archivos de audio pregrabados o un software de síntesis de texto a voz . Un navegador de voz obtiene la información mediante el reconocimiento de voz y la entrada de datos mediante el teclado, como la detección de DTMF .
A medida que el reconocimiento de voz y las tecnologías web han madurado, las aplicaciones de voz se implementan comercialmente en muchas industrias y los navegadores de voz están reemplazando a los sistemas de respuesta de voz interactiva (IVR) propietarios tradicionales. El software de navegador de voz se entrega en una variedad de modelos de implementación.
Los sistemas que presentan un navegador de voz a un usuario, generalmente proporcionan interfaces a la red telefónica pública conmutada o a una centralita privada .