Adobe VoCo es un prototipo de software de edición y generación de audio inédito de Adobe que permite la edición y generación de audio novedosas. Apodado " Photoshop para voz", [1] se presentó por primera vez en el evento Adobe MAX en noviembre de 2016. La tecnología mostrada en Adobe MAX fue una vista previa que podría incorporarse potencialmente a Adobe Creative Cloud . Más tarde se reveló que Voco nunca estuvo destinado a ser lanzado y que estaba destinado a ser un prototipo de investigación. [2] [3]
En 2023, Adobe introdujo la posibilidad de editar videos editando una transcripción del video generada por IA en Premiere Pro , demostrando una funcionalidad similar a Voco. [4]
Como se mostró en la demostración, el software toma aproximadamente 20 minutos del habla del objetivo deseado y genera una voz similar al sonido, que incluye fonemas que no estaban presentes en el material de ejemplo del objetivo. Adobe afirmó que Voco reduciría el costo de producción de audio. [1] [3]
Se plantearon preocupaciones éticas y de seguridad sobre la capacidad de alterar una grabación de audio para incluir palabras y frases que el hablante original nunca pronunció, y el riesgo potencial para la biometría de la huella de voz . [1]
También surgieron preocupaciones de que podría usarse junto con:
La falta de avances publicitados de Adobe abrió oportunidades para que otros proyectos crearan productos alternativos a VOCO, como Resemble AI y 15.ai , una herramienta de conversión de texto a voz en tiempo real que utiliza inteligencia artificial.
WaveNet es un proyecto de investigación similar pero de código abierto de la empresa de inteligencia artificial DeepMind , con sede en Londres , desarrollado independientemente casi al mismo tiempo que Adobe Voco.