Adobe Voco

Adobe VoCo es un prototipo de software de edición y generación de audio inédito de Adobe que permite la edición y generación de audio novedosas. Apodado " Photoshop para voz", ^[1] se presentó por primera vez en el evento Adobe MAX en noviembre de 2016. La tecnología mostrada en Adobe MAX fue una vista previa que podría incorporarse potencialmente a Adobe Creative Cloud . Más tarde se reveló que Voco nunca estuvo destinado a ser lanzado y que estaba destinado a ser un prototipo de investigación. ^[2]^[3]

En 2023, Adobe introdujo la posibilidad de editar videos editando una transcripción del video generada por IA en Premiere Pro , demostrando una funcionalidad similar a Voco. ^[4]

Detalles técnicos

Como se mostró en la demostración, el software toma aproximadamente 20 minutos del habla del objetivo deseado y genera una voz similar al sonido, que incluye fonemas que no estaban presentes en el material de ejemplo del objetivo. Adobe afirmó que Voco reduciría el costo de producción de audio. ^[1]^[3]

Preocupaciones

Se plantearon preocupaciones éticas y de seguridad sobre la capacidad de alterar una grabación de audio para incluir palabras y frases que el hablante original nunca pronunció, y el riesgo potencial para la biometría de la huella de voz . ^[1]

También surgieron preocupaciones de que podría usarse junto con:

Síntesis de imágenes humanas , que ha alcanzado tales niveles de similitud desde principios de la década de 2000 que distinguir entre un humano grabado con una cámara y una simulación de un humano es muy difícil. ^[5]
Manipulación de video de las expresiones faciales de una persona casi en tiempo real utilizando un video RGB 2D existente de ella. ^[6]

Alternativas

La falta de avances publicitados de Adobe abrió oportunidades para que otros proyectos crearan productos alternativos a VOCO, como Resemble AI y 15.ai , una herramienta de conversión de texto a voz en tiempo real que utiliza inteligencia artificial.

WaveNet es un proyecto de investigación similar pero de código abierto de la empresa de inteligencia artificial DeepMind , con sede en Londres , desarrollado independientemente casi al mismo tiempo que Adobe Voco.

Véase también

Referencias

^ abc "sapic". BBC.com . BBC . 2016-11-07 . Consultado el 2016-07-05 .
^ "Prueba Beta #VoCo". 8 de noviembre de 2016.
^ ab "¿Ha muerto Adobe VoCo?". Blog de Adobe . 27 de enero de 2018. Consultado el 17 de junio de 2020 .
^ "Ahora en versión beta: presentación de la edición basada en texto en Premiere Pro". community.adobe.com . 2023-02-03 . Consultado el 2023-04-16 .
^ Rodgers, Julian. "Adobe Voco: ¿deberíamos tener miedo?". Production Expert . Pro Tools . Consultado el 14 de diciembre de 2018 .
^ Thies, Justus (2016). "Face2Face: captura de rostros en tiempo real y recreación de videos RGB". Proc. Computer Vision and Pattern Recognition (CVPR), IEEE . Consultado el 18 de junio de 2016 .