OpenAI ha revelado los resultados de las pruebas iniciales de su último modelo de inteligencia artificial, Voice Engine. Este modelo tiene el poder de leer de manera realista el texto proporcionado, utilizando una muestra de voz de tan solo 15 segundos. El objetivo es capturar con precisión las características vocales y del habla del locutor.
Voice Engine comenzó a ser desarrollado a finales de 2022 y se ha integrado en la API de conversión de texto a voz, así como en aplicaciones como ChatGPT Voice y Read Aloud. Desde el año pasado, la compañía ha permitido que un grupo selecto de socios pruebe Voice Engine y ha recopilado ejemplos de su implementación:
- La compañía de tecnología educativa Age of Learning está utilizando Voice Engine para darle apoyo educativo a lectores y niños con dificultades. Las voces naturales y diversas generadas por Voice Engine hacen que el contenido sea más accesible. En colaboración con GPT-4, la plataforma ofrece respuestas personalizadas en tiempo real, adaptadas a las necesidades individuales de cada estudiante.
- La traducción de contenido multimedia como vídeos y podcasts, permite a autores y empresas llegar a audiencias globales. HeyGen, una plataforma líder en narración visual impulsada por IA, ofrece avatares humanoides para diversos fines. Voice Engine de OpenAI conserva los acentos nativos de los hablantes, lo que garantiza una experiencia auténtica.
- El apoyo para personas con dificultades en el habla es esencial en aplicaciones terapéuticas y educativas. Livox, una app de IA para dispositivos de comunicación alternativa, utiliza Voice Engine para ofrecer voces únicas y naturales que permiten a los usuarios expresarse con autenticidad y en múltiples idiomas.
- El NPNI está desarrollando un programa revolucionario para restaurar la voz de personas afectadas por trastornos del habla, como el causado por cáncer o trastornos neurológicos. Usando la tecnología del Voice Engine, los médicos han logrado recuperar la voz de un paciente joven que experimentaba dificultades debido a un tumor cerebral vascular, utilizando muestras de audio de solo 15 segundos.
Los socios de OpenAI se han comprometido a seguir las reglas de uso de la tecnología, las cuales prohíben la suplantación de identidad. OpenAI también reconoce la importancia de recibir comentarios del público sobre los posibles riesgos y usos indebidos de esta herramienta.
Fuente: The Verge