Tecnología

OpenAI ahora puede clonar una voz con sólo 15 segundos de muestra

Voice Engine es un nuevo modelo de IA que puede convertir texto a voz para crear voces sintéticas para ayudar en distintas cosas

ARCHIVO - El logotipo de OpenAI en la pantalla de un teléfono frente a la imagen de un monitor generada por la herramienta Dall-E de ChatGPT, el viernes 8 de diciembre de 2023, en Boston. (AP Foto/Michael Dwyer, Archivo) AP (Michael Dwyer/AP)

PUBLICIDAD

La tecnología avanza cada vez a velocidades que menos podemos percibir o prever. Hace algunos días, la empresa de inteligencia artificial (IA) OpenAI compartió los avances de su más reciente modelo, Voice Engine, asegurando que puede clonar voces humanas reproduciendo un sonido natural “emotivo y realista” usando una muestra de sólo 15 segundos. Sin embargo, lanzar la tecnología al público general sería demasiado arriesgado ahora, por lo que aún no lo hará.

Reconocemos que generar un discurso que se asemeje a las voces de las personas conlleva serios riesgos, que son especialmente importantes en un año electoral”, señalaron en un comunicado los creadores de ChatGPT.

¿De qué se trata Voice Engine?

Voice Engine es un nuevo modelo de IA que puede convertir texto a voz para crear voces sintéticas, que, según la compañía, pueden permitir que los creadores de contenidos puedan traducir su trabajo en otras lenguas sin perder sus acentos nativos y ayudar a las personas con problemas de comunicación verbal a usar su voz para, por ejemplo, llamar por teléfono.

La compañía ofreció ejemplos de traducción del inglés a otros idiomas como el español, mandarín, alemán, francés y japonés que conservaban el mismo acento nativo de la persona original.

Por el momento, las empresas que pueden acceder a esta tecnología son la empresa de tecnología educativa Age of Learning, la plataforma de narración visual HeyGen, el fabricante de software de salud Dimagi, el creador de aplicaciones de comunicación de inteligencia artificial Livox y el sistema de salud Lifespan.

Recomendados

“Estamos adoptando un enfoque cauteloso e informado para una publicación más amplia debido al potencial de uso indebido de la voz sintética”, indicó OpenAI en el comunicado donde además apunta que las empresas con las que trabajan han aceptado sus políticas de uso.

Es importante señalar que entre esas reglas se incluye que no se use la voz de alguien sin su consentimiento o que hay que indicar a los usuarios que son voces sintéticas.

Tags

Lo Último