OpenAI lanza herramienta de audio capaz de clonar voces humanas | Tecnología

Clona fielmente la voz humana con una muestra de bronceado en tan solo 15 segundos. Así se utiliza la última herramienta de inteligencia artificial creada por OpenAI, la empresa que ilumina el mundo con ChatGPT, su programa de lenguaje de IA generativa.

“Hoy compartimos ideas y resultados preliminares desde una vista preliminar a través de una pequeña escalada de un modelo llamado Voice Engine, que utiliza texto y una única reproducción de audio de 15 segundos para generar un hábito natural que se parece mucho al original. Es notable que un modelo pequeño con un solo reloj de 15 segundos pueda crear voces emotivas y realistas”, afirmó la empresa que dirige Sam Altman en un comunicado de prensa.

Todo lo que necesitas hacer para que el usuario esté disponible para ti. Una vez que el programa Voice Engine tenga sentido, podrás leer con el timbre y tono de esta voz cualquier texto que te resulte más fácil. El texto no quiere que esté en el mismo idioma. Un hispanohablante puede facilitar la lectura de tu idioma y luego seguir el programa que lee tu voz con texto en inglés, chino u otros idiomas.

También puedes usarlo directamente para la traducción de audio. Además, cuando se utiliza para traducir, Voice Engine conserva el acento nativo del habante original: por ejemplo, generar inglés con música de audio de un habante francés producirá una habla con un cento francés.

Uso restringido

La compañía prefiere lanzar una declaración a pequeña escala en este momento en lugar de facilitar el acceso generalizado a la herramienta, ya que con ChatGPT puede ser consciente del riesgo de sustitución de identidad. Con la herramienta, tome 15 segundos para que alguien hacer con tu voz.

«Adoptamos un enfoque cauteloso e informado antes de un lanzamiento más amplio debido al potencial de uso independiente de voces sintéticas», dice OpenAI. “Esperamos iniciar un diálogo sobre quién es el responsable de las voces sintéticas y cómo podemos adaptar la sociedad a sus nuevas capacidades. Basándonos en estas conversaciones y en los resultados de estos ensayos a pequeña escala, tomaremos una decisión más informada sobre si desaprobamos esta tecnología a gran escala y cómo hacerlo”, añadió.

OpenAI considera que antes de generalizar el acceso a una nueva herramienta se deben tomar decisiones sobre una serie de aspectos. Por ejemplo, sugerimos eliminar gradualmente la autenticación como medio de seguridad para acceder a cuentas bancarias y otra información confidencial, lo que podría impedirle estar seguro.

Considere también la necesidad de explorar políticas para proteger el uso de las voces de los individuos en la inteligencia artificial. El riesgo de manipulación y desinformación es particularmente marcado en el caso de figuras públicas, incluidos los políticos.

Por lo tanto, también recomendamos educar al público para que comprenda las capacidades y limitaciones de las tecnologías de IA, incluida la posibilidad de interactuar con contenidos de IA.

Otra propuesta que está sobre la mesa es acelerar el desarrollo y adopción de técnicas para rastrear el origen de los contenidos audiovisuales, de modo que siempre quede claro al interactuar con una persona real o con una IA.

“Es importante que personas de todo el mundo puedan liderar esta tecnología, por lo que, en última instancia, también la implementamos o no. Esperamos participar en conversaciones sobre la retroalimentación y las oportunidades de las voces sintéticas con formuladores de políticas, investigadores, inversores y creadores”, concluye OpenAI.

En su camino de innovaciones, OpenAI ha lanzado herramientas en un único lenguaje, pero también para la generación de imágenes y vídeos. Ese día, Sora demostró una revolucionaria herramienta de vídeo que le proporcionaba texto para crear un vídeo corto con el contenido y el estilo requeridos.

Puedes seguir un EL PAÍS Tecnología fr. FacebookX o haga clic aquí para recibir el nuestro boletín semanal.