OpenAI’s voice cloning AI model only needs a 15-second sample to work

– Este modelo, denominado «Generación de voz», lleva en desarrollo desde finales de 2022 e impulsa la función de lectura en voz alta de ChatGPT.

– Genera voces sintéticas a partir de clips de voz de 15 segundos para diversas aplicaciones.

– OpenAI aplica políticas de uso para evitar usos indebidos, incluidos el consentimiento y la supervisión.

OpenAI presenta Voice Engine, una plataforma de conversión de texto en voz que crea voces sintéticas a partir de breves muestras de audio. Las voces generadas por IA pueden articular texto en varios idiomas, lo que puede beneficiar a diversos sectores. Asociaciones con empresas como Age of Learning demuestran su aplicación en la generación de contenidos de voz en off y respuestas en tiempo real. Desarrollada desde finales de 2022, la tecnología pretende mejorar funciones como la lectura en voz alta de ChatGPT. A pesar de los avances, persisten las preocupaciones éticas, lo que ha llevado a OpenAI a aplicar políticas de uso que prohíben la suplantación de identidad y garantizan el consentimiento explícito. La empresa también aplica medidas como la marca de agua y la supervisión activa para rastrear el uso del audio. OpenAI aboga por medidas para mitigar los riesgos asociados a la tecnología de voz de IA, haciendo hincapié en el consentimiento informado, la educación sobre las falsificaciones profundas y los marcos reguladores.

Autor del artículo:

Emilia David

Fuente:

The Verge

Tipo :

Noticia

Fecha de publicación :

30/03/2024

Temas:

Aplicaciones, ChatGPT, Generador de voz, Tecnología

OpenAI’s voice cloning AI model only needs a 15-second sample to work

Seleccionado por:

Cristina Callejo