24h España.

24h España.

Voice Engine: la IA revolucionaria de OpenAI que reproduce voces de forma realista a partir de breves muestras de audio.

Voice Engine: la IA revolucionaria de OpenAI que reproduce voces de forma realista a partir de breves muestras de audio.

En un movimiento innovador, OpenAI ha lanzado Voice Engine, un modelo de IA revolucionario capaz de clonar la voz de las personas con una muestra de audio de apenas 15 segundos, y leer texto con resultados naturales en varios idiomas.

La compañía tecnológica estadounidense continúa marcando la pauta en el desarrollo de herramientas de IA, en línea con su compromiso de explorar los límites tecnológicos y compartir abiertamente los avances en este campo.

Voice Engine, presentado por OpenAI, es un modelo innovador que utiliza una muestra de audio de 15 segundos y entrada de texto para producir voces personalizadas, que se asemejan notablemente a la voz original del hablante.

El modelo Voice Engine, iniciado en 2022, es una versión a pequeña escala utilizada para mejorar las voces disponibles en la API de conversión de texto a voz, así como en ChatGPT Voice y Read Aloud.

Además, Voice Engine ha sido probado en varias áreas, como la asistencia de lectura con voces naturales, la traducción de contenido en diferentes idiomas manteniendo el acento original del hablante, y su utilidad en entornos laborales para funciones como marketing o ventas.

OpenAI destaca el potencial terapéutico de Voice Engine en el ámbito sanitario, al facilitar el aprendizaje del habla y la comunicación para personas con discapacidad, usando voces no robotizadas y en diversos idiomas.

Algunos socios, incluyendo Age of Learning, HeyGen, Dimagi y Livox, han tenido acceso a la versión preliminar de Voice Engine, y han aceptado políticas de uso para prevenir el uso no ético de la tecnología.

OpenAI subraya la importancia de implementar medidas de seguridad, como obtener el consentimiento explícito de los hablantes originales y evitar la suplantación de identidades sin autorización.

La compañía reconoce los riesgos asociados con la generación de voces sintéticas similares a las reales, y se compromete a colaborar con diversos sectores para garantizar un despliegue responsable de esta tecnología.

En última instancia, OpenAI espera abrir un diálogo sobre el uso responsable de las voces sintéticas y evaluar la posibilidad de implementar Voice Engine a gran escala en el futuro, adaptándose a las demandas y necesidades de la sociedad en evolución.