24h España.

24h España.

ElevenLabs lanza herramientas para crear agentes conversacionales de IA compatibles con Gemini, GPT y Claude.

ElevenLabs lanza herramientas para crear agentes conversacionales de IA compatibles con Gemini, GPT y Claude.

En un emocionante avance hacia la democratización de la inteligencia artificial, ElevenLabs ha revelado que los desarrolladores ahora tienen la oportunidad de crear agentes conversacionales utilizando su plataforma. Estos nuevos bots, impulsados por Inteligencia Artificial generativa, cuentan con una variedad de características personalizables y son compatibles con tecnologías de vanguardia como Gemini, GPT y Claude.

Esta innovadora startup se especializa en el uso de inteligencia artificial enfocada en la voz, abarcando desde la clonación de voces hasta la conversión de texto a voz. Su misión es ambiciosa: eliminar las barreras lingüísticas que a menudo dificultan el acceso al contenido. Con estas herramientas, ElevenLabs busca facilitar la comunicación y hacer que la información esté disponible para un público más amplio.

Aprovechando su experiencia en el ámbito de la IA, la empresa ya cuenta con una gama de herramientas, como un sistema de doblaje de inteligencia artificial y una aplicación que reproduce voces de actores de cine clásico. Recientemente, han ampliado su oferta al incluir agentes conversacionales, facilitando a los usuarios la posibilidad de crear estos bots interactivos.

Hasta ahora, algunas personas habían podido probar esta funcionalidad, pero ahora cualquier interesado puede acceder a ella y personalizar aspectos clave como el tono de voz y la duración de las respuestas, lo que abre un amplio espectro para la creatividad y la personalización en el uso de la IA.

Sin embargo, el desarrollo de estos agentes no ha estado exento de retos. Sam Sklar, director de crecimiento de la empresa, comentó a TechCrunch que la integración de bases de conocimiento y la gestión de las interrupciones de los usuarios han sido los principales obstáculos. Por ello, la compañía ha implementado un canal dedicado para facilitar la creación y configuración de estos bots, simplificando el proceso para los desarrolladores.

Al iniciar sesión en la cuenta, los usuarios pueden seleccionar su idioma principal y un mensaje de bienvenida que personalice la experiencia del 'chatbot'. Además, deben elegir entre varios modelos de lenguaje grande (LLMs), que incluyen opciones como Gemini de Google, GPT de OpenAI y Claude de Anthropic. También se puede ajustar el nivel de creatividad de las respuestas y definir un límite en el uso de tokens.

Entre las numerosas opciones configurables se incluyen la selección de voz, la latencia, la estabilidad, los criterios de autenticación y la duración máxima de las interacciones con los agentes de inteligencia artificial. Esta flexibilidad permite a los desarrolladores diseñar experiencias únicas adaptadas a sus necesidades y aspiraciones.

Además, los usuarios tienen la opción de enriquecer sus agentes añadiendo su propia base de conocimientos. Pueden incorporar información a través de URLs, bloques de texto o archivos, así como utilizar un LLM personalizado para potenciar aún más la interacción.

Por último, es importante mencionar que el kit de desarrollo de software (SDK) de ElevenLabs se encuentra compatible con lenguajes de programación como Python, JavaScript, React y Swift. Para aquellos que buscan una personalización aún mayor, la compañía también proporciona una interfaz de programación de aplicaciones (API) basada en WebSocket, lo que permite a los desarrolladores sacar el máximo provecho de sus creaciones.