24h España.

24h España.

Stability.AI lanza Stable Audio Open, su innovador modelo de código abierto para crear clips de audio de corta duración.

Stability.AI lanza Stable Audio Open, su innovador modelo de código abierto para crear clips de audio de corta duración.

La innovadora empresa Stability.AI ha dado a conocer su más reciente creación, el revolucionario modelo de texto a audio de código abierto Stable Audio Open, diseñado para generar muestras de audio y sonidos de forma espectacular. Este modelo tiene la capacidad de producir impactantes efectos de sonido y samples de hasta 47 segundos, incluyendo ritmos de batería y sonidos ambientales.

En septiembre de 2023, esta joven empresa lanzó su primer modelo de texto a audio, el Stable Audio, el cual permitía a los usuarios crear música y efectos a partir de descripciones escritas. Más tarde, en abril de este año, presentaron la versión 2.0 de esta herramienta, Stable Audio 2.0, la cual amplió aún más sus funciones al permitir la generación de pistas completas de alta calidad que podían durar hasta tres minutos, e incluso generar audio a partir de audio.

Ahora, Stability.AI sorprende al mundo presentando su último avance, el Stable Audio Open, un modelo de texto a audio de código abierto destinado a crear cortas muestras de audio, efectos sonoros y elementos de producción basados en instrucciones escritas. A diferencia de las versiones anteriores, este modelo se enfoca en generar sonidos específicos para ser utilizados en la producción musical y el diseño de sonido.

Según lo expresado en un comunicado en su página web, Stable Audio Open se distingue de su predecesor por su capacidad para producir pistas de audio completas con una estructura musical coherente de hasta tres minutos, además de poseer habilidades avanzadas en composición musical. Sin embargo, Stable Audio Open se especializa en la creación de clips musicales cortos, ofreciendo así una visión innovadora de inteligencia artificial para el diseño de sonido, priorizando el desarrollo responsable junto a las comunidades creativas.

De acuerdo con la compañía, este novedoso modelo permite a los usuarios generar hasta 47 segundos de datos de audio de alta calidad a partir de un simple mensaje de texto, posibilitando la creación de ritmos de batería, riffs de instrumentos, sonidos ambientales y otras muestras sonoras. Además, al ser un modelo de código abierto, los usuarios tienen la libertad de ajustar el modelo según sus necesidades, utilizando incluso sus propios datos de audio personalizados.

Para garantizar el respeto a los derechos de los creadores, el nuevo modelo ha sido entrenado con datos de audio de FreeSound y Free Music Archive, estableciéndose así como un modelo de audio abierto que busca proteger la propiedad intelectual. En este sentido, Stability.AI ha destacado que Stable Audio Open está disponible a través de Hugging Face, permitiendo que diseñadores de sonido, músicos y desarrolladores descarguen el modelo y exploren sus increíbles capacidades.

En definitiva, esta jóven empresa tecnológica ha sentado las bases para una revolución en la generación de audio, ya que su compromiso con el desarrollo responsable y abierto promete seguir innovando y mejorando en esta fascinante tecnología.