24h España.

24h España.

La inteligencia artificial de Meta se suma a la creación de pódcast a partir de documentos de texto.

La inteligencia artificial de Meta se suma a la creación de pódcast a partir de documentos de texto.

En un movimiento innovador, Meta ha presentado una nueva herramienta de código abierto que utiliza sus potentes modelos de lenguaje grande (LLM) llamada NotebookLlama, la cual transforma anotaciones en un formato de audio tipo pódcast, al estilo de NotebookLM de Google.

Esta novedosa herramienta, descrita como "una versión de código abierto de NotebookLM" por los propios ingenieros de Meta, ha sido compartida en GitHub, donde se detalla su funcionamiento.

Para utilizar NotebookLlama, basta con introducir un documento en formato pdf, el cual será procesado, analizado, limpiado y resumido con la ayuda de Llama 3.2 (1B-Instruct); posteriormente, se transcribe con Llama 3.1 (70B-Instruct), un modelo de LLM que brinda transcripciones más creativas.

Además, se puede optar por el modelo Llama 3.1 (8B-Instruct) para otorgar a la transcripción un toque más dramático. Finalmente, se emplea tecnología de texto a voz para convertir la transcripción en un pódcast conversacional.

Este nuevo desarrollo de Meta recuerda a la función 'Audio Overviews' de NotebookLM de Google, la cual genera un pódcast a partir de las notas guardadas por el usuario. Aunque la compañía reconoce que las voces aún no suenan completamente naturales y los agentes de voz no respetan el turno de palabra, lo que dificulta su uso en formato de debate.