24h España.

24h España.

Meta lanza Llama 3.2, su nueva herramienta de lenguaje multimodal de código abierto.

Meta lanza Llama 3.2, su nueva herramienta de lenguaje multimodal de código abierto.

En el marco del evento Meta Connect 2024, la compañía tecnológica Meta ha presentado su último avance: el primer modelo de lenguaje multimodal Llama 3.2, que incluye modelos de tamaño pequeño y mediano de 11B y 90B, capaces de procesar tanto imágenes como texto, junto con modelos más ligeros de solo texto 1B y 3B.

Este nuevo modelo, que llega dos meses después de la presentación de Llama 3.1, marca un hito al introducir la capacidad de procesar imágenes por primera vez en la empresa.

El modelo Llama 3.2 cuenta con dos modelos multimodales de tamaño pequeño y mediano, con 11.000 millones y 90.000 millones de parámetros respectivamente. Estos modelos permiten realizar tareas como comprender gráficos y diagramas, subtítulos de imágenes y la localización de objetos en imágenes.

Con Llama 3.2, es posible extraer detalles de una fotografía, comprender la escena y generar oraciones que podrían servir como título de la imagen o como inicio de una historia.

Además, se han desarrollado modelos más pequeños, 1B y 3B, específicamente diseñados para procesar texto y funcionar en dispositivos como smartphones. Estos modelos son ideales para resolver múltiples tareas con baja latencia y cuentan con una longitud de contexto de 128.000 tokens.

La capacidad de estos modelos para ejecutarse localmente garantiza respuestas instantáneas y una total privacidad al no enviar datos a la nube. Según Meta, el rendimiento de los modelos 3.2 11B y 90B es competitivo con los modelos líderes en reconocimiento de imágenes, mientras que el modelo 3B es superior en tareas de seguimiento de instrucciones y resumen.

Meta evaluó el rendimiento de estos modelos en más de 150 conjuntos de datos de referencia en diversos idiomas para llegar a estas conclusiones. El modelo de lenguaje Llama 3.2 de código abierto ya está disponible para todos los desarrolladores, y todas sus capacidades han sido integradas en el asistente de IA de Meta, Meta AI.