24h España.

24h España.

Google revoluciona el panorama tecnológico con avances en IA y un asistente universal en camino.

Google revoluciona el panorama tecnológico con avances en IA y un asistente universal en camino.

El gigante tecnológico Google ha puesto toda su confianza en la inteligencia artificial (IA) con el lanzamiento de Gemini, una familia de modelos de lenguaje avanzados que marcan el camino hacia el tan esperado asistente inteligente universal mencionado en Project Astra. Con estas herramientas, la compañía busca ofrecer a los usuarios agentes capaces de realizar tareas por ellos y crear nuevas capacidades gracias a una mayor ventana de contexto en su modelo estrella, Gemini 1.5 Pro.

En el marco de su evento anual para desarrolladores Google I/O, celebrado este martes, se ha confirmado que Gemini es la apuesta de Google por avanzar en la inteligencia artificial general, es decir, una IA responsable que realmente se traduzca en beneficios para las personas en su vida diaria.

Actualmente, la familia de modelos Gemini impulsa las principales funciones de IA de los servicios de la compañía. Gemini 1.5 Pro destaca por su ventana de contexto de hasta un millón de tokens, lo que le otorga capacidades de razonamiento, planificación y comprensión mucho más avanzadas.

Desde este martes, Gemini 1.5 Pro está disponible para todos los desarrolladores a nivel global. Además, con la suscripción Gemini Advanced, se ampliará su ventana de contexto a 2 millones de tokens para finales de año, aunque primero estará disponible en una vista previa privada.

En colaboración con Google DeepMind, la familia de modelos de lenguaje se expande con el lanzamiento de Gemini 1.5 Flash, una versión más ligera que la Pro y optimizada para tareas comunes como resúmenes o traducciones. Esta versión puede ser probada en Google AI Studio y Vertex AI con un millón de tokens.

Gemini también impulsa los agentes inteligentes, sistemas con capacidad de razonamiento, planificación y memoria que ayudan a los usuarios en diversas tareas, con el respaldo de servicios de Google como Gmail o Chrome.

Por otro lado, Google ha actualizado las herramientas de inteligencia artificial generativa agrupadas bajo Generative Media, enfocadas en la creación de imágenes, música y videos, en las que ha estado trabajando en los últimos meses.

Una de las novedades es la versión 3 de Imagen, en fase de pruebas en Labs, que ofrece resultados más fotorrealistas al crear imágenes detalladas y de alta calidad a partir de descripciones que los usuarios pueden completar con todos los matices deseados.

Music AI Sandbox, por su parte, proporciona un conjunto de herramientas de IA para componer canciones de calidad profesional, mientras que Veo genera videos en alta definición (1080p) a partir de texto, imágenes y propuestas de video, con la posibilidad de añadir efectos mediante la función experimental VideoFx.

Project Astra, una apuesta de Google DeepMind, anticipa lo que la compañía espera que se convierta en un asistente universal en el futuro. A través de Gemini, este asistente multimodal ve el mundo a través de la cámara del teléfono inteligente, permitiendo al usuario hacer preguntas y obtener información visual contextualizada.

Adicionalmente, Google ha presentado la sexta generación de unidades de procesamiento Tensor (TPU), llamada Trillim, que incrementa significativamente la capacidad de cálculo y ha sido fundamental en el entrenamiento de modelos como Gemini 1.5 Flash, Imagen 3 y Gemma 2.

Además, la familia de modelos de lenguaje de código abierto de Google se ha ampliado con PaliGemma, un modelo de lenguaje visual destinado a tareas relacionadas con imágenes, subtítulos, preguntas visuales y comprensión de textos en imágenes.

Próximamente, esta familia se expandirá con Gemma 2, una nueva generación con 27.000 millones de parámetros (27B), diseñada para ofrecer un rendimiento similar al de Llama 3 de Meta, que cuenta con 70.000 millones de parámetros. Gemma 2 estará optimizado para ejecutarse en GPU Nvidia en un solo TPU en Vertex AI.