Google anuncia Gemini 1.5 centrado en tareas más complejas

Google anuncia Gemini 1.5 centrado en tareas más complejas

Google presentó este jueves (15) la actualización a Gemini 1.5, una nueva versión del modelo de lenguaje que se utiliza para procesar información del chatbot que lleva el mismo nombre. El lanzamiento promete un rendimiento mejorado y más eficiencia en el procesamiento de la información.

La actualización se hace pública apenas unos meses después del anuncio de la primera versión, en diciembre de 2023, que puso a Google en competencia con OpenAI, propietario de los modelos de lenguaje GPT-3 y GPT-4 (LLM).

Más rendimiento

El nuevo paquete es completamente incremental y se centra en las mejoras. Para ello, Google exploró una nueva arquitectura conocida como Mezcla de Expertos (MoE), que divide los modelos en pequeñas redes neuronales "especializadas" en lugar de una red gigante.

Este proceso garantiza una mayor eficiencia y ayuda a procesar tareas más complejas rápidamente. La ventaja también se aplica al entrenamiento de Gemini, que se ha vuelto más rápido con la actualización.

No en vano, Google afirma que el Gemini 1.5 Pro tiene un rendimiento similar al Ultra 1.0, el modelo más avanzado de la compañía hasta la fecha; vale la pena recordar que el modelo tiene tres tamaños: Nano (en los móviles Pixel), Pro (disponible en el chatbot Gemini) y Ultra (disponible en Gemini Advanced).

"Cuando se probó con un panel completo de evaluaciones de texto, código, imagen, audio y video, 1.5 Pro supera a 1.0 Pro en el 87% de los puntos de referencia utilizados para desarrollar nuestros LLM", dijo la compañía.

Más fichas

La versión 1.5 también amplió el tamaño de la ventana de contexto, que es el límite de información que se puede aplicar simultáneamente al modelo. Este límite se establece en función de la cantidad máxima de tokens, es decir, bloques utilizados para procesar datos.

De los 32 mil tokens de la versión 1.0, Gemini 1.5 ahora admite hasta 1 millón de tokens. Cantidad que, según Google, permite analizar 1 hora de vídeo, 11 horas de audio, 30 mil líneas de código o más de 700 mil palabras.

La empresa incluso utilizó Gemini 1.5 para analizar el PDF con la transcripción de la misión Apolo 11, que llevó al hombre a la luna, como ejemplo. Al solicitar los momentos cómicos de los discursos, el algoritmo tardó apenas unos segundos en leer las 402 páginas del documento y dar una respuesta.

Gemini 1.5 todavía está en pruebas

Por ahora, Google lanzará Gemini 1.5 sólo para la versión Pro, pero aún se encuentra en fase de prueba. A partir de este jueves (15), los desarrolladores y clientes corporativos podrán probar la nueva versión a través de AI Studio o Vertex AI en un contexto limitado.

Además, la compañía ofrece inicialmente Gemini 1.5 Pro con soporte para sólo 128 mil tokens. Posteriormente, con mejoras en el modelo, la empresa pretende presentar otros planes para ofrecer hasta 1 millón de tokens.

"Los primeros evaluadores pueden probar la ventana de contexto de 1 millón de tokens sin costo durante el período de prueba, aunque deberían esperar tiempos de latencia más largos con esta característica experimental", agregó la compañía.

No hay fecha de lanzamiento para Gemini 1.5 al público en general, incluido el chatbot que lleva el mismo nombre.

Subir