Solo una semana después de haber anunciado la llegada de chatbot Gemini como sustituto de Bard, y de abrir la disponibilidad de Gemini Ultra, su modelo más avanzado, la compañía acaba de anunciar la llegada de la nueva generación de su modelo de inteligencia artificial: Gemini 1.5, que desde hoy ya se encuentra disponible para algunos usuarios.

Se trata de una actualización del modelo, que según la propia compañía, utiliza un nuevo enfoque de "Mezcla de Expertos" destinado a mejorar la eficiencia, al dirigir las solicitudes realizadas por los usuarios a un subgrupo de redes neuronales "expertas" más pequeñas, capaces de ofrecer respuestas más rápidas y de mayor calidad.

Gemini 1.5 amplía el número de tokens a 1.000.000

La primera versión de Gemini 1.5 está disponible a través del modelo Gemini Pro. En ese sentido, Google explica que ofrece una calidad de respuestas comparable a la de Gemini 1.0 Ultra, pero con un consumo de recursos notablemente inferior.

Una de sus principales novedades está en la ampliación del número de tokens que el modelo es capaz de procesar. Si hasta ahora el límite estaba en 200.000 tokens (Claude 2.1, modelo de Anthropic), se ha logrado ampliar la ventana de contexto hasta alcanzar la más grande vista hasta ahora en cualquier modelo fundacional a gran escala. Gemini 1.5 amplía el número de tokens hasta 1 millón.

Dado que se trata de un sistema con capacidades multimodales, esta ampliación en la ventana de contexto implica que Gemini 1.5 abre nuevas formas de interacción con el modelo, que van desde interpretar libros completos, colecciones de documentos extensas, vídeos de larga duración (como películas o series completas), audios o decenas de miles de líneas de código.

Transcribe libros enteros

En un video difundido por Google a modo de presentación, se puede ver a Gemini 1.5 Pro analizando, clasificando y resumiendo las transcripciones de las 402 páginas de la misión Apollo 11 a la Luna.

Gemini transcribiendo libro entero

Con Gemini 1.5, Google también ha conseguido establecer una arquitectura más eficiente, lo que permite al modelo aprender tareas complejas con mayor rapidez manteniendo la calidad.

Desde hoy, los desarrolladores y usuarios empresariales ya pueden comenzar a experimentar con Gemini 1.5 Pro a través de AI Studio y Vertex AI.

Más adelante, este modelo irá llegando al resto de servicios y plataformas basadas en Gemini que la compañía ya ofrece a los usuarios.

Con la llegada de Gemini 1.5, además, Google también ha actualizado el modelo Gemini 1.0 para reducir el precio de su versión estable de cara a los desarrolladores que quieran crear servicios y plataformas basadas en la versión anterior del modelo.