Forbes Uruguay
Sundar Pichai Google
Innovacion

Google presentó Gemini 1.5: quiénes pueden acceder

Richard Nieva

Share

El gigante tecnológico anunció avances en el contexto y la eficiencia de su modelo de próxima generación. Cuándo se podrá probarlo.

16 Febrero de 2024 09.25

Google DeepMind presentó el jueves la última versión de su gran modelo lingüístico, llamado Gemini 1.5. Se trata de la tecnología en la que se basa su chatbot, con el que busca competir contra el rival ChatGPT de OpenAI. El gigante tecnológico afirma que su nuevo modelo hizo grandes avances en contexto, velocidad y eficacia. 

Gemini 1.5 Pro, la versión intermedia del modelo, puede ejecutar hasta 1 millón de "tokens" -las unidades de construcción de los modelos de IA generativa-, aunque actualmente sólo está disponible para un grupo limitado de desarrolladores y primeros usuarios en una vista previa privada. En comparación, GPT-4 Turbo, el modelo de gama alta de OpenAI, tiene un límite de 128.000 tokens. 

Google gemini
 

Google afirmó que su modelo de nivel medio 1.5 Pro rinde a la par que Gemini 1.0 Ultra, la versión más potente de la generación anterior del modelo.

En los videos de demostración, los investigadores subieron una transcripción del alunizaje de la NASA y pidieron al modelo que generara citas divertidas (y precisas) a partir de ella. A continuación, el investigador cargó un sencillo dibujo lineal de un pie dando un paso y pidió al modelo que señalara el momento de la transcripción al que se refería el dibujo. Gemini fue capaz de entender el dibujo y señalar al investigador la famosa cita de Neil Armstrong: "Un pequeño paso para el hombre, un gran salto para la humanidad". 

En otra demostración, un investigador pide a Gemini que traduzca un texto al inglés del kalamang, una lengua papú poco hablada y con sólo unos cientos de hablantes en el mundo. El cálculo tardó entre 30 y 50 segundos por cada pregunta de las demostraciones.

Google DeepMind Gemini
 

El lanzamiento por ahora es sólo una "versión de investigación", disponible únicamente para los desarrolladores de software y los clientes de la nube de Google, pero no para el público en general. 

La estrategia de lanzamiento contrasta con la de rivales como Meta, que abrió su modelo LLaMA 2 el año pasado y lo hizo ampliamente disponible para su uso sin apenas restricciones. 

El despliegue también difiere del lanzamiento original de Google de Gemini 1.0, que estuvo disponible inmediatamente para los consumidores.

Google DeepMind Oriol Vinyals
 

"En cierto modo tiene sentido ver lo que las mentes creativas -alguien que tenga mentalidad de desarrollador- pueden hacer con el modelo", dijo Oriol Vinyals, vicepresidente de investigación de Google DeepMind, durante una reunión informativa con periodistas el miércoles. Añadió que los desarrolladores también ayudarán a la empresa a “entender cómo este modelo importará a los usuarios, en última instancia”.

Finalmente, Google dijo que planea publicar Gemini 1.5 para los consumidores, pero descartó dar una línea de tiempo.

La publicación del nuevo producto sigue a varios cambios que Google hizo recientemente en su estrategia de IA. La semana pasada, la empresa cambió el nombre de su chatbot Bard, llamándolo en su lugar Gemini, en honor al propio modelo de IA.

modelo inteligencia artificial
 

Otro servicio llamado Duet AI, que permite utilizar la IA generativa en los productos de productividad de Google como Docs y Gmail, también fue rebautizado como Gemini para Google Workspace. Además, la empresa estrenó una nueva aplicación Gemini para su sistema operativo celular Android, e hizo que estuviera disponible a través de la aplicación Google existente en los iPhones.

Google introdujo por primera vez sus modelos Gemini en diciembre, estrenando tres versiones de la tecnología con distintos niveles de capacidad. 

Pixel 8 and Pixel 8 Pro
 

La versión más pequeña, Gemini Nano, puede ejecutarse localmente en los teléfonos y se está utilizando para las funciones del smartphone insignia de Google, Pixel 8 Pro, incluido el resumen de funciones en la app grabadora. 

La versión de nivel medio, Gemini Pro, impulsa el chatbot Gemini disponible de forma gratuita para los consumidores (antes Bard). 

La versión más grande, Gemini Ultra, impulsa una versión premium del bot llamada Gemini Advanced, solo disponible a través de una suscripción de 19,99 dólares al mes a Google One, el servicio de pago de la empresa para ventajas como almacenamiento adicional y supervisión de la seguridad.

 

Nota publicada en Forbes US. 

10