Así funciona Voyager, un agente de software que juega Minecraft con información e inteligencia proporcionadas por GPT-4
"Muestra una excepcional destreza jugando", aseguran sus investigadores: obtiene tres veces más objetos, viaja dos veces más lejos y desbloquea hitos 15 veces más rápido que los agentes de software anteriores de última generación.

Un equipo de investigadores de Caltech, Stanford, la Universidad de Texas y NVIDIA ha creado y compartido un agente de software denominado Voyager que juega a Minecraft con los conocimientos y la inteligencia proporcionados por GPT-4. Voyager aprende, recuerda y muestra lo que el equipo denomina una "excepcional destreza jugando a Minecraft", obteniendo 3 veces más objetos, viajando 2 veces más lejos y desbloqueando hitos 15 veces más rápido que los agentes de software anteriores de última generación. También es bastante bueno innovando.

"Voyager es capaz de utilizar la biblioteca de habilidades aprendidas en un nuevo mundo de Minecraft para resolver tareas novedosas desde cero, mientras que otras técnicas tienen dificultades para generalizar", informan los investigadores.

Llegados a este punto, tenemos que empezar a preguntarnos: ¿hay algo que GPT-4 no pueda hacer? 

Por supuesto, los grandes modelos lingüísticos tienden a alucinar y a lanzarse a inventar datos al azar, como descubrió dolorosamente un abogado que supuestamente utilizó ChatGPT para investigar.

El proyecto Voyager demuestra, sin embargo, que emparejando las habilidades de GPT-4 con un software agente que almacena las secuencias que funcionan y recuerda las que no, los desarrolladores pueden conseguir resultados asombrosos.

"Las habilidades desarrolladas por Voyager se extienden temporalmente, son interpretables y compositivas, lo que compone rápidamente las capacidades del agente y alivia los olvidos catastróficos", informan los investigadores.

Lo interesante de Minecraft es que es un juego de mundo abierto. No hay objetivos predeterminados, niveles requeridos ni tramas fijas. Eso recompensa la exploración abierta y requiere habilidades bastante generales y un amplio aprendizaje. También requiere cierto nivel de motivación para explorar y buscar nuevas tareas, que los investigadores proporcionaron generando un "plan de estudios" mediante GPT-4 centrado en el descubrimiento.

A medida que Voyager aprendía cosas nuevas, sus desarrolladores almacenaban las capacidades en una "biblioteca de habilidades" a través de un programa también generado por GPT-4.

Si lo combinamos todo con un mecanismo iterativo de indicaciones que se autocorrige, los investigadores consiguieron capacidades significativas en comparación con agentes de software anteriores que no utilizaban GPT-4.

"En comparación con las líneas de base, Voyager desbloquea el nivel de madera 15,3 veces más rápido (en términos de las iteraciones de incitación), el nivel de piedra 8,5 veces más rápido, el nivel de hierro 6,4 veces más rápido, y Voyager es el único que desbloquea el nivel de diamante del árbol tecnológico", informan los investigadores.

La Voyager también aprende con éxito en tareas realmente nuevas, fabricando con éxito picos de diamante, espadas de oro, cubos de lava y brújulas sin entrenamiento ni conocimientos previos.

Los investigadores y asesores del proyecto son Guanzhi Wang de NVIDIA y CalTech, Yuqi Xie de la Universidad de Texas en Austin, Yunnan Jiang de Stanford, Ajay Mandlekar de NVIDIA, Chaowei Xiao1 de NVIDIA y ASU, Yuke Zhu de NVIDIA, Linxi "Jim" Fan de NVIDIA y Anima Anandkumar de NVIDIA y Caltech.

 

Nota publicada en Forbes US.