Descubren que ChatGPT no puede sumar dos n�meros y nacen los planteos sobre sus l�mites intr�nsecos

Los LLMs, o modelos de lenguaje expandidos, tienen dificultades intr�nsecas a su propio dise�o que limitan las tareas que una inteligencia artificial generativa puede realizar, m�s all� de cu�ntos d�lares y recursos se inviertan en ella.

Pablo Wahnon Editor de Innovaci�n

Se da por sentado que una inteligencia artificial ser� muy buena en matem�ticas. Despu�s de todo se trata de computadoras. Sin embargo, las Inteligencias Artificiales generativas son completamente diferentes a otros programas de computaci�n.�

En lugar de seguir un algoritmo para realizar un c�lculo simple, como la suma de dos n�meros, las IA generativas deben descubrir c�mo hacer esos c�lculos mediante entrenamientos realizados sobre un modelo que utiliza t�cnicas proveniente de un �rea de la computaci�n conocida como redes neuronales. No es que siguen una receta que les indica c�mo hacer una suma sino que la aprenden tras un proceso de ensayo y error.�

El modelo de una IA generativa se basa en una recopilaci�n de datos que provienen del mismo lenguaje. A estos modelos se los conoce como LLM o Large Language Model en ingl�s. No hay un consenso de c�mo traducir ese t�rmino. Puede ser modelo de lenguaje grande o modelo de lenguaje extenso. Pero me inclino por modelo de lenguaje expandido. Para entenderlo veamos un ejemplo:

Un LLM intenta comprender la sint�ctica de un lenguaje para poder mantener un di�logo con los humanos, y realizar tareas como contestar preguntas o asistir con soluciones a pedidos de todo tipo: desde escribir un poema hasta aconsejar la mejor dieta.�
�

Greg Brockman, presidente de OpenAI en la tapa de Forbes

Para realizar esa tarea se troza el lenguaje en part�culas ling��sticas y se intenta estudiar cu�l es al probabilidad de que se articulen de una u otra manera como para que el resultado sea algo que est� bien escrito. Por ejemplo si el texto ingresado al modelo es: “Esto est� bien escrito y es bonito. �A t� qu� te parece?”, el LLM trozar� �ese texto en part�culas desde palabras a s�labas, signos de puntuaci�n y otras estructuras. As� ese peque�o texto dentro del LLM se transformar� en un gran c�mulo de datos, desde el texto, hasta todas sus subvariantes que �adem�s pueden estar ordenadas de diversas maneras. De ah� que la traducci�n al castellano de LLM, large language model, pudiera ser: Modelo de lenguaje expandido.

Mediante un entrenamiento basado en redes neuronales que es muy intensivo en c�mputo, finalmente el LLM va descubriendo la sint�ctica y a partir de eso comienza a poder escribir bien. �El LLM va encontrando patrones que lo gu�an en c�mo escribir.�

Los inicios de esta forma de hacer las cosas fueron confusos. No estaba claro que diera resultado, ni era f�cil c�mo trozar el lenguaje y cu�nta informaci�n ingresar para entrenar el modelo, y adem�s que ese proceso de entrenamiento pueda resolverse en un tiempo de c�mputo razonable.�

Durante dos d�cadas las redes neuronales naufragaron dentro de papers acad�micos. Pero se fueron refinando los modelos y armando centros de c�mputos espec�ficos, de cientos de procesadores, como los de Intel y AMD, acompa�ados con GPUs (procesadores gr�ficos pero que tambi�n sirven para tareas de procesamiento matem�tico adicionales, por ejemplo se usan para minar los bitcoins). �

El proceso esta limitado porque es no lineal, agregar mas y mas part�culas de texto, requiere cada vez m�s poder de c�mputo. En la actualidad hay una carrera de arquitectura de c�mputo para que el rendimiento de los procesadores logre achatar esa curva que se hace exponencial a medida que se agregan m�s part�culas de lenguaje, como se mostr� en el reciente lanzamiento de la plataforma AMD Instintc en San Francisco la semana pasada. Esa plataforma logra incluso correr un modelo directamente en memoria posibilitando un nuevo tipo de rendimiento dentro de los centros de datos dedicados a la IA generativa.�

Lisa Su, la CEO de AMD hoy es una referente en la industria por la gran recuperaci�n que logr� en la compa��a. En la actualidad el marketcap de AMD (su valor por bolsa) supera al de su archirival Intel, algo impensable a�os atr�s. La apuesta de AMD por la inteligencia artificial es algo que ya tom� nota el mercado, y la acci�n de AMD subi� 100% este a�o.�

Mientras las esperanzas de que todo pudiera funcionar no estaban claras en 2017 surgi� un momento impactante. En OpenAI, para simplificar el modelo s�lo tomaron los signos de puntuaci�n de los reviews de Amazon. O sea prescindieron de los textos en s�, salvo su longitud. "Y lo que obtuvimos fue una nueva forma de clasificar el sentimiento que hab�a detr�s del texto. Ese fue un gran resultado. El modelo puede predecir si el review de Amazon ser� positivo o negativo, s�lo viendo esos signos de puntuaci�n. Ese d�a vimos que pod�amos hacer emerger la sem�ntica desde la sint�ctica. Y dijimos: �Wow, tenemos que escalar esto!”, se entusiasma Greg Brockman, fundador de OpenAI.�

A partir de ese momento las cosas avanzaron y as�, tras una inyecci�n de US$ 10.000 millones por parte de Microsoft, y cinco a�os de entrenamientos intensivos, se lleg� a la situaci�n actual donde ChatGPT llev� la inteligencia artificial generativa a la punta de tus dedos.�

Sam Altman, CEO de OpenAI

Sam Altman a�n recuerda la primera gran sorpresa que se llev� cuando le pidieron a ChatGPT que escriba un n�mero de 40 cifras. “Realmente fue una sorpresa no era un n�mero que el sistema haya visto y probar cada numero hasta llegar a esas cifras era como esperar la edad del universo. Entonces de alg�n modo entendi� qu� se le ped�a, pudo deducir la regla sint�ctica relacionada con la cantidad de cifras y nos dio un n�mero que cumpl�a lo pedido”, se jacta Altman.

Sin embargo, luego le pidieron que de otro n�mero de 35 cifras, y finalmente que sume ambos n�meros. Se trata de una tarea que un ni�o de tercer grado podr�a hacer. Simplemente se encolumnan los n�meros y se van sumando sus cifras. Pero ChatGPT no descubri� esta regla y da resultados equivocados, aunque “algunas veces acierta”, se conforma Altman. Por otra parte estas redes neuronales son cajas negras: no saben precisamente c�mo llegan al resultado sino que �ste es la acumulaci�n de la experiencia de su entrenamiento, como si probaran millones de veces hasta que “se dan cuenta” como se hace.�
�

ChatGPT no sabe c�mo sumar n�meros grandes

Una tarea matem�tica sumamente simple para los humanos y m�s que trivial para las computadoras est� por fuera de lo que ChatGPT pudo aprender a partir de sus modelos de entrenamiento. Es que no es tan f�cil hacer emerger la sem�ntica desde la sint�ctica. Veamos lo que dice el mismo ChatGPT y luego la conclusi�n final.

Pablo Wahnon:� �C�mo es que sabes sumar?

ChatGPT: �Como modelo de lenguaje entrenado por OpenAI, tengo conocimiento sobre una amplia variedad de temas, incluyendo matem�ticas b�sicas como la suma. Durante mi entrenamiento, fui expuesto a grandes cantidades de texto que abarcaban diversos temas, lo que me permite responder preguntas y resolver problemas matem�ticos simples. Mi capacidad para sumar se basa en el conocimiento y los patrones matem�ticos que adquir� durante ese entrenamiento. Si tienes una pregunta espec�fica sobre la suma o cualquier otra operaci�n matem�tica, estar� encantado de ayudarte.

PW: Pero no es que sumas como lo hace una computadora normalmente, �no?

ChatGPT: �Como modelo de lenguaje, mi funci�n principal es generar respuestas basadas en el contexto proporcionado y en el conocimiento que he adquirido a trav�s de mi entrenamiento. Si bien puedo realizar operaciones matem�ticas b�sicas como la suma, no lo hago de la misma manera que una computadora normal.

Las computadoras utilizan un conjunto espec�fico de instrucciones y algoritmos dise�ados para realizar operaciones matem�ticas de manera eficiente y precisa. Por otro lado, como modelo de lenguaje, mi enfoque principal es comprender y generar texto coherente y relevante. Esto significa que puedo responder preguntas matem�ticas simples, incluida la suma, pero mi capacidad para hacerlo se basa en la comprensi�n del lenguaje y los patrones en los datos que se me han proporcionado.

PW: Vi que, por ejemplo, un n�mero de 40 cifras sumado a uno de 35 cifras no lo hac�as bien, o sea no encolumnabas los n�meros para as� sumarlos.

ChatGPT: �Como modelo de lenguaje basado en texto, no tengo la capacidad de realizar operaciones matem�ticas con n�meros de forma directa. Aunque puedo entender y generar texto relacionado con problemas matem�ticos y conceptos, no tengo la funcionalidad de una calculadora o una computadora convencional para llevar a cabo c�lculos num�ricos detallados.

PW: Pero, �por qu� s� has descubierto c�mo sumar algunos n�meros y otros no?

ChatGPT: Como modelo de lenguaje, mi capacidad para realizar operaciones matem�ticas se basa en el conocimiento y los patrones que he aprendido durante mi entrenamiento con grandes cantidades de texto. Durante ese proceso, he adquirido cierta comprensi�n de conceptos matem�ticos b�sicos y puedo responder preguntas relacionadas con ellos.
�

La IA generativa aprende de una forma contradictoria con el saber cient�fico

Sin embargo, hay l�mites para mi conocimiento matem�tico y la precisi�n de mis respuestas. Puedo realizar sumas de n�meros peque�os y medianos con relativa precisi�n, pero hay casos en los que mi capacidad puede verse limitada. Esto puede ocurrir cuando se trata de sumar n�meros extremadamente grandes, con muchos d�gitos o cuando se requieren operaciones m�s complejas.

PW: �Y con m�s entrenamiento, �podr�as sumar todo tipo de n�meros o tener m�s precisi�n es algo que va m�s all� del entrenamiento?

ChatGPT: El entrenamiento adicional podr�a ayudar a mejorar mi capacidad para realizar sumas y otras operaciones matem�ticas, pero hay l�mites inherentes a mi estructura como modelo de lenguaje. Aunque m�s entrenamiento podr�a permitirme adquirir un conocimiento m�s amplio y sofisticado, es importante tener en cuenta que no fui dise�ado espec�ficamente para realizar c�lculos num�ricos complejos.

La precisi�n en operaciones matem�ticas depende no solo del entrenamiento, sino tambi�n de la arquitectura subyacente del modelo y de las limitaciones computacionales. Aunque el entrenamiento adicional podr�a ayudar a mejorar ciertos aspectos, hay tareas matem�ticas espec�ficas que pueden requerir algoritmos y enfoques especializados m�s all� de la capacidad de un modelo de lenguaje basado en texto como yo.

Para obtener resultados precisos y confiables en operaciones matem�ticas complejas, es recomendable utilizar herramientas y software matem�ticos especializados que est�n dise�ados espec�ficamente para este prop�sito. Estas herramientas est�n optimizadas para realizar c�lculos num�ricos precisos y manejar n�meros grandes o complejos de manera eficiente.

Conclusi�n Final. Como lo dice el mismo ChatGPT, el modelo, la idea de simular todo a partir de LLMs tiene l�mites que son inherentes al modelo, no se resuelven por poner m�s computadoras y m�s tiempo de entrenamiento. Por supuesto, uno puede poner otros softwares complementarios como uno espec�fico para tareas matem�ticas. Si en algun momento surge una AGI, o Inteligencia Artificial General, lo m�s probable es que se trate del director de una orquesta, donde cada instrumento ser� un sabor dentro de las inteligencias artificiales posibles. Mientras tanto entender qu� puede y qu� no hacer una IA generativa es muy importante para que nos ayude a resolver problemas y nos impulse a desarrollar nuestra propia innovaci�n.

�

Te puede interesar