Forbes Uruguay
Donald Trump
Negocios

Por qué Trump considera a DeepSeek un "llamado de atención" para Silicon Valley

Rashi Shrivastava

Share

DeepSeek afirma que su nuevo modelo de inteligencia artificial es tan bueno como los de sus rivales estadounidenses, es más barato de construir y está disponible de forma gratuita. ¿Qué significa eso para la supremacía de la inteligencia artificial de EE. UU.?

28 Enero de 2025 10.12

Una empresa china llamada DeepSeek, que recientemente publicó como código abierto un modelo de lenguaje avanzado que afirmó estar a la altura de los sistemas de inteligencia artificial más potentes de OpenAI, se convirtió en el centro de atención de la comunidad tech. Su tecnología recibió elogios como uno de los mejores desafíos de código abierto a los modelos estadounidenses de primer nivel, avivó las preocupaciones sobre la fortaleza de China en la creciente carrera internacional por el desarrollo de IA y motivó a las startups estadounidenses a replantearse su trabajo después de que un rival extranjero lograra tanto con tan pocos recursos.

A fines de diciembre, este pequeño laboratorio chino, con sede en Hangzhou, presentó V3, un modelo de lenguaje con 671 mil millones de parámetros, que supuestamente entrenó en solo dos meses por apenas 5,58 millones de dólares. Ese costo resultó órdenes de magnitud inferior al de GPT-4 de OpenAI, un modelo más grande con un estimado de 1,8 billones de parámetros, desarrollado con un presupuesto de 100 millones de dólares.

La semana pasada, DeepSeek lanzó otro desafío al presentar un modelo llamado R-1, del cual aseguró que rivaliza con el modelo o1 de OpenAI en lo que se denomina "tareas de razonamiento", como programación y resolución de problemas complejos de matemáticas y ciencias. Mientras que OpenAI cobra a sus usuarios 200 dólares mensuales por acceder a estos modelos, DeepSeek los ofreció de manera gratuita.

El poder del modelo de DeepSeek y su política de precios ya transformaron la forma en que las startups estadounidenses de inteligencia artificial manejan sus negocios. "Es una alternativa económica y convincente a las ofertas de gigantes como OpenAI", comentó Jesse Zhang, CEO de Decagon, una empresa que desarrolla agentes de IA para atención al cliente, a la revista Forbes. Según él, este nuevo modelo obligará a gigantes estadounidenses como OpenAI y Anthropic a reevaluar sus precios.

Por su parte, Eiso Kant, CTO y cofundador de Poolside AI, un unicornio especializado en IA para ingeniería de software, afirmó a Forbes que la fortaleza de DeepSeek radica en su capacidad de ingeniería para lograr más con menos.

"Lo que DeepSeek mostró al mundo es que, cuando ponés un fuerte énfasis en hacer que el entrenamiento sea eficiente en términos de cálculo, podés lograr muchísimo", dijo Kant. "Es increíble lo que todavía se puede exprimir de estos chips de Nvidia para hacerlos mucho más eficientes", agregó.

Con el modelo o1 de OpenAI aparentemente superado en ciertos indicadores, algunas startups ya adquirieron datos para entrenar sistemas más avanzados, señaló Manu Sharma, CEO de Labelbox, una empresa de etiquetado de datos. "Creo que la carrera hacia la inteligencia general artificial (AGI) se reinició de muchas maneras", expresó. "Vamos a ver mucha más competitividad en todos los niveles", completó.

Inteligencia artificial, ChatGPT, Grammarly
Con el modelo o1 de OpenAI aparentemente superado en ciertos indicadores, algunas startups ya adquirieron datos para entrenar sistemas más avanzados.

Alexandr Wang, el multimillonario CEO de Scale AI, una empresa líder en datos de entrenamiento, calificó al modelo como "revolucionario". Mientras tanto, Aravind Srinivas, CEO de Perplexity, una startup de búsquedas de IA valorada en 9 mil millones de dólares, afirmó que planea integrar el modelo en su principal producto de búsqueda. Por otro lado, la empresa de chips de IA Groq ya añadió el modelo R-1 de DeepSeek a sus unidades de procesamiento de lenguaje. (En junio, Forbes envió a Perplexity una carta de cese y desistimiento tras acusar a la startup de utilizar sus informes sin permiso).

Otros no se mostraron tan impresionados. La CEO de Writer, May Habib, dijo a Forbes que no le sorprendió que los modelos de DeepSeek, entrenados con un presupuesto significativamente menor, igualaran a los modelos más avanzados de Estados Unidos. En octubre, Writer lanzó un modelo que entrenó con solo 700.000 dólares, mientras que a OpenAI le costó 4,6 millones de dólares construir un modelo con capacidades similares. La empresa usó datos sintéticos para reducir sus costos de entrenamiento.

"Incluso antes de que el modelo de DeepSeek explotara en la escena, ya veníamos diciendo que estos modelos se están convirtiendo en una mercancía. Se están distribuyendo cada vez más", afirmó Habib.

Durante el fin de semana, mientras crecía el revuelo en torno a la compañía, DeepSeek superó a ChatGPT en la App Store de Apple, alcanzando el puesto número 1 en descargas gratuitas en Estados Unidos. Luego, el lunes, varias acciones tecnológicas estadounidenses cayeron bruscamente mientras se propagaba el pánico por el exitoso lanzamiento del modelo de DeepSeek. Al final del día, la capitalización de mercado del gigante de los chips de IA Nvidia perdió casi 600 mil millones de dólares.

Fue un cambio asombroso en el orden mundial de la IA. "Es un poco loco que alguien gaste cientos de millones de dólares en un modelo de código cerrado", comentó Greg Kamradt, presidente de ARC Prize, una organización sin fines de lucro que evalúa modelos de IA, a Forbes. "Y de repente aparece uno de código abierto que está ahí gratis para todos", enfatizó.

Durante semanas, los modelos de DeepSeek recibieron elogios de algunas de las figuras más prominentes del mundo de la IA, incluyendo al científico jefe de IA de Meta, Yann LeCun, al cofundador de OpenAI, Andrej Karpathy, y al investigador principal de Nvidia, Jim Fan. Pero la noticia del último logro de la compañía llevó a los pesos pesados de la IA en Estados Unidos a intentar descifrar cómo esta empresa china está logrando resultados tan impresionantes mientras gasta mucho menos dinero.

"DeepSeek R1 es el momento Sputnik de la IA", escribió en X el multimillonario inversor Marc Andreessen.

"El lanzamiento de DeepSeek, una IA de una empresa china, debería ser un llamado de atención para nuestras industrias de que debemos enfocarnos con láser en competir para ganar".

Donald Trump, Presidente de los Estados Unidos

A pesar de la grandilocuencia de los recientes anuncios sobre IA de la administración Trump, DeepSeek intensificó los temores de que Estados Unidos podría estar perdiendo su liderazgo en IA, particularmente porque logró tanto éxito a pesar de los estrictos controles de exportación de Estados Unidos que le impiden usar los chips de IA más avanzados de Nvidia.

El último logro de la compañía resulta un contrapunto contundente al Proyecto Stargate, una empresa conjunta entre OpenAI, Oracle y el conglomerado tecnológico japonés SoftBank, que planea invertir 500 mil millones de dólares en infraestructura de IA.

Donald Trump
El último logro de la compañía resulta un contrapunto contundente al Proyecto Stargate, una empresa conjunta entre OpenAI, Oracle y el conglomerado tecnológico japonés SoftBank, que planea invertir 500 mil millones de dólares en infraestructura de IA.

Antes de una reunión con los republicanos de la Cámara de Representantes en Florida el lunes, Trump reconoció la amenaza. "El lanzamiento de DeepSeek, una IA de una empresa china, debería ser un llamado de atención para nuestras industrias de que debemos enfocarnos con láser en competir para ganar", dijo.

Existen salvedades respecto al último logro de DeepSeek. Investigadores encontraron que los modelos de IA de la empresa tienden a autocensurarse en temas sensibles para el Partido Comunista Chino (PCC). La investigadora en seguridad Jane Manchun Wong dijo a Forbes que los modelos de DeepSeek no responden preguntas sobre el presidente chino Xi Jinping ni sobre las protestas de la Plaza Tiananmen de 1989. Más allá de esto, también hay preocupaciones sobre la privacidad. Según sus políticas, los datos ingresados en los modelos de DeepSeek se almacenan en servidores ubicados en China.

Divyansh Kaushik, vicepresidente de la firma de asesoría en seguridad nacional Beacon Global Strategies, advirtió a Forbes sobre el uso de DeepSeek sin una evaluación rigurosa. "A menos que podamos realizar evaluaciones claras sobre seguridad nacional y libertad de expresión en los modelos chinos, deberían tratarse como brazos de propaganda del PCC", afirmó. "Deberían tratarse como Huawei pero llevado al extremo", deslizó.

El problema radica en la propuesta de valor de DeepSeek: un modelo de razonamiento de IA de última generación que es gratuito y abierto en un mundo de IA cerrado y basado en tarifas, construido por empresas como OpenAI y Anthropic. "Es mucho mejor tener un modelo chino de código abierto que un modelo estadounidense de código cerrado", señaló Sharma de Labelbox.

 

*Con información de Forbes US.

10