IA generativa más allá del efecto "wow": conocimientos para gerentes que buscan resultados tangibles
Esade Business & Law School Colaborador
Esade Business & Law School Colaborador
"Cuando se trata de datos e inteligencia artificial (IA), todo el mundo busca el efecto wow, pero nuestro negocio trata del no-wow", me dijo una vez un alto directivo del sector bancario.
Otros directivos podrían tener sentimientos similares en estos días: probablemente sus feeds de LinkedIn estén inundados de noticias sobre ChatGPT y los grandes modelos lingüísticos (LLM), mientras ellos se afanan en sus operaciones empresariales cotidianas e intentan mantener los pies en el suelo.
Los LLM (y la IA Generativa) son prometedores como medio para impulsar significativamente la productividad gracias a su capacidad para crear texto, código e imágenes de alta calidad.
GitHub estima que sólo la generación automática de código por parte de los LLM podría aumentar el PBI mundial en más de 1,5 billones de dólares para 2030.
Sin embargo, algunos directivos de empresas no tecnológicas, tradicionales o pequeñas podrían percibir esto como una exageración, creyendo que no necesitan casos de uso avanzados o que el hardware necesario es inaccesible o inasequible.
A pesar de estas preocupaciones, existen algunas razones de peso por las que adoptar LLM puede proporcionar beneficios tangibles a empresas de todos los tamaños, agilizando sus procesos y mejorando su eficiencia diaria.
Cuando se trata de los LLM, es esencial que las empresas comprendan su verdadera versatilidad, que va mucho más allá de la mera generación de texto.
Mediante la elaboración de instrucciones precisas y eficaces, conocidas como "prompts", las empresas pueden aprovechar los LLM para realizar diversas tareas. La habilidad emergente y muy necesaria para hacerlo se denomina cada vez más frecuentemente ingeniería de avisos.
Imagínese dar instrucciones a un LLM para que identifique el lenguaje en las reseñas de los clientes, traduzca documentos corporativos o calibre el sentimiento de las quejas entrantes de los clientes.
Antes de la era de los LLM, para llevar a cabo estas tareas era necesario construir o adquirir sistemas independientes para cada función, lo que suponía un costo adicional para la recopilación de datos y el alojamiento del hardware.
Sin embargo, los precios de pago por uso de los LLM hacen que muchos de estos casos de uso sean más rentables en comparación con el gasto que supone desarrollar numerosos modelos especializados.
Como resultado, los LLM se están convirtiendo rápidamente en una tecnología polivalente para el desarrollo de diversas aplicaciones o, en la jerga de los innovadores, en un diseño dominante.
Aunque muchos de nosotros hemos experimentado con ChatGPT a través de su interfaz web, la IA y los competidores del chatbot también proporcionan la tecnología subyacente a través de API de software, lo que hace que sea sorprendentemente asequible y sencillo para los desarrolladores integrar sin problemas los LLM en sus aplicaciones y flujos de trabajo empresariales a gran escala.
Por ejemplo, Duolingo ya está aprovechando GPT4 para ofrecer a sus usuarios mejores comentarios, y Morgan Stanley ha desarrollado un caso de uso de recomendaciones financieras ajustando GPT4 con sus propios datos corporativos.
Además, proyectos de código abierto como langchain permiten escribir programas componiendo "cadenas" de instrucciones basadas en LLM. Podemos esperar ver aún más aplicaciones y soluciones creativas como éstas en el futuro.
Está claro que los LLM están posibilitando una nueva forma de programar con IA. Permiten a los desarrolladores especificar tareas mediante instrucciones lingüísticas sencillas y encajar los resultados como si fueran ladrillos de Lego.
Esta disrupción está reconfigurando el dilema tradicional de "comprar frente a hacer", ofreciendo la convincente alternativa de "hacer frente a comprar o adaptar a partir de un LLM."
Interrogar sus propios datos utilizando los LLM es otro caso de uso prometedor. Los LLM pueden responder a preguntas relacionadas con los datos si éstos se incluyen como parte de la pregunta.
Este es exactamente el enfoque que probó Boston Dynamics cuando utilizó ChatGPT para interrogar a un robot sobre su nivel de batería o su estado interno.
Esto estrena grandes oportunidades para las bases de conocimiento de las empresas. Ahora es técnicamente posible introducir un conjunto de documentos empresariales o registros de datos en un prompt y, a continuación, hacer preguntas sobre ellos. Algunos sugieren que este enfoque podría sustituir a las consultas SQL a largo plazo.
Debido a los esquemas de precios de los LLM, añadir muchos datos a los prompts conlleva unos costes elevados. Sin embargo, se están realizando esfuerzos para conectar las bases de datos de documentos con los LLM de formas más eficientes, como buscar los documentos más relevantes y añadir sólo esos al contexto.
A pesar de estos retos, el campo está progresando rápidamente y es evidente que los LLM están emergiendo como una nueva interfaz para interactuar con los datos.
Una de las fronteras más prometedoras en el mundo de la productividad reside en la capacidad de los LLM para "conectarse" o "calificar" a otros sistemas cuando sea necesario.
La estrategia de avisos ReAct, introducida por investigadores de Google y Princeton, permite a los LLM generar respuestas que incluyen presentaciones a servicios según sea necesario. Por ejemplo, si solicita un cálculo, el LLM podría decidir conectarse a un servicio de calculadora para proporcionar la respuesta.
Del mismo modo, la versión premium de ChatGPT ofrece complementos como Expedia y Kayak para proporcionar a los LLM acceso a información sobre reservas y consultas matemáticas complejas de Wolfram. El Proyecto Gorila también está analizando formas de utilizar los LLM como interfaz para órdenes cotidianas (como "iniciar una presentación Zoom con mi jefe").
Una consecuencia crucial es que los modelos lingüísticos podrían evolucionar hasta convertirse en plataformas o mercados para otros servicios.
Al igual que utilizamos los teléfonos para algo más que calificar llamadas, los directivos deberían ver los LLM como nuevos canales de distribución, que abren oportunidades para que sus empresas vendan sus productos y servicios.
No dé la espalda a los LLM sólo porque parezcan demasiado avanzados. Son una herramienta flexible y rentable que se puede adquirir mediante el pago por palabra y que a menudo resulta más barata que otras alternativas, incluso para las operaciones cotidianas.
Los LLM están evolucionando rápidamente hacia tecnologías genéricas polivalentes, sustituyendo a numerosos modelos más pequeños y ofreciendo un nuevo tipo de programación mediante instrucciones basadas en palabras. Pueden interrogar eficazmente sus datos e incluso servir como plataformas para diversos servicios.
Aunque nos hemos centrado aquí en los LLM, tenga en cuenta que la mayoría de las ideas anteriores se aplican también en general a otros tipos de IA generativa. A medida que los LLM como el GPT4 y el Bard de Google se aventuran a trabajar con imágenes, los límites entre el lenguaje y otros tipos de contenido han empezado a difuminarse.