Hace dos años, cuando empresas tecnológicas chinas de renombre como Baidu y Alibaba iban tras los avances de Silicon Valley en inteligencia artificial con anuncios llamativos y nuevos chatbots, DeepSeek adoptó un enfoque diferente y se centró en la investigación.
La startup china ha sacudido al mundo tecnológico con su afirmación de que creó un potente modelo de IA que era significativamente más barato de construir que los ofrecidos por sus rivales estadounidenses mejor financiados.
En la rivalidad entre China y Estados Unidos por el dominio de la inteligencia artificial, DeepSeek pareció surgir de la nada. De hecho, en los últimos años se ha disparado en el mundo tecnológico chino vía un camino poco convencional.
Los orígenes de DeepSeek están en las finanzas, no en la tecnología. Su empresa matriz, un fondo de cobertura chino llamado High-Flyer, comenzó como un negocio que utilizaba IA para hacer apuestas en el mercado de valores chino. High-Flyer había prosperado capitalizando un mercado dominado por los inversionistas minoristas de China, conocidos por entrar y salir de acciones impulsivamente. En el 2021, High-Flyer se vio presionado por medidas enérgicas regulatorias en China contra las operaciones especulativas, que las autoridades de Beijing consideraban contrarias a sus intentos por mantener a los mercados en calma.
Entonces, High-Flyer fue tras una nueva oportunidad que, dijo, se alineaba mejor con las prioridades del Gobierno chino: inteligencia artificial avanzada.
Nació DeepSeek
Se cree que el modelo de inteligencia artificial más reciente de DeepSeek es casi tan potente como sus rivales estadounidenses, pero mucho más eficiente. Su éxito sugiere que el liderazgo en IA de Silicon Valley se ha reducido. El logro de DeepSeek, pese a los esfuerzos de Washington por limitar el acceso chino a los chips avanzados necesarios para la IA, plantea dudas sobre qué tan efectivos pueden ser esos controles a largo plazo.
DeepSeek dependió de hacer productos de IA orientados al consumidor para obtener sus ingresos, y apenas en enero lanzó su primer chatbot, que permite a cualquiera generar texto y fotos con indicaciones simples. En lugar de eso, la empresa utilizó el dinero que ganó High-Flyer con las operaciones accionarias para financiar investigación ambiciosa. El enfoque lo distingue de sus rivales estadounidenses, que en última instancia son empresas de tecnología de consumo.
El director ejecutivo de DeepSeek, Liang Wenfeng, un ingeniero que estudió en la Universidad de Zhejiang, en Hangzhou, ha dicho repetidamente en las pocas entrevistas que ha concedido a los medios chinos que para ponerse al día con la innovación estadounidense, las empresas chinas deben anteponer la investigación a las ganancias. DeepSeek y High-Flyer no respondieron a las solicitudes de comentarios.
Durante años, las empresas tecnológicas chinas fueron pioneras en aplicaciones de inteligencia artificial utilizadas en visión por computadora, como el reconocimiento facial. Pero, el lanzamiento de ChatGPT por parte de OpenAI en el 2022 provocó un ajuste de cuentas. Cuando ninguna empresa china lanzó rápidamente algo comparable, muchos concluyeron que las empresas estadounidenses tenían ventaja en inteligencia artificial avanzada.
En China, los científicos computacionales estaban decididos a demostrar que podían competir. En el 2023, muchas empresas en China lanzaron sus propios modelos de lenguaje de gran tamaño, la tecnología que subyace a los chatbots como ChatGPT. Pero fabricar modelos avanzados requeriría el uso de una gran cantidad de chips que costarían cientos de millones de dólares.
High-Flyer también estaba gastando. En el 2021 fue una de las pocas empresas chinas que había podido almacenar más de 10 mil chips Nvidia A100 avanzados.
Sin embargo, la investigación de DeepSeek le dio una ventaja sorprendente. El año pasado, redujo drásticamente los precios que cobraba a los desarrolladores que crean aplicaciones utilizando su modelo, desatando una guerra de precios con rivales más grandes.
Zihan Wang, un ingeniero computacional que trabajó en un modelo anterior de DeepSeek, dijo que se hablaba poco de aplicaciones comerciales para la tecnología que estaban construyendo. En lugar de ello, dijo, la empresa estaba centrada en fabricar un sistema de IA que podría ser utilizado por una variedad de personas para muchos propósitos.
“Durante mi tiempo allí no hablábamos mucho sobre cómo ganamos dinero”, dijo Wang. “Simplemente se centraron en crear un gran modelo base”.