El lunes, el mundo observó cómo se desplomaba 1 billón de dólares del mercado de valores en un solo día, un gran incendio encendido por la poco conocida startup china de inteligencia artificial DeepSeek.
Su lanzamiento de un nuevo modelo de IA, conocido como R1, trastornó las suposiciones sobre la supremacía de EE. UU. en IA y planteó la posibilidad de que algunos en China estén aprendiendo a vencer al Silicon Valley en su propio juego.
El modelo puede “razonar” para resolver problemas científicos complejos y funciona al mismo nivel que el software de vanguardia de los gigantes tecnológicos de EE. UU., pero al parecer fue desarrollado a una fracción del costo de esos modelos.
Rápidamente desplazó al ChatGPT de OpenAI como la aplicación gratuita más descargada en la App Store de iOS de EE. UU.
Junto con el desafío geopolítico, el avance de DeepSeek tiene implicaciones duales para la industria tecnológica. En primer lugar, es probable que acelere el desarrollo comercial y la adopción de IA, de la misma manera que ChatGPT lo hizo en 2022.
Al mismo tiempo, amenaza con demoler las suposiciones de inversión que han sustentado todo el mercado de valores de EE. UU., al parecer mostrando que el desarrollo de modelos de IA avanzados no requiere vastas cantidades de infraestructura y, por lo tanto, de capital.
La pregunta que se está haciendo con urgencia repentina desde California hasta Wall Street: ¿China ha alcanzado a EE. UU. en IA justo en el momento en que muchos en el campo afirman estar al borde de un avance histórico que pondrá a las máquinas al nivel de la inteligencia a nivel humano, un umbral conocido como inteligencia artificial general?
“Las innovaciones algorítmicas de [DeepSeek] nos recuerdan que China y EE. UU. están empatados y que nuestra ventaja tecnológica no está garantizada, empujando a nuestra industria a hacer que la IA sea más eficiente”, dice Eric Schmidt, ex director ejecutivo y presidente de Google.
“Para llegar primero a la IA general, necesitaremos seguir invirtiendo en talento, apoyar nuestro vibrante ecosistema de código abierto y asegurarnos de superar en innovación, no solo en gasto, a nuestros competidores”.
DeepSeek fue fundada con niveles de ambición al estilo de Silicon Valley. Comenzó en 2023 como un proyecto secundario para el excéntrico multimillonario de fondos de cobertura Liang Wenfeng, justo cuando la carrera por replicar ChatGPT se estaba intensificando. Desde entonces se ha convertido en uno de los principales laboratorios de IA de China.
“¿Por qué Silicon Valley es tan innovador? Porque se atreven a hacer cosas”, dijo Liang en una entrevista el año pasado. “Cuando salió ChatGPT, la comunidad tecnológica en China carecía de confianza en la innovación de vanguardia.”
Añadió: “Desde inversores hasta las grandes tecnológicas [chinas], todos pensaron que la brecha era demasiado grande y optaron por enfocarse en las aplicaciones en lugar de la innovación pionera. Pero la innovación comienza con la confianza”.
El fundador de DeepSeek, Liang Wenfeng. Como laboratorio de investigación pura, su empresa ha enfocado sus esfuerzos en avanzar en la IA, en lugar de tratar de ganar dinero © VCG vía Getty Images
A medida que los fondos estatales en China han asumido un papel más importante en la financiación de nuevas empresas en los últimos años, el ecosistema empresarial ha sentido presión para garantizar retornos por temor a perder los activos del país.
DeepSeek se distingue entre las startups chinas de IA generativa en que no ha recaudado financiamiento externo y, por lo tanto, ha estado libre de estas limitaciones.
Como laboratorio de investigación pura, ecoando los primeros días de DeepMind en el Reino Unido y OpenAI en EE. UU., DeepSeek ha enfocado todos sus esfuerzos en impulsar el campo de la IA hacia adelante, en lugar de tratar de ganar dinero. Y aunque se enorgullece de estar totalmente fundada en talento nacional, ha adoptado una cultura que a menudo se encuentra en el corazón de la tecnología en EE. UU.
“Es única entre las empresas de IA chinas”, dice un inversor de IA en China. “No hay política ni fricción de gestión como en las otras grandes empresas tecnológicas o startups más grandes. Las personas no tienen títulos específicos ni líneas de reporte”.
Los orígenes de DeepSeek como un fondo de cobertura cuantitativo significaron que tenía talento en ingeniería con un profundo conocimiento de chips. Su avance radica en su aparente éxito en la capacitación de modelos de IA avanzados sin gastar los cientos de millones de dólares que han gastado sus rivales estadounidenses.
Afirmó que el paso final de capacitación para R1 costó solo 5.6 millones de dólares. Sin embargo, la cifra no incluye muchos otros costos involucrados en el desarrollo de sus modelos, incluyendo la infraestructura informática y ejecuciones de capacitación previas, lo que hace difícil hacer comparaciones precisas.
Se eliminaron 1 billón de dólares del mercado de valores de EE. UU. después del avance de DeepSeek. El nuevo modelo de IA de la startup china al parecer fue desarrollado a una fracción del costo de los provenientes del Silicon Valley © Yuki Iwamura/Bloomberg
También puede haber cortado esquinas para ahorrar costos: OpenAI afirma tener evidencia de que DeepSeek se capacitó con la salida de los propios modelos de OpenAI, lo que no está permitido según sus términos de uso, aunque se piensa que es una práctica subrepticia ampliamente utilizada también por las empresas de EE. UU.
Irónicamente, el intento de Washington de obstaculizar el sector de IA de China imponiendo controles de exportación a chips de alta gama de EE. UU. a partir de 2022 puede haber contribuido al avance de DeepSeek.
Sin acceso a silicio de vanguardia, la empresa se vio obligada a encontrar formas innovadoras de exprimir un rendimiento más alto de los chips menos sofisticados que podía comprar.
Las afirmaciones de la empresa sobre cómo se desarrollaron con bajo costo y las capacidades avanzadas de sus modelos han desencadenado un acalorado debate sobre cuán disruptiva será realmente la empresa. Los líderes del Silicon Valley han rendido homenaje a sus innovaciones, pero también han restado importancia a su significado.
El CEO de OpenAI, Sam Altman, calificó al modelo R1 de “impresionante”, mientras que Mark Zuckerberg, director ejecutivo de Meta, acreditó a la empresa por realizar “avances que esperamos implementar en nuestros sistemas”.
Sam Altman de OpenAI, que afirma tener evidencia de que DeepSeek entrenó su modelo de IA con la salida de los propios modelos de OpenAI © Andrew Caballero-Reynolds/AFP/Getty Images
Sin embargo, Zuckerberg también calificó el avance de DeepSeek como solo uno entre muchos en un campo que se mueve a gran velocidad, dificultando saber cuán profundamente su enfoque de bajo costo cambiaría la dinámica de la industria, dijo.
Según algunas personas observadoras de la tecnología en China, los avances de DeepSeek no son lo suficientemente significativos como para cambiar el hecho de que las empresas de IA de China han sido seguidoras rápidas, en su mayoría dedicadas a emular a sus contrapartes estadounidenses en lugar de marcar la dirección por sí mismas.
“El trabajo de DeepSeek entra en esa categoría. Lo que realmente cambiaría las tornas en la competencia entre EE. UU. y China es si construyeran algo que realmente empujara el límite. Veremos si lo logran”, dice Helen Toner, analista de políticas de IA en el Centro de Seguridad y Tecnología Emergente de Georgetown, y ex miembro de la junta directiva de OpenAI.
Sin embargo, otros dicen que el hecho de que una startup tecnológica china haya estado detrás del último avance que llama la atención representa un momento crucial, cambiando la dinámica en la carrera de IA entre los dos países.
“Los modelos más recientes de DeepSeek pueden no significar que China esté superando a EE. UU. en la carrera de la IA, pero sí demuestran que las empresas chinas están logrando avances notables en la innovación de software que mitigan las restricciones impuestas por los controles de exportación de EE. UU.”, escribió Tilly Zhang, analista de tecnología de China en Gavekal Dragonomics, una firma de investigación centrada en China, en una nota publicada esta semana.
Recomendado
“La carrera por el liderazgo en IA ya no se trata solo de quién tiene acceso a los mejores chips, sino de quién los utiliza mejor.”
Si bien la importancia de los avances técnicos de DeepSeek es motivo de debate, no hay duda de la onda de choque que pasó por el mercado de valores mientras los inversores digerían las implicaciones de su principal innovación: reducir drásticamente el costo de capacitación para los modelos de IA más avanzados.
Los modelos de DeepSeek parecen socavar el argumento que las empresas de IA de EE. UU. han hecho enfáticamente en el último año: que los avances en IA requieren vastas cantidades de capital e infraestructura para desarrollar y desplegar su tecnología a gran escala.
En cambio, sugieren que los modelos mucho más costosos desarrollados en EE. UU. no tendrían mucha diferencia, lo que genera temores entre los inversores de una fuerte conmoción deflacionaria.
“Había un sentido de excepcionalismo americano — que solo América tenía esta tecnología, y solo los estadounidenses tenían el dinero para hacer esto”, dice Jim Tierney, un inversor de acciones de crecimiento de EE. UU. de AllianceBernstein. “La comoditización de estos modelos está ocurriendo mucho más rápido de lo que pensábamos.”
Mark Zuckerberg de Meta dijo que si el R1 de DeepSeek se convierte en el estándar mundial para los modelos de IA ‘abiertos’, sería una desventaja para EE. UU. ‘Para nuestra ventaja nacional, es importante que sea un estándar estadounidense’ © Godofredo A. Vásquez/AP
Buena parte del Silicon Valley se apoyó en el argumento de que otros en la industria pronto copiarán las innovaciones de DeepSeek, reduciendo el costo de capacitación de los modelos de IA en general. Ejecutivos como Satya Nadella de Microsoft afirmaron que hará que la tecnología sea más asequible para los clientes y aumentará su uso, algo que beneficiaría a toda la industria.
Como muestra de la confianza de la empresa en su estatus, DeepSeek ha publicado su investigación y ha lanzado sus modelos en forma de “pesos abiertos”, una versión más limitada de software de código abierto que permite a cualquiera descargar, usar y modificar la tecnología.
El movimiento atraerá a un amplio seguimiento internacional entre los desarrolladores de software que buscan modelos “abiertos” para construir aplicaciones. La mayoría de los modelos desarrollados por las principales empresas de IA del Silicon Valley siguen cerrados, aunque hay excepciones — notablemente Meta, cuyos modelos abiertos han aumentado en popularidad.
Un gran número de desarrolladores están experimentando con lo que es ahora una solución de código abierto basada en IA de origen chino
Pero el modelo de DeepSeek es accesible a un costo mucho más bajo. La empresa china dice que cobra solo 1.4 centavos por cada 1 millón de tokens que genera, aproximadamente equivalente a 700,000 palabras. En contraste, Meta cobra $2.80 por la misma salida de sus modelos más grandes.
“Un gran número de desarrolladores están experimentando con lo que ahora es una solución de IA de código abierto de origen chino”, dice Keegan McBride, un investigador del Instituto de Internet de Oxford que se centra en la geopolítica de la IA. “Realmente demuestra que en el espacio de la IA, EE. UU. no es la única opción sobre la mesa.”
Si bien Yann LeCun, científico jefe de IA de Meta, describió a DeepSeek en términos elogiosos como prueba de que los “modelos de código abierto están superando a los propietarios”, la startup no obstante plantea un desafío directo a Meta.
La “fama de la empresa ha sido crear modelos de pesos abiertos que no están muy lejos de la vanguardia, y DeepSeek simplemente los superó en su propio juego”, dice Toner.
Más allá del impacto de DeepSeek en el mercado de productos de IA, su avance también promete tener repercusiones geopolíticas, llegando en lo que muchos creen es un momento crucial en la competencia entre EE. UU. y China por la supremacía de la IA.
Si R1 y sus sucesores se convierten en el estándar mundial para los modelos de IA “abiertos”, sería una desventaja para EE. UU., advirtió Zuckerberg de Meta. “Para nuestra ventaja nacional, es importante que sea un estándar estadounidense”, dijo. “Queremos construir el sistema de IA que las personas de todo el mundo están usando”.
Recomendado
El surgimiento de DeepSeek probablemente influirá en las discusiones cuando el grupo diplomático se reúna dentro de los próximos 90 días para discutir una estructura de seguridad común y multilateral para el software de IA, de la que Mundie escribe en su último libro Génesis, coescrito con Kissinger y Schmidt.
“No significa que todos tendrán las mismas leyes o reglas, pero [construir] la arquitectura por la cual estas máquinas crecen comprendiendo los valores humanos y se comportan con las elecciones sociales en todo el mundo, creo que es una tarea urgente”, dice Mundie.
Mientras tanto, los jóvenes emprendedores aspirantes en China miran hacia DeepSeek y su fundador como inspiración para construir una nueva generación de tecnología poderosa.
Un adolescente que fue a rendir homenaje a la casa de Liang en el pueblo de Mililing esta semana dice: “Es un tecnólogo pragmático. Reunió un equipo que superó a los de empresas como OpenAI con las que antes no podíamos competir. Es una gran persona que ha hecho contribuciones a China.”
Reportaje adicional de Melissa Heikkila en Londres