Qué es el DeepSeek de China y por qué está causando pánico en el mundo de la inteligencia artificial?

“

(Bloomberg) — DeepSeek, una startup china de inteligencia artificial con poco más de un año de vida, ha causado asombro y consternación en Silicon Valley después de demostrar modelos de IA que ofrecen un rendimiento comparable a los mejores chatbots del mundo, aparentemente a una fracción de su costo de desarrollo.

La irrupción de DeepSeek podría ofrecer un contrapunto a la creencia generalizada de que el futuro de la IA requerirá una cantidad cada vez mayor de potencia informática y energía.

Las acciones tecnológicas globales cayeron el 27 de enero a medida que la expectación en torno a la innovación de DeepSeek cobraba impulso y los inversores comenzaban a asimilar las implicaciones para sus rivales con sede en EE. UU. y los proveedores de hardware de IA como Nvidia Corp.

DeepSeek fue fundada en 2023 por Liang Wenfeng, el jefe del fondo de cobertura cuantitativo impulsado por IA High-Flyer. La empresa desarrolla modelos de IA que son de código abierto, lo que significa que la comunidad de desarrolladores en general puede inspeccionar y mejorar el software. Su aplicación móvil se disparó hasta lo más alto de las listas de descargas de iPhone en EE. UU. después de su lanzamiento a principios de enero.

La aplicación se distingue de otros chatbots como el ChatGPT de OpenAI al articular su razonamiento antes de ofrecer una respuesta a una solicitud. La empresa afirma que su versión R1 ofrece un rendimiento equiparable a la última iteración de ChatGPT. Ofrece licencias a personas interesadas en desarrollar chatbots utilizando la tecnología para construir sobre ella, a un precio muy por debajo de lo que cobra OpenAI por acceso similar.

Sigue el podcast diario The Big Take donde sea que escuches.

DeepSeek dice que el rendimiento de R1 se acerca o supera el de modelos rivales en varios benchmarks líderes como AIME 2024 para tareas matemáticas, MMLU para conocimiento general y AlpacaEval 2.0 para rendimiento de preguntas y respuestas. También se clasifica entre los mejores intérpretes en una tabla clasificatoria afiliada a UC Berkeley llamada Chatbot Arena.

Aunque la empresa no detalla completamente, el costo de entrenamiento y desarrollo de los modelos de DeepSeek parece ser solo una fracción de lo que se requiere para OpenAI o los mejores productos de Meta Platforms Inc. La mayor eficiencia del modelo pone en duda la necesidad de grandes gastos de capital para adquirir los aceleradores de IA más modernos y potentes de empresas como Nvidia. También pone el foco en las restricciones a las exportaciones de Estados Unidos de esos avanzados semiconductores a China, que tenían la intención de evitar un avance del tipo que DeepSeek parece representar.

LEAR 5 productos de esta sección de la tienda de abarrotes te ayudarán a mejorar tu salud cerebral.

¿Cuándo despertó el interés global DeepSeek?

El desarrollador de IA ha sido observado de cerca desde el lanzamiento de su primer modelo en 2023. Luego, en noviembre, dio al mundo un vistazo a su modelo de razonamiento DeepSeek R1, diseñado para imitar el pensamiento humano. Ese modelo sustenta su aplicación de chatbot, que explotó en popularidad como una alternativa mucho más barata a OpenAI, con el inversor Marc Andreessen llamándolo el “momento Sputnik de la IA”.

La aplicación móvil de DeepSeek fue descargada 1.6 millones de veces para el 25 de enero y se ubicó en el puesto número 1 en las tiendas de aplicaciones de iPhone en Australia, Canadá, China, Singapur, EE. UU. y el Reino Unido, según datos del rastreador de mercado App Figures.

¿Qué aprendimos de la gigantesca reacción del mercado de valores?

Durante gran parte de los últimos más de dos años desde que ChatGPT inició la fiebre global de la IA, los inversores han apostado a que las mejoras en la IA requerirán chips cada vez más avanzados de empresas como Nvidia.

El avance de DeepSeek sugiere que están surgiendo modelos de IA que pueden lograr un rendimiento comparable utilizando chips menos sofisticados por un gasto menor.

Los inversores vendieron acciones de Nvidia en respuesta, enviando las acciones a la baja un 17% el 27 de enero y borrando $589 mil millones de valor de la empresa más grande del mundo, un récord en el mercado de valores. También cayeron empresas como el fabricante de máquinas de semiconductores ASML Holding NV y otras compañías que también se beneficiaron de la creciente demanda de hardware de IA de vanguardia.

El éxito de DeepSeek pone en duda los enormes gastos de empresas como Meta y Microsoft Corp. —cada una de las cuales ha comprometido $65 mil millones o más este año, en su mayoría en infraestructura de IA.

Las acciones de Meta y Microsoft también abrieron a la baja, aunque con márgenes más pequeños que Nvidia, con los inversores evaluando el potencial de ahorros sustanciales en las inversiones de IA de los gigantes tecnológicos. Meta incluso se recuperó más tarde en la sesión para cerrar al alza. Nombres chinos vinculados a DeepSeek, como Iflytek Co., también subieron.

LEAR KKR nombra a Ruchir Swarup como nuevo Director de Información por Investing.comTranslation to Spanish:KKR nombra a Ruchir Swarup como nuevo Director de Información Por Investing.com.

Algunos observadores de la industria sugirieron que la industria en general podría beneficiarse del avance de DeepSeek si presiona a OpenAI y otros proveedores estadounidenses a reducir sus precios, estimulando una adopción más rápida de la IA.

¿Cómo podría afectar DeepSeek a la competencia estratégica global en torno a la IA?

La IA es la frontera clave en la contienda entre Estados Unidos y China por la supremacía tecnológica. Washington ha prohibido la exportación a China de equipos como unidades de procesamiento gráfico de alta gama en un intento de frenar los avances del país.

El progreso de DeepSeek sugiere que los ingenieros de IA chinos han encontrado una forma de sortear esas restricciones, centrándose en una mayor eficiencia con recursos limitados. Aun así, no está claro cuánto hardware avanzado de entrenamiento de IA ha tenido acceso DeepSeek.

Ya, desarrolladores de todo el mundo están experimentando con el software de DeepSeek y buscan construir herramientas con él. Esto podría ayudar a las empresas estadounidenses a mejorar la eficiencia de sus modelos de IA y acelerar la adopción de razonamientos de IA avanzados.

Eso, a su vez, podría obligar a los reguladores a establecer normas sobre cómo se usan estos modelos, y con qué objetivo.

El progreso de DeepSeek plantea una pregunta adicional, que a menudo surge cuando una empresa china avanza en mercados extranjeros: ¿Podrían los vastos datos que la aplicación móvil recopila y almacena en servidores chinos representar una amenaza de privacidad o seguridad para los ciudadanos estadounidenses?

El hecho de que los modelos de DeepSeek sean de código abierto abre la posibilidad de que los usuarios en EE. UU. puedan tomar el código y ejecutar los modelos de una manera que no toque los servidores en China.

¿Quién es el fundador de DeepSeek?

Nacido en Guangdong en 1985, el graduado en ingeniería Liang nunca ha estudiado o trabajado fuera de China continental. Obtuvo títulos de licenciatura y maestría en ingeniería electrónica e informática de la Universidad de Zhejiang. Fundó DeepSeek con 10 millones de yuanes ($1.4 millones) en capital registrado, según la base de datos de empresas Tianyancha.

El cuello de botella para más avances no es más recaudación de fondos, dijo Liang en una entrevista con el medio chino 36kr, sino las restricciones de EE. UU. sobre el acceso a los mejores chips. La mayoría de sus principales investigadores eran recién graduados de las principales universidades chinas, dijo, subrayando la necesidad de que China desarrolle su propio ecosistema interno similar al construido en torno a Nvidia y sus chips de IA.

LEAR Exclusiva: Elis de Francia ha pujado por el proveedor de uniformes estadounidense Vestis, según fuentes de Reuters.

“Más inversión no necesariamente conduce a más innovación. De lo contrario, las grandes empresas se adueñarían de toda la innovación”, dijo Liang.

Liang ha sido comparado con el fundador de OpenAI, Sam Altman, pero el ciudadano chino mantiene un perfil mucho más bajo y rara vez habla en público.

¿Dónde se encuentra DeepSeek en el panorama de la IA de China?

Los líderes tecnológicos de China, desde Alibaba Group Holding Ltd. y Baidu Inc. hasta Tencent Holdings Ltd., han invertido significativas sumas de dinero y recursos en la carrera por adquirir hardware y clientes para sus empresas de IA. Junto con la startup 01.AI de Kai-Fu Lee, DeepSeek se destaca por su enfoque de código abierto —diseñado para reclutar la mayor cantidad de usuarios rápidamente antes de desarrollar estrategias de monetización sobre esa gran audiencia.

Debido a que los modelos de DeepSeek son más asequibles, ya ha desempeñado un papel en ayudar a reducir los costos para los desarrolladores de IA en China, donde los grandes jugadores se han visto envueltos en una guerra de precios que ha visto sucesivas oleadas de recortes de precios en el último año y medio.

¿Cuáles son las deficiencias de DeepSeek?

Como todos los demás modelos de IA chinos, DeepSeek se autocensura en temas considerados sensibles en China. Desvía las consultas sobre las protestas de la Plaza Tiananmen de 1989 o preguntas geopolíticamente controvertidas como la posibilidad de que China invada Taiwán. En las pruebas, el bot de DeepSeek es capaz de dar respuestas detalladas sobre figuras políticas como el Primer Ministro de la India, Narendra Modi, pero se niega a hacerlo sobre el Presidente chino, Xi Jinping.

La infraestructura en la nube de DeepSeek probablemente será puesta a prueba por su repentina popularidad. La empresa experimentó brevemente una importante interrupción el 27 de enero y tendrá que gestionar aún más tráfico a medida que los nuevos y antiguos usuarios viertan más consultas en su chatbot.

–Con ayuda de Luz Ding, Zheping Huang, Claire Che, Ville Heiskanen, Mayumi Negishi, Olivia Solon y Jan-Patrick Barnert.

(Actualizado para incluir más detalle sobre el fundador de DeepSeek. Una versión anterior de este artículo corrigió la referencia al precio de las acciones de Meta)

Lo más leído de Bloomberg Businessweek

“