“
China se está centrando en los modelos de lenguaje grandes (LLM) en el espacio de la inteligencia artificial.
Blackdovfx | Istock | Getty Images
Los intentos de China por dominar el mundo de la inteligencia artificial podrían estar dando sus frutos, con expertos de la industria y analistas de tecnología diciéndole a CNBC que los modelos chinos de IA ya son muy populares y están a la par, e incluso superan, a los de Estados Unidos en cuanto a rendimiento.
La IA se ha convertido en el último campo de batalla entre Estados Unidos y China, con ambos considerándola una tecnología estratégica. Washington continúa restringiendo el acceso de China a chips de vanguardia diseñados para impulsar la inteligencia artificial debido a temores de que la tecnología pueda amenazar la seguridad nacional de Estados Unidos.
Esto ha llevado a China a seguir su propio enfoque para aumentar el atractivo y rendimiento de sus modelos de IA, incluyendo la dependencia de la tecnología de código abierto y el desarrollo de su propio software y chips ultrarrápidos.
China está creando LLMs populares
Al igual que algunas de las principales empresas estadounidenses en el espacio, las empresas chinas de IA están desarrollando los llamados modelos de lenguaje grandes, o LLMs, que están entrenados con enormes cantidades de datos y sustentan aplicaciones como los chatbots.
A diferencia de los modelos de OpenAI que impulsan el muy popular ChatGPT, sin embargo, muchas de estas empresas chinas están desarrollando LLMs de código abierto, o de peso abierto, que los desarrolladores pueden descargar y desarrollar de forma gratuita y sin requisitos de licencia estrictos por parte del inventor.
En Hugging Face, un repositorio de LLMs, los LLMs chinos son los más descargados, según Tiezhen Wang, un ingeniero de aprendizaje automático de la empresa. Qwen, una familia de modelos de IA creada por el gigante chino del comercio electrónico Alibaba, es la más popular en Hugging Face, dijo.
“Qwen está ganando rápidamente popularidad debido a su destacado rendimiento en pruebas competitivas”, dijo Wang a CNBC por correo electrónico.
Agregó que Qwen tiene un “modelo de licencia altamente favorable” que significa que puede ser utilizado por empresas sin necesidad de “revisiones legales extensas.”
Qwen viene en varias tamaños, o parámetros, como se conocen en el mundo de los LLMs. Los modelos de parámetros grandes son más potentes pero tienen costos computacionales más altos, mientras que los más pequeños son más baratos de ejecutar.
“Sin importar el tamaño que elijas, es probable que Qwen sea uno de los modelos de mejor rendimiento disponibles en este momento”, agregó Wang.
DeepSeek, una start-up, también causó sensación recientemente con un modelo llamado DeepSeek-R1. DeepSeek dijo el mes pasado que su modelo R1 compite con el o1 de OpenAI, un modelo diseñado para razonar o resolver tareas más complejas.
Estas empresas afirman que sus modelos pueden competir con otras ofertas de código abierto como Llama de Meta, así como con LLMs cerrados como los de OpenAI, en diversas funciones.
“En el último año, hemos visto el surgimiento de contribuciones chinas de código abierto a IA con un rendimiento realmente fuerte, bajo costo de servicio y alta capacidad de procesamiento”, dijo Grace Isford, socia de Lux Capital, a CNBC por correo electrónico.
China impulsa el código abierto para ir global
La apertura de una tecnología sirve a varios propósitos, como impulsar la innovación al dar acceso a más desarrolladores, así como construir una comunidad en torno a un producto.
No solo son las empresas chinas las que han lanzado LLMs de código abierto. Meta, la empresa matriz de Facebook, así como la start-up europea Mistral, también tienen versiones de código abierto de modelos de IA.
Pero, con la industria tecnológica atrapada en la línea de fuego de la batalla geopolítica entre Washington y Pekín, los LLMs de código abierto dan a las empresas chinas otra ventaja: permitir que sus modelos sean utilizados a nivel mundial.
“Las empresas chinas quisieran ver que sus modelos se utilicen fuera de China, por lo que esta es definitivamente una forma para que las empresas se conviertan en actores globales en el espacio de la IA”, dijo Paul Triolo, socio de la firma de asesoría global DGA Group, a CNBC por correo electrónico.
Aunque el enfoque está en los modelos de IA en este momento, también hay debate sobre qué aplicaciones se construirán sobre ellos y quién dominará este paisaje de internet global en el futuro.
“Si asumes que estos modelos de IA base de frontera son elementos básicos, se trata de para qué se utilizarán estos modelos, como acelerar la ciencia y la tecnología de frontera”, dijo Isford de Lux Capital.
Los modelos de IA actuales han sido comparados con sistemas operativos, como Windows de Microsoft, Android de Google y iOS de Apple, con el potencial de dominar un mercado, como estas empresas lo hacen en móviles y PCs.
Si esto es cierto, esto hace que las apuestas para construir un LLM dominante sean más altas.
“[Las empresas chinas] perciben los LLMs como el centro de los futuros ecosistemas tecnológicos”, dijo Xin Sun, conferencista principal de negocios chinos y asiáticos orientales en el King’s College de Londres, a CNBC por correo electrónico.
“Sus futuros modelos de negocio dependerán de los desarrolladores que se unan a sus ecosistemas, desarrollando nuevas aplicaciones basadas en los LLMs, y atrayendo a los usuarios y datos a partir de los cuales se pueden generar ganancias posteriormente a través de diversos medios, incluyendo pero yendo mucho más allá de dirigir a los usuarios a usar sus servicios en la nube”, agregó Sun.
Las restricciones de chips arrojan dudas sobre el futuro de la IA en China
Los modelos de IA se entrenan con vastas cantidades de datos, lo que requiere enormes cantidades de potencia informática. Actualmente, Nvidia es el principal diseñador de los chips necesarios para esto, conocidos como unidades de procesamiento gráfico (GPU).
La mayoría de las principales empresas de IA están entrenando sus sistemas en los chips de mayor rendimiento de Nvidia, pero no en China.
En el último año aproximadamente, Estados Unidos ha intensificado las restricciones a la exportación de semiconductores avanzados y equipos para la fabricación de chips a China. Esto implica que los chips de última generación de Nvidia no pueden ser exportados al país y la empresa ha tenido que crear semiconductores que cumplan con las sanciones para exportar.
A pesar de estas restricciones, sin embargo, las empresas chinas han logrado lanzar modelos de IA avanzados.
“Las principales plataformas tecnológicas chinas actualmente tienen acceso suficiente a la potencia informática para seguir mejorando los modelos. Esto se debe a que han acumulado un gran número de GPUs de Nvidia y también están aprovechando las GPUs nacionales de Huawei y otras empresas”, dijo Triolo de DGA Group.
De hecho, las empresas chinas han estado intensificando los esfuerzos para crear alternativas viables a Nvidia. Huawei ha sido uno de los principales actores en la búsqueda de este objetivo en China, mientras que empresas como Baidu y Alibaba también han estado invirtiendo en el diseño de semiconductores.
“Sin embargo, la brecha en términos de cómputo de hardware avanzado aumentará con el tiempo, especialmente el próximo año cuando Nvidia lance sus sistemas basados en Blackwell que están restringidos para la exportación a China”, dijo Triolo.
Isford de Lux Capital señaló que China ha estado “inversionando y haciendo crecer de forma sistemática toda su infraestructura doméstica de IA fuera de Nvidia con chips de IA de alto rendimiento de empresas como Baidu.”
“Ya sea que los chips de Nvidia estén prohibidos en China o no, esto no evitará que China invierta y construya su propia infraestructura para construir y entrenar modelos de IA”, añadió.
“