OpenAI dice tener pruebas de que DeepSeek de China utilizó su modelo para entrenar a un competidor.

Mantente informado con actualizaciones gratuitas

OpenAI dice que ha encontrado evidencia de que la startup china de inteligencia artificial DeepSeek utilizó los modelos propietarios de la empresa estadounidense para entrenar su propio competidor de código abierto, mientras crecen las preocupaciones por una posible violación de propiedad intelectual.

El fabricante de ChatGPT con sede en San Francisco dijo al Financial Times que había visto cierta evidencia de “destilación”, una técnica utilizada por los desarrolladores para obtener un mejor rendimiento en modelos más pequeños utilizando salidas de modelos más grandes y capaces. Esto les permite lograr resultados similares en tareas específicas a un costo mucho menor.

OpenAI declinó hacer más comentarios sobre los detalles de su evidencia. Sus términos de servicio establecen que los usuarios no pueden “copiar” ninguno de sus servicios o “utilizar la salida para desarrollar modelos que compitan con OpenAI”.

El lanzamiento del modelo de razonamiento R1 de DeepSeek ha sorprendido a los mercados, así como a inversores y empresas tecnológicas en Silicon Valley, debido a su impresionante rendimiento en tareas cognitivas. Sus modelos de bajo presupuesto han logrado altos rankings y resultados comparables a los modelos líderes de EE. UU. Las acciones de Nvidia cayeron un 17 por ciento el lunes, borrando $589 mil millones de su valor de mercado, por temor a que las grandes inversiones en su costoso hardware de IA puedan no ser necesarias. Se recuperaron un 9 por ciento el martes junto con otras acciones tecnológicas afectadas por la noticia.

LEAR  El Papa dice que quiere ser enterrado en la basílica de Roma, no en el Vaticano. El Papa dice que quiere ser enterrado en la basílica de Roma, no en el Vaticano.

Una persona cercana a OpenAI dijo que la destilación era una práctica común en la industria y señaló que la empresa ofrece a los desarrolladores una forma de hacerlo utilizando su propia plataforma, pero dijo: “El problema es cuando lo estás haciendo para crear tu propio modelo para tus propósitos”.

Microsoft y OpenAI realizaron investigaciones sobre cuentas que se creía que eran de DeepSeek el otoño pasado y que estaban utilizando la interfaz de programación de aplicaciones, o API, de OpenAI, y bloquearon su acceso por sospecha de destilación que violaba los términos de servicio, agregó otra persona con conocimiento directo, tal y como reportó primero Bloomberg.

Microsoft declinó hacer comentarios y OpenAI no respondió de inmediato a este detalle. DeepSeek no respondió de inmediato a una solicitud de comentarios.

Anteriormente, el zar de IA y criptografía del presidente Donald Trump, David Sacks, dijo “es posible” que se haya producido robo de propiedad intelectual.

“Hay una técnica en IA llamada destilación… cuando un modelo aprende de otro modelo [y] extrae el conocimiento del modelo padre,” Sacks dijo a Fox News el martes.

“Y hay evidencia sustancial de que lo que hizo DeepSeek aquí es que extrajo el conocimiento de los modelos de OpenAI, y no creo que OpenAI esté muy contento al respecto,” agregó Sacks, aunque no proporcionó evidencia.

DeepSeek dijo que usó solo 2,048 tarjetas gráficas Nvidia H800 y gastó $5.6 millones para entrenar su modelo V3 con 671 mil millones de parámetros, una fracción de lo que OpenAI y Google gastaron para entrenar modelos de tamaño comparable. Algunos expertos señalaron cómo el modelo generaba respuestas que indicaban que había sido entrenado en salidas de GPT-4 de OpenAI, lo que violaría sus términos de servicio.

LEAR  Bolsa de valores francesa en camino para su peor desempeño desde la crisis de la eurozona.

Insiders de la industria dicen que, en realidad, es una práctica común para los laboratorios de IA, tanto en China como en EE. UU., utilizar salidas de empresas líderes como OpenAI, que también han invertido en contratar personas para enseñar a sus modelos a producir respuestas que suenen más humanas. Esto es costoso y laborioso, y es común que los jugadores más pequeños se aprovechen de su trabajo, dicen los insiders.

“Es una práctica muy común para las startups y los académicos usar salidas de LLM comerciales alineadas con humanos, como ChatGPT, para entrenar otro modelo,” dijo Ritwik Gupta, candidato a doctorado en IA en la Universidad de California, Berkeley.

“Eso significa que obtienes este paso de retroalimentación humana de forma gratuita. No me sorprendería que supuestamente DeepSeek estuviera haciendo lo mismo. Si lo estuvieran haciendo, detener esta práctica precisamente puede ser difícil,” añadió.

La práctica también resalta la dificultad para las empresas líderes en IA en cómo defienden su ventaja técnica cuando otros grupos pueden aprovecharse de sus modelos.

Las empresas chinas han absorbido rápidamente lecciones de sus contrapartes estadounidenses mientras innovan en enfoques para maximizar su cantidad limitada de chips, lo que hace más económico entrenar y ejecutar los modelos.

“Sabemos que las empresas con sede en China — y otras — están constantemente tratando de destilar los modelos de las principales compañías de IA de EE. UU.,” añadió OpenAI en un comunicado.

“Empleamos contramedidas para proteger nuestra propiedad intelectual, incluido un proceso cuidadoso para determinar qué capacidades líderes incluir en los modelos publicados, y creemos que es de vital importancia que trabajemos en estrecha colaboración con el gobierno de los EE. UU. para proteger mejor los modelos más capaces de los esfuerzos de adversarios y competidores para tomar la tecnología estadounidense.”

LEAR  Revisión de pdfFiller: Un editor de PDF caro y poco completo para macOS

OpenAI está actualmente enfrentando acusaciones de su propia infracción de derechos de autor por parte de periódicos y creadores de contenido, incluyendo demandas de The New York Times y autores prominentes, que acusan a la empresa de entrenar sus modelos con sus artículos y libros sin permiso.