DeepSeek de China es más barato que ChatGPT, pero las pruebas de precisión muestran que obtienes lo que pagas.


Nada está más de moda en tecnología que la inteligencia artificial. En este momento, nada está más de moda en tecnología móvil que la aplicación iOS de DeepSeek AI de China. Como les contamos anoche, la aplicación es la número uno en la App Store superando a ChatGPT. El desarrollo de DeepSeek se realizó a un costo mucho menor que el de OpenAI y Google para crear ChatGPT y Gemini respectivamente. Pero a veces obtienes lo que pagas y en una auditoría realizada por NewsGuard, DeepSeek tuvo una tasa de precisión extremadamente baja en la entrega de noticias e información.

El informe señaló que DeepSeek tenía razón solo el 17% del tiempo, lo que lo colocaba en el décimo lugar de once chatbots de inteligencia artificial, incluidos ChatGPT y Gemini. El 30% de las veces, DeepSeek respondió con afirmaciones falsas y más de la mitad del tiempo, un 53%, en respuesta a indicaciones relacionadas con noticias, el chatbot de inteligencia artificial chino dio una respuesta vaga o no útil. En general, DeepSeek tuvo una tasa de fallo del 87% según NewsGuard, en comparación con una tasa de fallo del 62% para los rivales occidentales de DeepSeek.

DeepSeek ha afirmado que la tecnología detrás del chatbot tiene un rendimiento igual o mejor que ChatGPT de OpenAI a una fracción del costo. El informe de NewsGuard pone en duda esa afirmación. La prueba incluyó los mismos 300 indicadores utilizados para probar ChatGPT y Gemini, con 30 de ellos basados intencionalmente en 10 afirmaciones falsas encontradas en línea. Según Reuters, algunos de los temas de estos indicadores incluyeron el asesinato del CEO de UnitedHealthcare, Brian Thompson y el derribo del vuelo 8243 de Azerbaijan Airlines.

LEAR  Lapse, una nueva aplicación de fotos, intenta competir en un mundo de Instagram.

“La importancia del avance de DeepSeek no radica en responder preguntas relacionadas con noticias chinas con precisión, sino en el hecho de que puede responder cualquier pregunta a 1/30 del costo de modelos de inteligencia artificial comparables.” – Gil Luria, analista de D.A. Davidson

Lo que podría considerarse alarmante es que con tres de 10 indicadores basados en afirmaciones falsas en línea, DeepSeek repitió la posición del gobierno chino sobre el asunto incluso sin ninguna mención de China en el indicador. Por ejemplo, en respuesta a indicadores sobre el accidente de Azerbaijan Airlines y en respuesta a preguntas al respecto que no tenían nada que ver con China, el chatbot adoptó la posición de Pekín.

Leave a Comment