DeepSeek

Tiene sede en Hangzhou, Zhejiang, es propiedad y está financiada exclusivamente por el fondo de cobertura chino High-Flyer, cuyo cofundador, Liang Wenfeng, estableció la empresa en 2023 y se desempeña como su director ejecutivo.

[16][19][18] Las empresas de capital riesgo se mostraron reacias a proporcionar financiación, ya que era poco probable que pudieran generar una salida (retorno sobre la inversión) en un corto período de tiempo.

A pesar del bajo precio cobrado por DeepSeek, fue rentable en comparación con sus rivales que estaban perdiendo dinero.

[20] Hasta el momento, DeepSeek se centra únicamente en la investigación y no tiene planes detallados de comercialización.

[20] Las preferencias de contratación de DeepSeek se centran en las habilidades técnicas más que en la experiencia laboral al reclutar nuevos empleados, por lo que la mayoría de sus nuevos empleados son estudiantes universitarios recientemente graduados o desarrolladores cuyas carreras en IA están menos establecidas.

[21] El código del modelo se hizo de código abierto bajo la licencia MIT, con un acuerdo de licencia adicional sobre el "uso posterior abierto y responsable" del modelo en sí.

Se desarrolló para competir con otros LLM disponibles en ese momento con un rendimiento cercano al de GPT-4.

Sin embargo, enfrentó desafíos en términos de eficiencia computacional y escalabilidad.

[21] También se lanzó una versión de chatbot del modelo llamada DeepSeek Chat.

[32] Sin embargo, The Wall Street Journal afirmó que cuando utilizó 15 problemas de la edición 2024 de AIME, el modelo o1 alcanzó una solución más rápido que DeepSeek R1-Lite-Preview.

En cambio, son similares a otros modelos de peso abierto como LLaMA y Qwen, ajustados con datos sintéticos generados por R1.

[36] DeepSeek lanzó su asistente virtual, que utiliza el modelo V3 como una aplicación de bot conversacional para iOS y Android.

[38] Varias publicaciones y medios de comunicación, como The Hill y The Guardian, describieron el lanzamiento de su bot conversacional como un «momento Sputnik» para la IA estadounidense.

[48][49] El presidente estadounidense Donald Trump, quien anunció The Stargate Project, calificó a DeepSeek como una «llamada de atención»[50] y un avance positivo.

[47][53][54] Varias empresas, incluidas Amazon Web Services, Toyota y Stripe, buscan utilizar el modelo en su programa.

[58][59] La IA puede generar inicialmente una respuesta, pero poco después la elimina y la reemplaza con un mensaje como: «Lo siento, eso está más allá de mi alcance actual.

[61] Los investigadores occidentales pudieron en enero de 2025 engañar a DeepSeek para que diera respuestas precisas a algunos de estos temas adaptando la pregunta formulada.

Podemos recopilar su entrada de texto o audio, indicaciones, archivos cargados, comentarios, historial de chat u otro contenido que proporcione a nuestro modelo y Servicios».