En los últimos años, la inteligencia artificial (IA) ha sido dominada por empresas de Estados Unidos, como OpenAI, Google y Meta. Sin embargo, a finales de 2024, una empresa china llamada DeepSeek irrumpió con fuerza en la industria, causando revuelo en el sector tecnológico, los mercados financieros e incluso en algunos gobiernos. ¿Por qué? Porque han logrado crear modelos de IA que rivalizan con los mejores del mundo, pero de una manera más barata, eficiente y accesible.
Acompáñanos a entender cómo DeepSeek ha cambiado las reglas del juego y por qué su impacto va más allá de un simple avance tecnológico.
El origen de DeepSeek: De los mercados financieros a la IA
Todo comienza con Liang Wefeng, un estudiante de ingeniería en China que, durante sus años universitarios, descubrió su pasión por las finanzas y el trading algorítmico. Tras graduarse en 2016, fundó High Flyer, una firma de inversión basada en algoritmos de trading automatizado (quant trading). Con el tiempo, su empresa creció hasta manejar 8 mil millones de dólares en activos, convirtiéndose en una de las cuatro principales firmas de inversión en China.
Sin embargo, Liang tenía un sueño más ambicioso: aplicar la inteligencia artificial a los mercados financieros para mejorar la toma de decisiones. Así que, en 2021, comenzó a comprar miles de tarjetas gráficas de Nvidia, preparándose para entrenar modelos de IA. Dos años después, el 17 de julio de 2023, fundó DeepSeek, una empresa con menos de 200 empleados que, a finales de 2024, lanzaría dos modelos de IA que pusieron el mundo patas arriba:
- DeepSeq R1
- DeepSeq V3
Estos modelos no solo compiten con los mejores sistemas de inteligencia artificial como GPT-4o de OpenAI y Claude 3.5 de Anthropic, sino que incluso los superan en algunas pruebas.
¿Por qué DeepSeek ha causado tanto impacto?
Hay tres razones principales por las que DeepSeek ha generado tanto revuelo:
1️⃣ Es una IA extremadamente avanzada y eficiente
Los modelos de DeepSeek han sido sometidos a pruebas estándar que miden la inteligencia y capacidad de razonamiento de una IA. En muchos casos, superaron a modelos como GPT-4o en áreas como:
- MMLU Redux → Pruebas de conocimiento general y razonamiento lógico.
- DROP (Descriptive Reasoning Over Paragraphs) → Capacidad de interpretar y razonar sobre textos largos.
- EIDER Polyglot → Dominio de múltiples lenguajes de programación.
Lo más impresionante es que lograron estos resultados gastando mucho menos dinero y recursos computacionales que sus competidores.
2️⃣ Es mucho más barata que la competencia
Uno de los mayores costos en IA no es solo entrenar los modelos, sino ejecutarlos. OpenAI, Google y Meta invierten miles de millones de dólares en mantener sus modelos funcionando.
DeepSeek, en cambio, ha logrado reducir estos costos con varias optimizaciones, lo que les permite ofrecer su API hasta 10 veces más barata que la de OpenAI.
Para ponerlo en contexto:
- GPT-4o cobra $10 por millón de tokens generados.
- DeepSeek V3 cobra solo $1,1 por millón de tokens.
Este precio es una amenaza directa para OpenAI y otras empresas, ya que muchas compañías podrían cambiarse a DeepSeek simplemente por los costos más bajos.
3️⃣ Es de código abierto: Puedes descargarlo y ejecutarlo en tu propio hardware
Mientras que OpenAI y Google mantienen sus modelos cerrados y privados, DeepSeek ha decidido hacer algo radical: liberar su modelo completamente gratis.
Si tienes la infraestructura necesaria (como servidores con múltiples tarjetas gráficas de alto rendimiento), puedes descargar DeepSeek V3 y R1 y ejecutarlos sin depender de los servidores de la empresa.
Esto ha provocado una avalancha de descargas:
➡️ Más de 1 millón de personas han bajado el modelo en la primera semana.
La industria de la IA nunca había visto algo así.
Las innovaciones clave de DeepSeek
¿Cómo logró DeepSeek alcanzar este nivel de eficiencia y rendimiento? Optimizando cada aspecto del entrenamiento y la ejecución de sus modelos.
Estas son las cuatro claves de su éxito:
🔹 1. Mixture of Experts (Mezcla de Expertos)
En lugar de usar una sola red neuronal gigante, como GPT-4o, DeepSeek utiliza varios modelos más pequeños, especializados en distintas áreas.
Cuando haces una pregunta, un “enrutador” decide cuál de estos expertos es el mejor para responderla. Esto permite:
✅ Reducir el consumo de energía.
✅ Mejorar la eficiencia del modelo.
✅ Obtener respuestas más precisas en temas específicos.
🔹 2. Uso de precisión FP8 para ahorrar recursos
DeepSeek ha optimizado sus cálculos utilizando una técnica llamada FP8 (Floating Point 8), que permite representar números con menos memoria, acelerando el entrenamiento y ejecución del modelo sin perder precisión.
🔹 3. Generación de múltiples tokens en paralelo
A diferencia de GPT-4o, que genera una palabra a la vez, DeepSeek predice varias palabras en cada iteración, acelerando su velocidad de respuesta.
🔹 4. Entrenamiento en hardware limitado con optimización extrema
Estados Unidos impuso restricciones a la venta de chips de alta gama en China. En lugar de darse por vencidos, DeepSeek encontró la forma de optimizar el software para que su IA funcionara con chips menos potentes.
Utilizando 2048 tarjetas Nvidia H800 (una versión limitada para China), DeepSeek programó un sistema especial de compresión y transmisión de datos, logrando resultados comparables a los chips H100 que usan OpenAI y Google.
Esto demostró que, en vez de depender de hardware más potente, la clave está en mejorar el software.
DeepSeek vs. OpenAI: ¿Quién lleva la delantera?
Aunque DeepSeek ha demostrado un rendimiento impresionante, hay algunas diferencias clave con OpenAI:
🔹 DeepSeek es mejor en tareas técnicas y científicas → Gracias a su método de entrenamiento automatizado, destaca en problemas matemáticos y lógicos.
🔹 ChatGPT es mejor en creatividad y conversaciones naturales → OpenAI ha afinado su IA con feedback humano, haciéndola más fluida y expresiva en diálogos.
🔹 DeepSeek es más barato y accesible → Su código abierto permite que cualquiera lo descargue y modifique, mientras que OpenAI mantiene su tecnología cerrada.
A pesar de estas diferencias, el hecho de que una empresa con menos de 200 empleados y hardware limitado haya logrado competir con gigantes como OpenAI y Google es una señal de que el monopolio estadounidense en IA podría estar llegando a su fin.
Conclusión: ¿Qué significa DeepSeek para el futuro de la IA?
DeepSeek no es solo un modelo de IA más. Representa un cambio en la industria:
✅ Demuestra que se pueden crear IAs avanzadas con menos recursos.
✅ Rompe con el monopolio de las grandes tecnológicas, ofreciendo alternativas más accesibles.
✅ Fuerza a empresas como OpenAI y Google a repensar su estrategia de precios y accesibilidad.
A largo plazo, la pregunta clave es: ¿Cómo responderán Estados Unidos y sus empresas a este desafío?
Lo que está claro es que DeepSeek ha marcado un antes y un después en la inteligencia artificial. Y esto es solo el comienzo. 🚀
📢 Aviso de Transparencia
Este contenido ha sido generado utilizando inteligencia artificial en nuestros propios servidores, empleando modelos avanzados como Whisper-small para transcripción y DeepSeek R1 para generación de texto.
Queremos agradecer a @nategentile7 por su esfuerzo y excelente contenido. 🙌
Si desea más información sobre cómo integrar modelos de IA en su empresa, no dude en contactarnos. 🚀
📺 Video original: