Inteligencia artificial

DeepSeek: ¿Una llegada volátil y temprana de la IA comercializada?

mm
Securities.io maintains rigorous editorial standards and may receive compensation from reviewed links. We are not a registered investment adviser and this is not investment advice. Please view our affiliate disclosure.

DeepSeek destruyendo el panorama de IA

Para cualquiera que no estuviera al tanto y revisó los mercados financieros el lunes 27th de enero de 2025, la pregunta probablemente fue: “¿Qué pasó?” El ascenso aparentemente imparable del precio de las acciones de Nvidia —hasta ahora— fue interrumpido por una caída brutal del 18 % en un solo día.

Con una pérdida de capitalización de mercado de 560 000 millones de dólares, nunca antes una sola empresa había perdido tanto valor en un día. Además, los inversores de Nvidia probablemente se están acostumbrando a la extrema volatilidad de la acción, que ha protagonizado 8 de las 10 mayores caídas de un solo día.

El detonante fue el lanzamiento de DeepSeek, un LLM (Modelo de Lenguaje Extenso) fabricado en China que rivaliza con los mejores productos de OpenAI y otras firmas líderes de IA en rendimiento. Excepto que es código abierto y ofrece acceso a un precio muy bajo. También se afirma que fue desarrollado con solo 6 millones de dólares como un “proyecto secundario” de un fondo de cobertura cuantitativo.

Si es cierto, esto podría derribar la narrativa de que desarrollar IA será extremadamente intensivo en cómputo y requerirá miles de millones, si no billones, en centros de datos de IA. Como líder del hardware de IA, no es sorprendente que Nvidia haya sido la más impactada por el pánico de los inversores.

Con el polvo asentado un poco, examinemos lo que DeepSeek realmente puede hacer y qué más podría hacer pronto la industria china de IA.

DeepSeek Background

High-Flyer

DeepSeek fue desarrollado por un fondo de trading financiero / cuantitativo chino, High-Flyer, fundado por Liang Wenfeng.

Liang tiene 40 años y inicialmente trabajó en visión artificial. Fundó High-Flyer en 2015, cuando estaba en sus 30, pionero en el uso de IA en estrategias de trading, aprovechando el aprendizaje automático. El fondo ahora gestiona 8 000 millones de dólares en activos.

Generalmente muy discreto, Liang fue visto sentado junto al Premier chino Li Qiang (el segundo miembro del Comité Permanente del Politburó del Partido Comunista Chino) en una reunión sobre tecnología IA en Pekín el 20 de enero de 2025.

Debe señalarse que en la confusión inicial y debido a las raras apariciones públicas de Liang, muchos medios usaron la foto de alguien con el mismo nombre, pero totalmente ajeno a DeepSeek, y que trabaja como diseñador de interiores.

“No es Liang Wenfeng” – Fuente: Business Day

DeepSeek

En 2021, Liang Wenfeng compró alrededor de 10 000 chips H800 de Nvidia, antes de que las sanciones estadounidenses entraran en vigor, para lanzar lo que se convertiría en DeepSeek, y trajo a los principales investigadores de IA de High-Flyer al proyecto.

Los chips H800 son, relativamente hablando, chips de bajo rendimiento comparados con los más avanzados H100 y B200, con triple consumo de energía.

DeepSeek afirma haber entrenado su modelo DeepSeek V3 en menos de 2 meses, por 5,58 millones de dólares. Así que aunque esto no incluye realmente el costo de los 10 000 chips H800, sigue siendo varios órdenes de magnitud más barato que cualquier otro LLM hasta ahora.

De hecho, esto haría que el entrenamiento de DeepSeek V3 fuera más barato que solo el salario de los líderes de los equipos de IA en OpenAI, Meta, Microsoft, Google, etc.

DeepSeek Performances

Combinado con el bajo precio de desarrollo, lo que sorprendió a analistas e inversores fue que el rendimiento de DeepSeek es similar o incluso superior al del modelo más reciente y mejor de OpenAI y otras compañías top de IA, incluyendo el recién lanzado y aclamado como posible AGI o3.

Fuente: GitHub

La reacción inmediata fue sospechar de juego sucio y que los tiempos y costos de desarrollo eran falsos (más sobre eso a continuación).

Pero en cualquier caso, es probable que el método de DeepSeek sea de 10 a 100  veces más eficiente que lo que la industria de IA ha estado haciendo hasta ahora.

El impulso extra al sector de IA estadounidense fue el precio de DeepSeek. Con tokens mucho por debajo de 1 $, representa entre el 3 % y el 5 % del precio de todos sus competidores.

Fuente: Jason Clarck

“Reducimos los precios porque, primero, mientras explorábamos estructuras de modelo de próxima generación, nuestros costos disminuyeron; segundo, creemos que tanto los servicios de IA como los de API deberían ser asequibles y accesibles para todos.”

Liang Wenfeng

Perfect Timing

El lanzamiento impactante de DeepSeek V3 fue, obviamente, coordinado por la compañía para lograr el máximo efecto.

Llegó apenas días después del anuncio del presidente Trump del “Project Stargate”, una iniciativa de 500 000 millones de dólares para construir 20 mega‑centros de datos de IA, liderada por SoftBank (SFTBY ), OpenAI y Oracle (ORCL ).

Mientras los mercados entraban en pánico, el presidente de EE. UU. parece mayormente imperturbable.

“Si pudieras hacerlo más barato, si pudieras hacerlo [por] menos [y] obtener el mismo resultado final. Creo que eso es algo bueno para nosotros.”

También dijo que no le preocupaba el avance, añadiendo que EE. UU. seguirá siendo un jugador dominante en el campo.

Fuente: BBC

After LLM, Image Generation

El logro de DeepSeek en LLM, ahora busca repetirlo con generación de imágenes IA y el lanzamiento de Janus‑Pro‑7B.

Fuente: Hugging Face

Aunque hay debate sobre si es realmente tan bueno como Midjourney, DALL‑E y otros generadores de imágenes, es sin duda impresionante.

Y si sigue el patrón del LLM DeepSeek v3, es probable que sea notablemente eficiente.

The Immediate Effects

Impact On The AI Industry

Al tomar por sorpresa a la industria de IA, DeepSeek tuvo algunas consecuencias inmediatas:

  • Turbolencia del mercado: El precio de las acciones de Nvidia y todo el Nasdaq se desplomaron cuando los mercados comprendieron la implicación de potencialmente desperdiciar cientos de miles de millones de dólares en hardware de IA (ver más abajo para mayor discusión).
  • Aceleración de la carrera de IA: A medida que China pasa de ser descartada e “irrelevante” según los magnates tecnológicos de EE. UU. hace unos meses, ahora hay una nueva carrera de IA a través del Océano Pacífico.
  • Éxito nocturno: DeepSeek se ha convertido casi instantáneamente en la aplicación más descargada en la App Store.
  • Pruebas offline: Mucha gente también está probando cómo puede ejecutarse localmente en sus ordenadores domésticos de alta gama, ya que los requisitos de cómputo parecen ser mucho menores que los de LLMs anteriores.

Collateral damages

Los daños causados por DeepSeek no se limitaron a la imagen y posibles ganancias futuras de las compañías estadounidenses de IA y tecnología.

Por ejemplo, empresas nucleares innovadoras que se esperaban formar el núcleo del suministro eléctrico para centros de datos de IA a escala de megavatios fueron golpeadas aún más fuerte: el 27th de enero de 2025, el desarrollador de SMR Nuscale (SMR ) cayó un 27,5 % y la minera de uranio Cameco bajó un 15 %.

Otra víctima colateral son las acciones tecnológicas no estadounidenses. Las acciones tecnológicas japonesas como Advantest, proveedor de Nvidia, también cayeron un 8,6 % y las acciones de Softbank cayeron un 8,3 %. Mientras tanto, el fabricante holandés de chips ASML también cayó un 6,5 %.

How Did DeepSeek Manage It?

No Definitive Answer Yet

Esto es obviamente un tema todavía muy debatido poco tiempo después del lanzamiento. Podemos discutir algunos puntos de vista diferentes una vez consideremos algunos hechos conocidos.

El primer hecho es que, sea cual sea la forma en que llegó, DeepSeek V3 es tan potente como la mejor IA lanzada hasta ahora.

Quizá más importante, al ser código abierto, mucha gente ya está probando y confirmando que requiere mucho menos poder de cómputo.

DeepSeek R1 es uno de los avances más asombrosos e impresionantes que he visto — y como código abierto, un regalo profundo al mundo.

Marc Andreessen

Así que no debería descartarse como simple “hype” o el resultado de alguna conspiración del gobierno chino. Esta también es la opinión de pesos pesados respetados del Silicon Valley como Marc Andreessen y Chamath Palihapitiya.

Construir modelos de IA es una trampa de dinero (…) El código abierto es el claro ganador.

Las IA de código cerrado se verán obligadas a mantener sus mejores modelos en secreto y venderlos a empresas O intentar crear alguna aplicación de consumo increíble con ello.

Chamath Palihapitiya

Una entrevista con Liang Wenfeng de julio de 2024, dada justo después del lanzamiento de DeepSeek V2, también puede darnos algunas ideas.

A Different Approach

La primera posible explicación es que DeepSeek simplemente adoptó una estrategia diferente para el desarrollo de IA.

Un factor clave aquí es que se trata de un proyecto interno de la empresa de Liang Wenfeng, no de un negocio financiado por capital de riesgo. En ese sentido, recuerda un poco los primeros días de Tesla y SpaceX, basándose en el propio dinero de Elon Musk.

Esta diferencia le dio a DeepSeek un enfoque en desarrollar su propia estructura de modelo, en lugar de copiar Llama para producir rápidamente aplicaciones.

“Nuestro objetivo es AGI (Inteligencia General Artificial), lo que requiere que exploremos nuevas estructuras de modelo para lograr capacidades superiores con recursos limitados. Esta es investigación fundamental para escalar. Más allá de la arquitectura, hemos estudiado la curación de datos y el razonamiento similar al humano — todo reflejado en nuestros modelos.”

Liang Wenfeng

Esto también se refleja en la cultura de la empresa, menos enfocada en el beneficio, ya que este es el “trabajo” del fondo de cobertura High‑Flyer. En cambio, la innovación misma es el objetivo declarado.

“Durante tres décadas, hemos priorizado el beneficio sobre la innovación. La innovación no es puramente impulsada por el negocio; requiere curiosidad y ambición creativa. Estamos atados a viejos hábitos, pero esto es una fase.

Las compañías estadounidenses más rentables a largo plazo son gigantes tecnológicos construidos sobre I+D a largo plazo.”

Liang Wenfeng

Desde esta perspectiva, la cultura de DeepSeek podría ser una ventaja duradera, y representa una crítica mordaz a la mayoría de los líderes de pensamiento de IA.

“Creemos que la IA de China no puede seguir siendo una seguidora para siempre. A menudo decimos que hay una brecha de uno o dos años entre la IA china y la estadounidense, pero la verdadera brecha está entre originalidad e imitación. Si esto no cambia, China siempre será una seguidora. Algunas exploraciones son inevitables.”

Liang Wenfeng

The Natural Evolution Of AI Tech

Otra opción es simplemente que, a medida que más investigadores desarrollan habilidades para crear IA, las innovaciones siguen impulsando el campo hacia adelante. Lo que DeepSeek logró, algún startup de IA improvisado estaba destinado a hacer algún día a medida que la tecnología madura. Y debido a las sanciones que limitan el acceso a chips avanzados, las compañías chinas de IA son las primeras en enfocarse en hacer más con menos.

También podría considerarse como la superioridad a largo plazo del software de código abierto frente a los sistemas cerrados y con fines de lucro que buscan maximizar ganancias creando monopolios.

Este punto de vista tampoco refleja bien los cientos de miles de millones de dólares que las grandes tecnológicas habían planeado gastar solo en 2025.

Así que sería menos una acusación de superioridad de DeepSeek, y más una burocratización de las antiguas empresas innovadoras de Big Tech, tanto chinas como estadounidenses.

 A Conspiracy

Probablemente inevitable en el contexto de la intensa competencia de Grandes Potencias entre Occidente y Eurasia (Rusia / China / Irán), muchos fueron rápidos en ver en DeepSeek una operación hostil extranjera contra la parte más competitiva de la economía estadounidense.

Una teoría conspirativa claramente descartable es que simplemente es una copia de IA occidentales o que falsifica sus rendimientos, ya que ya está siendo confirmada de forma independiente. Como DeepSeek es un software de código abierto, también es bastante ilógico atacarlo como spyware o como una herramienta censurada por el PCCh, ya que literalmente cualquiera puede desplegarlo y modificarlo libremente.

Sin embargo, un punto válido es que DeepSeek podría haber obtenido acceso a chips más avanzados, oficialmente sancionados y prohibidos para exportar a China. Si ese es el caso, tendría sentido que la compañía no lo admitiera públicamente y mintiera al respecto.

Una posibilidad es apoyo oculto del gobierno, desde financiación directa hasta dar acceso a grandes clústeres de chips H100 de Nvidia contrabandeados para el entrenamiento de la IA. Sabemos, por ejemplo, que muchos chips se venden a Singapur, y probablemente se revenden a China.

“Los laboratorios chinos tienen más H100s de lo que la gente piensa. Mi entendimiento es que DeepSeek tiene alrededor de 50 000 H100s, de los que no pueden hablar, obviamente, porque va contra los controles de exportación que EE. UU. tiene en vigor.”

Alexandr Wang, CEO del proveedor de datos de entrenamiento Scale AI

Otro punto de discusión es el costo del entrenamiento, que no ha sido verificado de forma independiente.

Una última posibilidad es que DeepSeek, independientemente de cualquier conspiración geopolítica, pudiera haber apostado masivamente contra las acciones de Nvidia antes de lanzar sus afirmaciones sobresalientes. High‑Flyer es un fondo de cobertura, después de todo, aunque esto podría considerarse manipulación de mercado y, por tanto, un movimiento arriesgado.

First Takeaways

La IA es un campo que está evolucionando increíblemente rápido, y DeepSeek ya ha cambiado el juego en varias formas importantes:

  • Ahora tenemos un nuevo método para generar LLM ultra‑eficientes y probablemente modelos de IA en general.
  • La IA de código abierto tiene una oportunidad real de competir contra el modelo más cerrado promovido por (irónicamente llamado) OpenAI.
  • La competencia entre EE. UU. y China en IA se está volviendo aún más intensa.
  • Las sanciones a la exportación de chips avanzados de IA a China son un fracaso, ya sea porque DeepSeek los obtuvo de todos modos, o porque no los necesitó en absoluto.
    • En segundo plano, Huawei probablemente también será un contendiente serio para proporcionar a DeepSeek más chips de todos modos.
    • Esto podría no detener a algunos que aún lo intenten.

“El hecho de que DeepSeek haya logrado construir R1 ilustra el impacto rezagado del fracaso de los controles de exportación de octubre de 2022. Pero muy pronto, viviremos el éxito de los controles de exportación de octubre de 2023.

Sr. Greg Allen, director del Wadhwani AI Centre en el Centre for Strategic and International Studies.

Forget DeepSeek, What About TikTok Revenge?

Una pieza de noticia importante ha sido pasada por alto en los análisis frenéticos y teorías conspirativas que rodean a DeepSeek.

Otra compañía china, el creador de TikTok ByteDance, lanzó Doubao-1.5-pro el 24th de enero también — su propia respuesta al ChatGPT‑4o.

También está precio mucho más barato que sus contrapartes estadounidenses, 5 veces más barato que el modelo de DeepSeek y más de 200 veces menos costoso que el GPT‑4o de OpenAI.

El nuevo Doubao 1.5 Pro utiliza un enfoque más eficiente para entrenar su modelo de IA, lo que ByteDance dice que ayuda a equilibrar el rendimiento del sistema con costos más bajos.

Esto se logra mediante un diseño que combina tanto el entrenamiento como el uso en tiempo real del modelo, optimizándolo para mejores resultados mientras se mantienen bajos los costos de infraestructura.

Fuente: Financial Express

Este modelo también supera a los modelos líderes de OpenAI, Anthropic y Alibaba.

Si este es el resultado de un esfuerzo independiente, demostraría que la escasez de chips ha forzado a las compañías chinas a competir en eficiencia, revelando cierto nivel de complacencia en las compañías estadounidenses de IA, inundadas con efectivo y poder de cómputo aparentemente ilimitados.

También no es improbable que ByteDance, tras meses de lucha para evitar una prohibición o venta forzada de TikTok en EE. UU., haya buscado formas de competir y contraatacar.

Other Chinese Models

Con 2 compañías ahora aparentemente aplastando el mercado de IA en precio para rendimientos similares, la atención probablemente se dirigirá también a otros modelos de IA chinos. Esto podría incluir:

Visto desde una perspectiva de visión de pájaro en lugar de centrarse en DeepSeek, esto parece más una ola de nuevos, mejorados modelos de IA de China, que un golpe sorpresa de DeepSeek solo, como a menudo se describe ahora.

Conclusion

A medida que la guerra de IA se intensifica, ya no está tan claro que el acceso a financiación y escalar rápidamente la potencia de cómputo será el único factor determinante.

También es incierto cuán rentable será el sector al final, si los precios de los tokens de LLM pueden desplomarse de 50 a 200 veces de la noche a la mañana para el mismo rendimiento. Sin embargo, esto no debería provocar una reacción demasiado fuerte. Al final, IA más barata y eficiente también significa IA que será masivamente adoptada y omnipresente.

Esto también significará que la demanda final de chips de IA probablemente se mantendrá alta, incluso si es ligeramente menor que la pronosticada inicialmente.

Igualmente importante, los LLM ultra‑baratos y de amplio acceso a través de código abierto implican una fecha de llegada temprana para cualquier efecto que se espere que la IA tenga en los mercados laborales, la productividad, la manufactura, la educación, el comercio internacional, etc.

Jonathan es un ex investigador de bioquímica que trabajó en análisis genético y ensayos clínicos. Ahora es un analista de acciones y escritor de finanzas con un enfoque en innovación, ciclos del mercado y geopolítica en su publicación The Eurasian Century.