Inteligência artificial
DeepSeek: Uma Chegada Volátil e Prematura da IA Comercializada?

DeepSeek Destruindo o Panorama da IA
Para quem não percebeu ao observar os mercados financeiros na segunda‑feira, 27th de janeiro de 2025, a pergunta provavelmente foi: “O que aconteceu?” A ascensão aparentemente imparável do preço das ações da Nvidia – até agora – foi interrompida por uma queda brutal de 18 % em apenas um dia.
Com uma perda de capitalização de mercado de US$ 560 bi, nunca antes uma única empresa perdeu tanto valor em um dia. Por outro lado, os investidores da Nvidia provavelmente estão se acostumando com a extrema volatilidade das ações, que já registrou 8 das 10 maiores quedas de um único dia.

Fonte: Visual Capitalist
O gatilho foi o lançamento da DeepSeek, um LLM (Large Language Model) fabricado na China que rivaliza com os melhores produtos da OpenAI e de outras empresas líderes em IA em desempenho. Exceto que ele é código aberto e oferece acesso por um preço muito baixo. Também se afirma que foi desenvolvido com apenas US$ 6 mi como um “projeto paralelo” de um fundo de hedge quantitativo.
Se for verdade, isso pode derrubar a narrativa de que desenvolver IA será extremamente intensivo em computação e exigirá bilhões, senão trilhões, em data centers de IA. Como líder em hardware de IA, não é surpreendente que a Nvidia tenha sido a mais impactada pelo pânico dos investidores.
Com a poeira ainda assentando, vamos examinar o que a DeepSeek realmente pode fazer e o que mais a indústria chinesa de IA pode fazer em breve.
DeepSeek Background
High-Flyer
DeepSeek foi desenvolvida por um fundo de trading financeiro / hedge fund quantitativo chinês, High-Flyer, fundado por Liang Wenfeng.
Liang tem 40 anos e inicialmente trabalhou em visão computacional. Ele fundou a High-Flyer em 2015, na casa dos 30, pioneirando o uso de IA em estratégias de negociação, aproveitando aprendizado de máquina. O fundo agora administra US$ 8 bi em ativos.
Normalmente muito discreto, Liang foi visto sentado ao lado do Premier chinês Li Qiang (o membro de segunda posição no Comitê Permanente do Politburo do Partido Comunista Chinês) em uma reunião sobre tecnologia de IA em Pequim, em 20 de janeiro de 2025.

Fonte: Nigel D’Souza
É importante observar que, na confusão inicial e devido às raras aparições públicas de Liang, muitos veículos de mídia usaram a foto de alguém com o mesmo nome, mas totalmente não relacionado à DeepSeek, e que trabalha como designer de interiores.

“Not Liang Wenfeng” – Fonte: Business Day
DeepSeek
Em 2021, Liang Wenfeng comprou cerca de 10 000 chips H800 da Nvidia, antes das sanções dos EUA, para lançar o que se tornaria a DeepSeek, e trouxe os principais pesquisadores de IA da High‑Flyer para o projeto.
Os chips H800 são, relativamente, chips de baixo desempenho comparados aos mais avançados H100 e B200, consumindo três vezes mais energia.

Fonte: Technical City
A DeepSeek afirma ter treinado seu modelo DeepSeek V3 em menos de 2 meses, por US$ 5,58 mi. Embora isso não inclua o custo dos 10 000 chips H800, ainda é várias ordens de magnitude mais barato que qualquer outro LLM até agora.
Na verdade, isso tornaria o treinamento da DeepSeek V3 mais barato que apenas o salário dos líderes das equipes de IA da OpenAI, Meta, Microsoft, Google etc.
DeepSeek Performances
Combinado ao baixo preço de desenvolvimento, o que chocou analistas e investidores foi que o desempenho da DeepSeek é semelhante ou até superior ao modelo mais recente e melhor da OpenAI e de outras grandes empresas de IA, incluindo o recém‑lançado e aclamado como potencial AGI o3.

Fonte: GitHub
A reação imediata foi suspeitar de trapaça e que os tempos e custos de desenvolvimento eram falsos (mais detalhes abaixo).
Mas, de qualquer forma, é provável que o método da DeepSeek seja 10‑100 x mais eficiente do que o que a indústria de IA tem feito até agora.
O “chute extra” na indústria americana de IA foi o preço da DeepSeek. Com tokens muito abaixo de US$ 1, ele custa cerca de 3 %‑5 % do preço de todos os seus concorrentes.

Fonte: Jason Clarck
“Reduzimos os preços porque, primeiro, ao explorar estruturas de modelo de próxima geração, nossos custos diminuíram; segundo, acreditamos que tanto os serviços de IA quanto as APIs devem ser acessíveis e disponíveis para todos.”
Perfect Timing
O lançamento impactante da DeepSeek V3 foi, obviamente, bem coordenado pela empresa para máximo efeito.
Chegou poucos dias depois do anúncio do presidente Trump do “Projeto Stargate”, uma iniciativa de US$ 500 bi para construir 20 mega‑data centers de IA, liderada pela SoftBank (SFTBY ), OpenAI e Oracle (ORCL ).
Enquanto os mercados entraram em pânico, o presidente dos EUA pareceu pouco abalado.
“Se você puder fazer isso mais barato, se puder fazer isso [por] menos [e] chegar ao mesmo resultado final. Acho que isso é bom para nós.”
Ele também disse que não estava preocupado com a ruptura, acrescentando que os EUA permanecerão um player dominante no campo.
Fonte: BBC
After LLM, Image Generation
A conquista que a DeepSeek fez em LLM, agora está buscando repetir com geração de imagens por IA e o lançamento do Janus‑Pro‑7B.

Fonte: Hugging Face
Embora haja debate se ele é realmente tão bom quanto Midjourney, DALL‑E e outros geradores de imagens, ainda assim é impressionante.
E se seguir o padrão da DeepSeek v3 LLM, provavelmente será notavelmente eficiente.
The Immediate Effects
Impact On The AI Industry
Ao tomar a indústria de IA de surpresa, a DeepSeek teve algumas consequências imediatas:
- Turbolência de mercado: O preço das ações da Nvidia e todo o Nasdaq despencaram quando o mercado percebeu a implicação de potencialmente desperdiçar centenas de bilhões de dólares em hardware de IA (veja abaixo para discussão adicional).
- Aceleração da corrida da IA: À medida que a China deixa de ser descartada e “irrelevante”, segundo magnatas de tecnologia dos EUA alguns meses atrás, uma nova corrida de IA está agora em curso através do Pacífico.
- Sucesso da noite para o dia: A DeepSeek quase instantaneamente se tornou o aplicativo mais baixado na App Store.
- Testes offline: Muitas pessoas também estão testando como ele pode rodar localmente em seus computadores domésticos de alta performance, já que os requisitos de computação parecem massivamente menores que os LLMs anteriores.
Collateral damages
Os danos causados pela DeepSeek não se limitaram à imagem e aos potenciais lucros futuros das empresas americanas de IA e tecnologia.
Por exemplo, empresas nucleares inovadoras que se esperava formarem o núcleo do suprimento de energia para data centers de IA em escala megawatt foram atingidas ainda mais duramente: em 27th de janeiro de 2025, a desenvolvedora de SMR Nuscale (SMR ) caiu 27,5 % e a mineradora de urânio Cameco caiu 15 %.
Outra vítima colateral são as ações de tecnologia não‑americanas. Ações de tecnologia japonesas como Advantest, fornecedora da Nvidia, também caíram 8,6 % e as ações da SoftBank caíram 8,3 %. Enquanto isso, o fabricante holandês de chips ASML também recuou 6,5 %.
How Did DeepSeek Manage It?
No Definitive Answer Yet
Este é obviamente um tema ainda muito debatido pouco tempo após o lançamento. Podemos discutir alguns pontos de vista diferentes depois de considerar alguns fatos conhecidos.
O primeiro fato é que, não importa como chegou lá, a DeepSeek V3 é tão poderosa quanto a melhor IA lançada até agora.
Talvez mais importante, como é código aberto, muitas pessoas já estão testando e confirmando que requer muito menos poder de computação.
DeepSeek R1 é um dos avanços mais incríveis e impressionantes que já vi – e como código aberto, um presente profundo ao mundo.
Portanto, não deve ser descartada como mera “hype” ou resultado de alguma conspiração do governo chinês. Essa também é a opinião de pesos‑pesados do Vale do Silício como Marc Andreessen e Chamath Palihapitiya.
A construção de modelos de IA é uma armadilha financeira (…) Código aberto é o claro vencedor.
IA de código fechado será forçada a manter seus melhores modelos em segredo e vendê‑los a empresas OU tentar criar algum aplicativo de consumo incrível com ele.
Uma entrevista com Liang Wenfeng de julho de 2024, concedida logo após o lançamento da DeepSeek V2, também pode nos dar algumas ideias.
A Different Approach
A primeira explicação possível é que a DeepSeek simplesmente adotou uma estratégia diferente para o desenvolvimento de IA.
Um fator chave aqui é que este é um projeto interno da empresa de Liang Wenfeng, não um negócio financiado por VC. Nesse sentido, lembra um pouco os primeiros dias da Tesla e da SpaceX, que dependiam do próprio dinheiro de Elon Musk.
Essa diferença trouxe à DeepSeek um foco no desenvolvimento de sua própria estrutura de modelo, em vez de copiar a Llama para produzir rapidamente aplicações.
“Nosso objetivo é AGI (Inteligência Artificial Geral), o que nos obriga a explorar novas estruturas de modelo para alcançar capacidades superiores dentro de recursos limitados. Isso é pesquisa fundamental para escalonamento. Além da arquitetura, estudamos curadoria de dados e raciocínio semelhante ao humano – tudo refletido em nossos modelos.”
Isso também se reflete na cultura da empresa, menos focada em lucro, já que este é o “trabalho” do fundo de hedge High‑Flyer. Em vez disso, a inovação em si é o objetivo declarado.
“Por três décadas, enfatizamos lucro acima da inovação. Inovação não é puramente impulsionada por negócios; requer curiosidade e ambição criativa. Estamos presos a velhos hábitos, mas isso é uma fase.
As empresas americanas mais duradouramente lucrativas são gigantes de tecnologia construídos sobre P&D de longo prazo.”
Dessa perspectiva, a cultura da DeepSeek pode ser uma vantagem durável, e representa uma crítica severa à maioria dos líderes de pensamento em IA.
“Acreditamos que a IA da China não pode permanecer como seguidora para sempre. Frequentemente, dizemos que há um intervalo de um ou dois anos entre a IA chinesa e a americana, mas o verdadeiro intervalo está entre originalidade e imitação. Se isso não mudar, a China será sempre seguidora. Algumas explorações são inevitáveis.”
The Natural Evolution Of AI Tech
Outra opção é simplesmente que, à medida que mais pesquisadores desenvolvem habilidades para criar IA, as inovações continuam impulsionando o campo adiante. O que a DeepSeek alcançou, algum startup de IA improvisado estava destinado a fazer um dia à medida que a tecnologia amadurece. E devido a sanções que limitam o acesso a chips avançados, as empresas chinesas de IA são as primeiras a focar em fazer mais com menos.
Também pode ser considerado como a superioridade a longo prazo do software de código aberto versus sistemas fechados e com fins lucrativos que buscam maximizar lucro criando monopólios.
Esse ponto de vista também não reflete bem os centenas de bilhões de dólares que as grandes empresas de tecnologia planejavam gastar apenas em 2025.
Portanto, seria menos uma acusação de superioridade da DeepSeek e mais da burocratização das antigas empresas de Big Tech inovadoras, tanto chinesas quanto americanas.
Uma Conspiração
Provavelmente inevitável no contexto da intensa competição entre grandes potências entre o Ocidente e a Eurásia (Rússia / China / Irã), muitos foram rápidos em ver na DeepSeek uma operação hostil estrangeira contra a parte mais competitiva da economia dos EUA.
Uma teoria da conspiração claramente descartável é que ela é simplesmente uma cópia das IAs ocidentais ou falsifica seu desempenho, já que já está sendo confirmada independentemente. Como a DeepSeek é um software de código aberto, também é bastante ilógico atacá‑la como spyware ou ferramenta censurada pelo PCC, já que literalmente qualquer pessoa pode implantá‑la e modificá‑la livremente.
No entanto, um ponto válido é que a DeepSeek poderia ter tido acesso a chips mais avançados, oficialmente sancionados e proibidos de exportar para a China. Se for esse o caso, faria sentido a empresa não admitir publicamente e mentir sobre isso.
Uma possibilidade é apoio oculto do governo, desde financiamento direto até acesso a grandes clusters de chips H100 da Nvidia contrabandeados para o treinamento da IA. Sabemos, por exemplo, que muitos chips são vendidos para Cingapura e provavelmente revendidos para a China.
“Os laboratórios chineses têm mais H100s do que as pessoas pensam. Meu entendimento é que a DeepSeek tem cerca de 50 000 H100s, que não podem comentar, obviamente, porque vai contra os controles de exportação que os EUA impuseram.”
Alexandr Wang, CEO do provedor de dados de treinamento Scale AI
Outra contestação é o custo de treinamento, que não foi verificado independentemente.
Uma última possibilidade é que a DeepSeek, independentemente de qualquer conspiração geopolítica, poderia ter apostado massivamente contra as ações da Nvidia antes de divulgar suas alegações extraordinárias. A High‑Flyer é um fundo de hedge, afinal, embora isso possa ser considerado manipulação de mercado e, portanto, um movimento arriscado.
First Takeaways
A IA é um campo que está evoluindo incrivelmente rápido, e a DeepSeek já mudou o jogo em algumas maneiras importantes:
- Agora temos um novo método para gerar LLMs ultra‑eficientes e provavelmente modelos de IA em geral.
- IA de código aberto tem uma chance real de competir contra o modelo mais fechado promovido pela (ironicamente chamada) OpenAI.
- A competição entre EUA e China sobre IA está ficando ainda mais intensa.
- As sanções à exportação de chips avançados de IA para a China são um fracasso, seja porque a DeepSeek os acessou de qualquer forma, ou porque não precisou deles.
- Nos bastidores, a Huawei provavelmente também será uma concorrente séria ao fornecer mais chips à DeepSeek de qualquer forma.
- Isso pode não impedir alguns de ainda tentarem.
“O fato de a DeepSeek ter conseguido construir a R1 ilustra o impacto tardio da falha dos controles de exportação de outubro de 2022. Mas muito em breve, viveremos o sucesso dos controles de exportação de outubro de 2023.
Sr. Greg Allen, diretor do Wadhwani AI Centre no Centre for Strategic and International Studies.
Forget DeepSeek, What About TikTok Revenge?
Uma notícia importante foi ignorada nas análises em pânico e teorias da conspiração em torno da DeepSeek.
Outra empresa chinesa, a criadora do TikTok, ByteDance, lançou o Doubao‑1.5‑pro em 24th de janeiro – sua própria resposta ao ChatGPT‑4o.
Ele também tem preço muito mais barato que seus equivalentes americanos, 5 x mais barato que o modelo da DeepSeek e mais de 200 x menos caro que o GPT‑4o da OpenAI.
O novo Doubao 1.5 Pro usa uma abordagem mais eficiente para treinar seu modelo de IA, o que a ByteDance afirma ajudar a equilibrar o desempenho do sistema com custos menores.
Isso é alcançado por meio de um design que combina treinamento e uso em tempo real do modelo, otimizando-o para melhores resultados enquanto mantém os custos de infraestrutura baixos.
Fonte: Financial Express
Este modelo também supera os modelos líderes da OpenAI, Anthropic e Alibaba.

Fonte: AI Entrepreneur
Se isso for resultado de esforço independente, provaria que a escassez de chips forçou, se é que houve, as empresas chinesas a competir em eficiência, revelando um certo grau de complacência nas empresas americanas de IA, inundadas de dinheiro e poder de computação aparentemente ilimitados.
Também não é improvável que a ByteDance, após meses lutando para evitar uma proibição ou venda forçada do TikTok nos EUA, tenha buscado maneiras de competir e revidar.
Other Chinese Models
Com duas empresas agora aparentemente esmagando o mercado de IA em preço para desempenhos semelhantes, a atenção provavelmente se voltará para outros modelos chineses de IA também. Isso pode incluir:
Vendo isso de uma perspectiva mais ampla, ao invés de focar apenas na DeepSeek, parece mais um fluxo de novos e aprimorados modelos de IA da China, do que um ataque surpresa apenas da DeepSeek, como tem sido descrito até agora.
Conclusion
À medida que a guerra da IA se intensifica, não está mais tão claro que acesso a financiamento e escalonamento rápido de poder computacional será o único fator determinante.
Também não está claro quão lucrativo o setor será ao final, se os preços dos tokens de LLM podem despencar 50‑200 x da noite para o dia mantendo o mesmo desempenho. Entretanto, isso não deve gerar uma reação exagerada. No fim, IA mais barata e eficiente também significa IA que será massivamente adotada e onipresente.
Isso também significará que a demanda final por chips de IA provavelmente permanecerá alta, mesmo que ligeiramente menor que a prevista inicialmente.
Igualmente importante, LLMs amplamente disponíveis e ultra‑baratos, acessíveis por código aberto, significam uma data de chegada precoce para quaisquer efeitos que a IA deve ter nos mercados de trabalho, produtividade, manufatura, educação, comércio internacional, etc.











