인공지능
DeepSeek: 변동성이 크고 조기 도입된 상업화 AI?

DeepSeek가 AI 환경을 뒤흔들다
2025년 1월 27일 월요일에 금융 시장을 확인한 사람이라면 “무슨 일이 일어난 거지?”라는 질문을 했을 가능성이 높다. 지금까지 멈출 수 없을 것처럼 보였던 Nvidia 주가 상승이 단 하루 만에 18% 급락하면서 중단되었다.
시가총액이 5,600억 달러나 감소한 상황은, 하루 만에 이렇게 큰 가치를 잃은 기업은 전례가 없다. 이는 Nvidia 투자자들이 이제 주식의 극심한 변동성에 익숙해지고 있다는 의미이며, 이 기업이 10대 단일일 하락 중 8번을 차지했다는 사실에서도 알 수 있다.
트리거는 DeepSeek라는 중국산 LLM(대규모 언어 모델)의 출시였다. 이 모델은 OpenAI와 기타 주요 AI 기업들의 최고 제품과 맞먹는 성능을 자랑한다. 다만 오픈소스이며 매우 낮은 가격에 접근할 수 있다. 또한 양적 헤지펀드의 “부수 프로젝트”로 단 600만 달러만 투자해 개발된 것으로 주장된다.
만약 사실이라면, AI 개발이 엄청난 컴퓨팅 비용을 필요로 하고 수천억, 심지어 수조 달러 규모의 데이터 센터 투자가 필수라는 기존 서사를 뒤집을 수 있다. AI 하드웨어의 선두주자인 Nvidia가 투자자들의 공포에 가장 큰 타격을 입은 것은 놀라운 일이 아니다.
소란이 어느 정도 가라앉은 지금, DeepSeek가 실제로 무엇을 할 수 있는지, 그리고 중국 AI 산업이 앞으로 어떤 움직임을 보일지 살펴보자.
DeepSeek 배경
High‑Flyer
DeepSeek는 중국의 금융 트레이딩·양적 헤지펀드인 High‑Flyer에 의해 개발되었으며, 창업자는 Liang Wenfeng이다.
Liang은 40세이며 처음에는 머신 비전 분야에서 일했다. 그는 30대에 High‑Flyer를 설립하고 AI를 활용한 트레이딩 전략을 선도했으며, 현재는 80억 달러 규모의 자산을 관리하고 있다.
보통은 매우 신중한 인물인 Liang은 2025년 1월 20일 베이징에서 AI 기술에 관한 회의에 참석하면서 중국 총리 Li Qiang(중국공산당 정치국 상무위원회 2위) 옆에 앉아 있는 모습이 포착되었다.

출처: Nigel D’Souza
초기 혼란 속에서 Liang의 드문 공개 출연 때문에 많은 매체가 DeepSeek와 전혀 무관한, 같은 이름을 가진 인테리어 디자이너의 사진을 사용했다는 점을 밝혀둔다. 그는 인테리어 디자이너이다.

“Liang Wenfeng이 아니다” – 출처: Business Day
DeepSeek
2021년, Liang Wenfeng는 미국 제재가 시행되기 전에 약 10,000개의 H800 Nvidia 칩을 구매했고, 이를 바탕으로 DeepSeek를 시작했으며 High‑Flyer AI의 최고 연구원들을 프로젝트에 투입했다.
H800 칩은 더 진보된 H100 및 B200에 비해 성능은 낮지만 전력 소비가 세 배에 달한다.

출처: Technical City
DeepSeek는 DeepSeek V3 모델을 2개월 미만, 558만 달러에 학습시켰다고 주장한다. 물론 10,000개의 H800 칩 비용을 포함하지는 않지만, 지금까지의 어떤 LLM보다도 수십 배 저렴한 비용이다.
실제로 이는 OpenAI, Meta, Microsoft, Google 등 AI 팀 리더들의 연봉보다도 저렴한 수준이다.
DeepSeek 성능
저렴한 개발 비용과 더불어 분석가와 투자자를 놀라게 한 점은 DeepSeek의 성능이 최신 OpenAI 모델 및 기타 최고 AI 기업들의 모델과 비슷하거나 심지어 뛰어나다는 것이었다. 최근 발표된 AGI 후보인 o3도 포함한다.

출처: GitHub
첫 반응은 부정 행위가 있었을 가능성과 개발 비용 및 시간에 대한 조작 의혹이었다(아래에서 자세히 다룸).
어쨌든 DeepSeek의 방법론은 기존 AI 산업이 사용해 온 방식보다 10~100배 효율적일 가능성이 크다.
미국 AI 산업에 대한 추가 충격은 DeepSeek의 가격 정책이었다. 토큰당 가격이 1달러 이하로, 경쟁사 대비 3%~5% 수준에 불과하다.

출처: Jason Clarck
“우리는 비용을 낮췄다. 첫째, 차세대 모델 구조를 탐색하면서 비용이 감소했으며, 둘째, AI와 API 서비스는 모두가 저렴하고 접근 가능해야 한다고 믿는다.”
완벽한 타이밍
DeepSeek V3의 충격적인 출시는 회사가 최대 효과를 노려 잘 조율한 것으로 보인다.
이는 트럼프 대통령이 “Project Stargate”라는 5천억 달러 규모의 20개 AI 메가 데이터센터 구축 프로젝트를 발표한 며칠 뒤에 일어났다. 이 프로젝트는 SoftBank (SFTBY ), OpenAI, 그리고 Oracle (ORCL )이 주도한다.
시장이 공황에 빠진 동안, 미국 대통령은 크게 동요하지 않은 듯 보였다.
“더 저렴하게 할 수 있다면, 더 적은 비용으로 같은 결과를 얻을 수 있다면, 그것은 우리에게 좋은 일이다.”
그는 또한 이번 돌파구에 대해 크게 우려하지 않으며, 미국이 여전히 이 분야의 주도적인 플레이어가 될 것이라고 덧붙였다.
출처: BBC
LLM 이후, 이미지 생성
LLM에서 이룬 성과를 바탕으로 DeepSeek는 이제 AI 이미지 생성 분야와 Janus‑Pro‑7B 출시를 노리고 있다.

출처: Hugging Face
Midjourney, DALL‑E 등 기존 이미지 생성기와 비교해 실제 성능에 대한 논쟁이 있지만, 그 자체만으로도 인상적이다.
그리고 DeepSeek V3 LLM에서 보인 패턴이 그대로 이어진다면, 이미지 생성 역시 놀라울 정도로 효율적일 가능성이 크다.
즉각적인 영향
AI 산업에 미친 영향
DeepSeek가 AI 산업을 강타하면서 즉각적인 결과가 몇 가지 나타났다:
- 시장 혼란: Nvidia 주가와 나스닥 전체가 AI 하드웨어에 수천억 달러가 낭비될 가능성을 깨닫자 급락했다(아래에서 자세히 논의).
- AI 경쟁 가속: 몇 달 전까지 미국 기술 거물들이 중국을 “무시”하고 “무관”하다고 평가했지만, 이제는 태평양을 넘어 새로운 AI 경쟁이 시작됐다.
- 하룻밤 성공: DeepSeek는 출시 직후 앱스토어에서 가장 많이 다운로드된 앱이 되었다.
- 오프라인 테스트: 많은 사용자가 고성능 가정용 컴퓨터에서도 로컬 실행이 가능한지 테스트하고 있다. 요구되는 컴퓨팅 파워가 기존 LLM에 비해 크게 낮아 보인다.
부수적 피해
DeepSeek가 초래한 피해는 미국 AI·기술 기업들의 이미지와 잠재적 수익에만 국한되지 않는다.
예를 들어, 메가와트 규모 AI 데이터센터에 전력을 공급할 핵심 기업들이 더 큰 타격을 입었다. 2025년 1월 27일, SMR 개발업체 Nuscale (SMR )은 27.5% 하락했고, 우라늄 채굴업체 Cameco는 15% 하락했다.
또 다른 부수적 피해자는 미국이 아닌 기술주이다. Nvidia 공급업체인 일본의 Advantest는 8.6% 하락했고, SoftBank 주식은 8.3% 떨어졌다. 한편, 네덜란드의 반도체 제조업체 ASML도 6.5% 하락했다.
DeepSeek는 어떻게 이런 일을 해냈는가?
아직 확정된 답은 없다
출시 직후라 아직 뜨거운 논쟁이 이어지고 있다. 몇 가지 알려진 사실을 바탕으로 다양한 관점을 살펴볼 수 있다.
첫 번째 사실은, DeepSeek V3가 지금까지 발표된 최고의 AI와 동등한 수준이라는 점이다.
더 중요한 점은, 오픈소스이기 때문에 이미 많은 사람들이 적은 컴퓨팅 파워만으로도 충분히 동작한다는 것을 테스트하고 확인하고 있다는 것이다.
“DeepSeek R1은 내가 지금까지 본 가장 놀랍고 인상적인 돌파구 중 하나다. 오픈소스로서 전 세계에 큰 선물을 안겨준다.”
따라서 단순히 “과대광고”나 중국 정부의 음모 결과라고 치부해서는 안 된다. 이는 Marc Andreessen, Chamath Palihapitiya와 같은 실리콘밸리 거물들의 의견이기도 하다.
“AI 모델 구축은 돈 함정이다 (…) 오픈소스가 명백한 승자다.
폐쇄형 AI는 최고의 모델을 비밀로 유지하고 기업에 판매하거나, 혹은 엄청난 소비자 앱을 만들려 애쓸 수밖에 없다.
2024년 7월 Liang Wenfeng 인터뷰도 몇 가지 통찰을 제공한다.
다른 접근 방식
첫 번째 가능한 설명은 DeepSeek가 AI 개발에 있어 전혀 다른 전략을 채택했다는 것이다.
핵심 요인은 이것이 Liang Wenfeng의 회사 내부 프로젝트이며, 벤처캐피털이 투자한 사업이 아니라는 점이다. 이 점에서 일론 머스크가 자체 자금으로 Tesla와 SpaceX를 시작한 초기 시절과 약간 닮았다.
이 차별화는 DeepSeek가 Llama를 복제해 빠르게 애플리케이션을 만들기보다 자체 모델 구조 개발에 집중하도록 만들었다.
“우리의 목표는 AGI(인공 일반 지능)이며, 제한된 자원 안에서 우수한 역량을 달성하기 위해 새로운 모델 구조를 탐구해야 한다. 이는 규모 확대를 위한 기초 연구다. 아키텍처뿐 아니라 데이터 큐레이션과 인간과 유사한 추론도 연구했으며, 이는 모두 우리 모델에 반영된다.”
이러한 문화는 수익보다 혁신에 더 중점을 두는 High‑Flyer 헤지펀드의 “직업”과도 일치한다. 혁신 자체가 선언된 목표다.
“30년 동안 우리는 수익을 혁신보다 우선시했다. 혁신은 순수히 비즈니스만을 위한 것이 아니라 호기심과 창의적 야망이 필요하다. 우리는 오래된 습관에 얽매였지만, 이것도 하나의 단계다.
가장 오래 지속 가능한 미국 기업들은 장기 R&D에 기반한 기술 대기업이다.”
이 관점에서 보면 DeepSeek 문화는 지속 가능한 경쟁 우위가 될 수 있으며, 대부분 AI 사상가들을 비판하는 의미도 담고 있다.
“중국의 AI가 영원히 추종자에 머물 수는 없다. 흔히 우리는 중국과 미국 AI 사이에 1~2년 차이가 있다고 말하지만, 실제 차이는 원본성과 모방 사이에 있다. 이 상황이 바뀌지 않으면 중국은 언제나 추종자가 될 것이다. 어느 정도 탐구는 불가피하다.”
AI 기술의 자연스러운 진화
또 다른 가능성은 더 많은 연구자들이 AI 제작 기술을 습득하면서 혁신이 지속적으로 분야를 앞당기는 것이다. DeepSeek가 이룬 성과는 기술이 성숙해지면서 어느 시점에선가 어느 스타트업이든 구현할 수 있는 수준이었다. 또한 제재로 인해 고성능 칩 접근이 제한된 상황에서, 중국 AI 기업들은 적은 자원으로 더 많은 것을 이루는 데 집중하게 되었다.
이는 또한 수익을 극대화하려는 폐쇄형, 영리 시스템보다 오픈소스 소프트웨어가 장기적으로 우위에 있다는 주장과도 맞물린다.
이 관점은 2025년에만 수백억 달러를 투자하려던 대형 기술 기업들의 계획을 잘 반영하지 못한다는 점에서도 비판받는다.
따라서 DeepSeek의 우수성을 비난하기보다는, 과거 혁신적이던 대형 기술 기업들이 관료화된 점을 지적하는 것이 더 정확하다. 이는 중국 기업이든 미국 기업이든 마찬가지다.
A Conspiracy
서구와 유라시아(러시아·중국·이란) 간의 격렬한 대국 경쟁 상황에서, 많은 이들이 DeepSeek를 미국 경제의 핵심 부문을 겨냥한 외국 적대 작전으로 빠르게 해석했다.
가장 쉽게 일축할 수 있는 음모론은 DeepSeek가 서구 AI를 그대로 복제했거나 성능을 과장했다는 주장이다. 하지만 DeepSeek는 오픈소스이며, 누구든 자유롭게 배포·수정할 수 있기 때문에 스파이웨어나 CCP 검열 도구라는 주장은 논리적으로 맞지 않는다.
그럼에도 불구하고, DeepSeek가 공식적으로 수출이 금지된 고성능 칩에 접근했을 가능성은 있다. 만약 그렇다면 기업이 이를 공개적으로 인정하지 않고 거짓말을 할 이유가 있다.
정부의 은밀한 지원 가능성도 있다. 직접적인 자금 지원부터 불법적으로 반입된 H100 Nvidia 칩 대규모 클러스터 제공까지. 예를 들어 많은 칩이 싱가포르에 판매된 뒤 다시 중국에 재수출되는 경우가 있다.
“중국 연구소는 생각보다 훨씬 많은 H100을 보유하고 있다. 제 이해로는 DeepSeek가 약 5만 대의 H100을 보유하고 있는데, 이는 수출 통제 때문에 공개할 수 없다.”
또 다른 논쟁점은 학습 비용이 독립적으로 검증되지 않았다는 것이다.
마지막 가능성은 DeepSeek가 Nvidia 주가에 대해 대규모 공매도를 진행한 뒤, 뛰어난 주장을 내세워 시장을 교란했을 가능성이다. High‑Flyer는 헤지펀드이므로 이런 행위가 시장 조작으로 이어질 위험도 있다.
첫 번째 인사이트
AI 분야는 믿을 수 없을 정도로 빠르게 진화하고 있으며, DeepSeek는 이미 몇 가지 중요한 변화를 일으켰다:
- 우리는 이제 초고효율 LLM 및 일반 AI 모델을 생성하는 새로운 방법을 갖게 되었다.
- 오픈소스 AI는 (아이러니하게도) OpenAI가 추진하는 폐쇄형 모델에 맞설 수 있는 확실한 전투력을 확보했다.
- 미국과 중국 간 AI 경쟁이 더욱 격화되고 있다.
- 고성능 AI 칩의 중국 수출 제한은 실패로 보인다. DeepSeek가 어쨌든 칩에 접근했거나, 아예 필요하지 않았기 때문이다.
- 배경에는 Huawei가 DeepSeek에 더 많은 칩을 제공할 가능성도 있다.
- 그럼에도 불구하고 여전히 시도하는 이들이 있을 것이다.
“DeepSeek가 R1을 구축한 사실은 2022년 10월 수출 통제 실패의 영향을 보여준다. 그러나 곧 우리는 2023년 10월 수출 통제 성공을 체감하게 될 것이다.”
DeepSeek는 잊고, TikTok 복수는?
DeepSeek를 둘러싼 공황 분석과 음모론 속에서 중요한 소식이 놓쳤다.
또 다른 중국 기업인 ByteDance(틱톡 모회사)는 1월 24일에 Doubao‑1.5‑pro를 출시했다. 이는 ChatGPT‑4o에 대한 자체 대응 모델이다.
가격 역시 미국 경쟁 모델보다 훨씬 저렴하다. DeepSeek 모델보다 5배, OpenAI GPT‑4o보다 200배 이상 저렴하다.
새로운 Doubao 1.5 Pro는 보다 효율적인 학습 방식을 채택했으며, ByteDance는 이를 통해 시스템 성능을 유지하면서 비용을 크게 낮출 수 있다고 주장한다.
이는 모델의 학습과 실시간 사용을 결합한 설계 덕분에 인프라 비용을 낮추면서도 더 나은 결과를 얻을 수 있게 한다.
이 모델은 OpenAI, Anthropic, Alibaba의 주요 모델들을 능가한다.

출처: AI Entrepreneur
만약 이것이 독립적인 노력의 결과라면, 칩 부족 현상이 오히려 중국 기업들을 효율성 경쟁으로 몰아넣어 미국 AI 기업들의 무제한 현금·컴퓨팅 파워에 대한 자만심을 드러낸다.
또한 ByteDance가 미국에서 TikTok 금지나 강제 매각 위협에 맞서기 위해 경쟁력을 강화하고 반격 방안을 모색했을 가능성도 충분히 있다.
다른 중국 모델
이제 두 기업이 가격 대비 비슷한 성능으로 AI 시장을 장악하고 있으니, 다른 중국 AI 모델에도 관심이 쏠릴 것이다. 예를 들면:
DeepSeek에만 초점을 맞추기보다 조망하면, 현재는 중국에서 새로운 고성능 AI 모델이 물결처럼 쏟아지고 있는 상황이다.
결론
AI 전쟁이 격화됨에 따라, 자금 조달과 빠른 컴퓨팅 파워 확보만이 유일한 결정 요인이 아니라는 점이 점점 명확해지고 있다.
LLM 토큰 가격이 동일 성능에 대해 하룻밤 사이에 50~200배 급락한다면, 해당 분야의 수익성 자체가 어떻게 될지는 아직 불투명하다. 하지만 이는 과도한 반응을 일으키지는 않을 것이다. 결국 저렴하고 효율적인 AI는 대규모 채택과 전방위적인 존재감을 의미한다.
이는 AI 칩에 대한 궁극적인 수요가 여전히 높게 유지될 것이며, 초기 예측보다 다소 낮아지더라도 높은 수준을 유지할 것이라는 의미이다.
동일하게 중요한 점은, 오픈소스를 통해 접근 가능한 초저가 LLM이 보편화되면, AI가 노동 시장, 생산성, 제조, 교육, 국제 무역 등 다양한 영역에 미칠 영향이 조기에 나타날 것이라는 점이다.












