人工智能
DeepSeek:商品化人工智能的动荡和提前到来?
Securities.io 保持严格的编辑标准,并可能从审核过的链接中收取报酬。我们不是注册投资顾问,这不是投资建议。请查看我们的 关联公司披露.

DeepSeek 破坏人工智能格局
对于任何不了解 27 日周一金融市场的人来说第 2025 年 1 月,人们可能会问 "发生了什么"?Nvidia 股价看似势不可挡的上涨--直到现在--被一天之内暴跌 18% 所打断。
市值损失达 $5.6亿美金,从来没有一家公司在一天之内损失如此之多的价值。就这一点而言,Nvidia 的投资者可能已经习惯了该股的剧烈波动,在单日跌幅最大的 10 家公司中,Nvidia 占了 8 家。

资料来源 视觉资本家
其导火索是 DeepSeek 的发布,这是一款中国制造的 LLM(大型语言模型),其性能可与 OpenAI 和其他领先的人工智能公司的最佳产品相媲美。只不过它 开放源代码 并以极低的价格提供访问权限。据称,它的开发成本仅为 $6M,是一家量化对冲基金的 "副业"。
如果情况属实,这可能会颠覆一种说法,即开发人工智能将是极其密集的计算,需要数十亿甚至数万亿的人工智能数据中心。作为人工智能硬件的领导者,英伟达受到投资者恐慌情绪的影响最大,这并不奇怪。
尘埃落定之后,让我们来看看 DeepSeek 究竟能做些什么,以及中国人工智能产业可能很快还会做些什么。
DeepSeek 背景
高飞
DeepSeek 由一家中国金融交易/量化对冲基金开发、 高飞由梁文凤创办。
Liang 今年 40 岁,最初从事机器视觉工作。2015 年,30 多岁的他创立了 High-Flyer,率先利用机器学习将人工智能应用于交易策略中。该基金目前管理着 $8B 的资产。
2025 年 1 月 20 日,在北京举行的一次有关人工智能技术的会议上,人们看到梁建章坐在中国国务院总理李强(中共中央政治局常委,排名第二)的身边。

资料来源 奈杰尔-德索萨
需要指出的是,在最初的混乱中,由于梁在公开场合很少露面,很多媒体使用了与 DeepSeek 完全无关的同名人的照片,以及 室内设计师.

"不是梁文峰"--来源:《中国青年报》: 工作日
深度搜索
2021 年,梁文峰在美国制裁之前购买了约 1 万片 H800 英伟达芯片,启动了后来的 DeepSeek 项目,并将高朋人工智能的顶级研究人员带到了项目中。
与更先进的 H100 和 B200 相比,H800 芯片的性能相对较低,但功耗却是后者的三倍。

资料来源 技术城市
DeepSeek 声称已经训练了其 DeepSeek V3 型号 在不到两个月的时间里,就以 $5.58M 的价格完成。因此,虽然这并不包括 10,000 个 H800 芯片的成本,但仍比迄今为止的任何其他 LLM 便宜几个数量级。
事实上,这样一来,DeepSeek V3 的培训费用比 OpenAI、Meta、微软、谷歌等公司人工智能团队负责人的薪水还要低。
DeepSeek 性能
加上低廉的开发价格,令分析师和投资者震惊的是,DeepSeek 的性能与 OpenAI 和其他顶级人工智能公司最新、最好的模型相差无几,甚至更胜一筹、 包括刚刚发布并被誉为潜在的 AGI o3.

资料来源 GitHub
人们的第一反应是怀疑有人在搞鬼,时间和开发成本都是假的(下文将详细说明)。
但无论如何,DeepSeek 的方法很可能比人工智能行业迄今为止所做的工作效率高出 10-100 倍。
DeepSeek 的定价给了美国人工智能产业额外的一击。它的代币价格远低于 $1,约为所有竞争对手的 3%-5%。

资料来源 Jason Clarck
"我们之所以降价,首先是因为在探索下一代模式结构的同时,我们的成本降低了;其次,我们认为人工智能和 API 服务都应该是人人都能负担得起、人人都能获得的"。
完美时机
DeepSeek V3 极具影响力的发布显然是经过公司精心协调的,以达到最大效果。
就在几天前,美国总统特朗普宣布了 "星际之门计划",该计划耗资 $5 亿美元,由软银公司牵头建设 20 个人工智能超大型数据中心。 (SFTBY -2.56%)、OpenAI 和 甲骨文 (ORCL -3.79%).
虽然市场感到恐慌,但美国总统似乎并不担心。
"如果你能做得更便宜,如果你能[以]更少的成本[并]达到同样的最终结果。我认为这对我们来说是件好事"。
他还表示,他并不担心突破,并补充说美国仍将是该领域的主导者。
资料来源 英国广播公司
在 LLM 之后,图像生成
DeepSeek 在 LLM 方面取得的成就,现在正期待着通过人工智能图像生成和 Janus-Pro-7B 的发布来重现。

资料来源 拥抱的脸
虽然人们对它是否真的像《中途岛》、《DALL-E》和其他图像生成器一样出色还存在争议,但它还是给人留下了深刻印象。
如果它遵循 DeepSeek v3 LLM 的模式,很可能会非常高效。
直接影响
对人工智能产业的影响
DeepSeek 在人工智能行业掀起风暴的同时,也带来了一些直接影响:
- 市场动荡:当市场意识到可能在人工智能硬件上浪费数千亿美元的影响时,英伟达的股价和整个纳斯达克指数都崩溃了(有关此话题的进一步讨论,请参阅下文)。
- 加速人工智能竞赛:几个月前,中国还被美国科技大亨们认为是 "无关紧要 "的,而现在,一场新的人工智能竞赛正在太平洋彼岸展开。
- 一夜成名:DeepSeek 几乎瞬间成为 App Store 下载量最高的应用程序。
- 离线测试:许多人还在测试如何在高端家用电脑上本地运行,因为计算要求似乎比以前的 LLM 低得多。
附带损害赔偿
DeepSeek 造成的损失不仅限于美国人工智能和科技公司的形象和未来潜在利润。
例如,有望成为兆瓦级人工智能数据中心供电核心的创新型核电企业受到的打击更大:27第 2025 年 1 月,SMR 开发人员 努斯卡尔 (SMR -6.33%) 下跌 27.5%,铀矿商 Cameco 下跌 15%。
另一个连带受害者是非美国科技股。Nvidia 的供应商 Advantest 等日本科技股也下跌了 8.6%,软银股票下跌了 8.3%。同时,荷兰芯片生产商 ASML 也下跌了 6.5%。
DeepSeek 是如何做到的?
尚无明确答案
这显然是一个在发布后不久仍在热议的话题。只要我们考虑一些已知的事实,就可以讨论一些不同的观点。
第一个事实是,无论 DeepSeek V3 是如何做到的,它都与迄今为止发布的最佳人工智能一样强大。
也许更重要的是,由于它是开源的,许多人已经在测试并证实它所需的计算能力要低得多。
DeepSeek R1 是我见过的最令人惊叹和印象最深刻的突破之一,作为开放源代码,它是献给世界的一份厚礼。
因此,不应将其视为 "炒作 "或中国政府阴谋的结果。马克-安德森(Marc Andreessen)和查马特-帕利哈皮蒂亚(Chamath Palihapitiya)等受人尊敬的硅谷重量级人物也持此观点。
人工智能模型的构建是一个金钱陷阱(......)开源显然是赢家。
闭源人工智能将被迫对其最佳模型保密,并将其出售给企业,或尝试用其创建一些令人难以置信的消费者应用。
2024 年 7 月对梁文峰的采访就在 DeepSeek V2 发布之后,该报告也给了我们一些启示。
不同的方法
第一种可能的解释是,DeepSeek 只是采取了不同的人工智能开发策略。
这里的一个关键因素是,这是梁文锋公司的一个内部项目,而不是风险投资企业。在这方面,这有点让人想起特斯拉和 SpaceX 早期依靠埃隆-马斯克自己的资金的情况。
这种差异为 DeepSeek 带来了一个重点,那就是开发自己的模型结构,而不是照搬 Llama 的结构来快速制作应用程序。
"我们的目标是 AGI(人工通用智能),这要求我们探索新的模型结构,在有限的资源内实现卓越的能力。这是扩大规模的基础研究。除了架构,我们还研究了数据整理和类人推理,这些都体现在我们的模型中。"
这也反映在公司文化中,公司不再那么注重利润,因为这是 High-Flyer 对冲基金的 "工作"。相反,创新本身就是公司宣称的目标。
"三十年来,我们重利润轻创新。创新不是纯粹的商业驱动,它需要好奇心和创造性的雄心。我们被旧习惯所束缚,但这只是一个阶段。
最持久盈利的美国公司都是建立在长期研发基础上的科技巨头"。
从这个角度来看,DeepSeek 文化可能是一种持久的优势,它代表了对大多数人工智能思想领袖的责难批评。
"我们认为,中国的人工智能不能永远做追随者。我们经常说中美人工智能有一两年的差距,但真正的差距是原创和模仿的差距。如果这一点不改变,中国将永远是追随者。有些探索是不可避免的。"
人工智能技术的自然发展
另一种选择是,随着越来越多的研究人员掌握了创造人工智能的技能,创新将不断推动这一领域向前发展。随着技术的成熟,DeepSeek 所取得的成就,总有一天会被一些零散的人工智能初创公司实现。而由于制裁限制了先进芯片的获取,中国的人工智能公司首先要做的就是少花钱多办事。
这也可以被看作是开源软件相对于封闭的营利系统的长期优势,后者希望通过制造垄断来实现利润最大化。
这种观点同样不能很好地反映大科技公司计划在 2025 年花费的数千亿美元。
因此,这与其说是对 DeepSeek 优越性的控诉,不如说是对中美两国昔日创新型大科技公司官僚化的控诉。
一个阴谋
在西方与欧亚大陆(俄罗斯/中国/伊朗)之间激烈的大国竞争背景下,许多人很快就从 DeepSeek 中看到了针对美国经济中最具竞争力部分的外国敌对行动,这或许是不可避免的。
有一种明显不可信的阴谋论认为,DeepSeek 只是对西方人工智能的复制或伪造,因为这已经得到了独立证实。由于 DeepSeek 是一款开源软件,将其作为间谍软件或 CCP 审查工具进行攻击也是不合逻辑的,因为任何人都可以自由地部署和修改它。
不过,有一点是有道理的,那就是 DeepSeek 可能获得了更先进的芯片,而这些芯片是官方批准并禁止出口到中国的。如果是这样的话,该公司不公开承认并撒谎就说得通了。
一种可能是来自政府的隐性支持,从直接资助到提供大量走私的 H100 Nvidia 芯片集群,用于训练人工智能。例如,我们知道 大量芯片销往新加坡,很可能再转售给中国.
"中国实验室拥有的 H100 比人们想象的要多。据我所知,DeepSeek 大约有 5 万台 H100,但他们显然不能谈论这些,因为这违反了美国的出口管制。
另一个争论点是培训费用,这一点尚未得到独立核实。
最后一种可能是,DeepSeek 可能会在发布未决索赔之前,大举押注 Nvidia 的股票,而不考虑任何地缘政治阴谋。High-Flyer 毕竟是一家对冲基金,尽管这可能被认为是操纵市场,因此是一种冒险之举。
初步收获
人工智能领域的发展速度令人难以置信,而 DeepSeek 已经在一些重要方面改变了游戏规则:
- 我们现在有了一种新方法,可以生成超高效的 LLM 模型和一般可能的人工智能模型。
- 与 OpenAI(具有讽刺意味的名字)所倡导的封闭模式相比,开源人工智能具有坚实的战斗力。
- 中美两国在人工智能领域的竞争日趋激烈。
- 对向中国出口先进人工智能芯片的制裁是失败的,要么是因为 DeepSeek 还是获取了这些芯片,要么是因为他们根本不需要这些芯片。
- 无论如何,华为也有可能成为 DeepSeek 提供更多芯片的有力竞争者。
- 但这并不能阻止一些人继续尝试。
"DeepSeek成功建造R1的事实说明了2022年10月出口管制失败的滞后影响。但很快,我们将迎来 2023 年 10 月出口管制的成功。
忘掉 DeepSeek,TikTok 复仇怎么办?
在围绕 DeepSeek 的恐慌分析和阴谋论中,有一条重要新闻被忽略了。
另一家中国公司,TikTok 的创建者字节跳动于 1 月 24 日发布了豆瓣-1.5-pro。第 也是对 ChatGPT-4o 的回应。
它的价格也比美国同行便宜得多,比 DeepSeek 的模型便宜 5 倍,比 OpenAI 的 GPT-4o 便宜 200 多倍。
新版豆宝 1.5 Pro 采用了一种更高效的方法来训练其人工智能模型,ByteDance 称这有助于在降低成本的同时兼顾系统性能。
这是通过将模型的训练和实时使用相结合的设计来实现的,在保持较低基础设施成本的同时,优化模型以获得更好的结果。
资料来源 金融快报
该模型还击败了 来自 OpenAI、Anthropic 和阿里巴巴的领先模型.

资料来源 人工智能企业家
如果这是独立努力的结果,那就证明芯片短缺迫使中国公司在效率上展开竞争,暴露出美国人工智能公司在某种程度上的自满情绪,因为它们似乎拥有无限的现金和计算能力。
此外,ByteDance 为避免 TikTok 在美国被禁售或强制出售,经过几个月的斗争,寻找竞争和反击的方法也并非不可能。
其他中国机型
现在,有两家公司似乎在类似性能的价格上碾压了人工智能市场,人们很可能也会关注中国的其他人工智能模型。这可能包括
从鸟瞰的角度来看,而不是从 DeepSeek 的角度来看,这似乎更像是来自中国的新的增强型人工智能模型的涌入,而不是 DeepSeek 单独发动的突然袭击,就像现在人们经常描述的那样。
结论
随着人工智能战争的加剧,获得资金和快速提升计算能力将不再是唯一的决定性因素。
此外,如果 LLM 代币的价格在一夜之间暴跌 50-200 倍,那么该行业最终的盈利能力究竟如何,也是个未知数。不过,这应该不会引发太强烈的反应。归根结底,更便宜、更高效的人工智能也意味着人工智能将被大规模采用,并且无所不在。
这也意味着,对人工智能芯片的最终需求可能会居高不下,即使略低于最初的预测。
同样重要的是,通过开放源代码获得的广泛而超低价的法学硕士学位,意味着人工智能对就业市场、生产力、制造业、教育、国际贸易等的任何影响都将提前到来。













