人工智能
OpenAI 利用 o3 创造了第一个 AGI 吗？

迈向 AGI 在开发人工智能模型的竞赛中，最终目标是 AGI（人工通用智能）。这是...

了解更多

乔纳森-施拉姆
聚光灯
阿里巴巴 (BABA)：逢低买入双主板上市的电子商务巨头

中国的电子商务市场谈到在线市场，占主导地位的公司似乎是...

立即投资

乔纳森-施拉姆
美国经纪人
6 Best USA Stock Brokers (November 2025)

网上股票交易从未像现在这样方便。现在有各种各样的在线股票经纪人...

立即投资

安东尼-加拉格尔
人工智能
埃隆-马斯克与 OpenAI：揭开人工智能法律之争的神秘面纱

世界首富埃隆-马斯克（Elon Musk）和流行聊天机器人 ChatGPT 背后的公司 OpenAI 已经...

了解更多

高拉夫-罗伊
英国投资者
8 Best UK Stock Brokers (November 2025)

有众多经纪人可供选择，开始股票交易从未如此简单。如果您...

立即投资

安东尼-加拉格尔
人工智能
英伟达™（NVDA）聚焦：从图形巨人到人工智能泰坦

人工智能巨头如果说十多年来，科技投资者的注意力一直集中在 "大科技 "上，那么，人工智能巨头...

立即投资

乔纳森-施拉姆

人工智能

DeepSeek：商品化人工智能的动荡和提前到来？

已出版 2025 年 1 月 28 日

由

乔纳森-施拉姆

Securities.io 保持严格的编辑标准，并可能从审核过的链接中收取报酬。我们不是注册投资顾问，这不是投资建议。请查看我们的关联公司披露.

DeepSeek 破坏人工智能格局

对于任何不了解 27 日周一金融市场的人来说^第 2025 年 1 月，人们可能会问 "发生了什么"？Nvidia 股价看似势不可挡的上涨--直到现在--被一天之内暴跌 18% 所打断。

市值损失达 $5.6亿美金，从来没有一家公司在一天之内损失如此之多的价值。就这一点而言，Nvidia 的投资者可能已经习惯了该股的剧烈波动，在单日跌幅最大的 10 家公司中，Nvidia 占了 8 家。

资料来源视觉资本家

其导火索是 DeepSeek 的发布，这是一款中国制造的 LLM（大型语言模型），其性能可与 OpenAI 和其他领先的人工智能公司的最佳产品相媲美。只不过它开放源代码并以极低的价格提供访问权限。据称，它的开发成本仅为 $6M，是一家量化对冲基金的 "副业"。

如果情况属实，这可能会颠覆一种说法，即开发人工智能将是极其密集的计算，需要数十亿甚至数万亿的人工智能数据中心。作为人工智能硬件的领导者，英伟达受到投资者恐慌情绪的影响最大，这并不奇怪。

尘埃落定之后，让我们来看看 DeepSeek 究竟能做些什么，以及中国人工智能产业可能很快还会做些什么。

DeepSeek 背景

高飞

DeepSeek 由一家中国金融交易/量化对冲基金开发、高飞由梁文凤创办。

Liang 今年 40 岁，最初从事机器视觉工作。2015 年，30 多岁的他创立了 High-Flyer，率先利用机器学习将人工智能应用于交易策略中。该基金目前管理着 $8B 的资产。

2025 年 1 月 20 日，在北京举行的一次有关人工智能技术的会议上，人们看到梁建章坐在中国国务院总理李强（中共中央政治局常委，排名第二）的身边。

资料来源奈杰尔-德索萨

需要指出的是，在最初的混乱中，由于梁在公开场合很少露面，很多媒体使用了与 DeepSeek 完全无关的同名人的照片，以及室内设计师.

"不是梁文峰"--来源：《中国青年报》：工作日

深度搜索

2021 年，梁文峰在美国制裁之前购买了约 1 万片 H800 英伟达芯片，启动了后来的 DeepSeek 项目，并将高朋人工智能的顶级研究人员带到了项目中。

与更先进的 H100 和 B200 相比，H800 芯片的性能相对较低，但功耗却是后者的三倍。

资料来源技术城市

DeepSeek 声称已经训练了其 DeepSeek V3 型号在不到两个月的时间里，就以 $5.58M 的价格完成。因此，虽然这并不包括 10,000 个 H800 芯片的成本，但仍比迄今为止的任何其他 LLM 便宜几个数量级。

事实上，这样一来，DeepSeek V3 的培训费用比 OpenAI、Meta、微软、谷歌等公司人工智能团队负责人的薪水还要低。

DeepSeek 性能

加上低廉的开发价格，令分析师和投资者震惊的是，DeepSeek 的性能与 OpenAI 和其他顶级人工智能公司最新、最好的模型相差无几，甚至更胜一筹、包括刚刚发布并被誉为潜在的 AGI o3.

资料来源 GitHub

人们的第一反应是怀疑有人在搞鬼，时间和开发成本都是假的（下文将详细说明）。

但无论如何，DeepSeek 的方法很可能比人工智能行业迄今为止所做的工作效率高出 10-100 倍。

DeepSeek 的定价给了美国人工智能产业额外的一击。它的代币价格远低于 $1，约为所有竞争对手的 3%-5%。

资料来源 Jason Clarck

"我们之所以降价，首先是因为在探索下一代模式结构的同时，我们的成本降低了；其次，我们认为人工智能和 API 服务都应该是人人都能负担得起、人人都能获得的"。

梁文峰

完美时机

DeepSeek V3 极具影响力的发布显然是经过公司精心协调的，以达到最大效果。

就在几天前，美国总统特朗普宣布了 "星际之门计划"，该计划耗资 $5 亿美元，由软银公司牵头建设 20 个人工智能超大型数据中心。 (SFTBY -2.56%)、OpenAI 和甲骨文 (ORCL -3.79%).

虽然市场感到恐慌，但美国总统似乎并不担心。

"如果你能做得更便宜，如果你能[以]更少的成本[并]达到同样的最终结果。我认为这对我们来说是件好事"。

他还表示，他并不担心突破，并补充说美国仍将是该领域的主导者。

资料来源英国广播公司

在 LLM 之后，图像生成

DeepSeek 在 LLM 方面取得的成就，现在正期待着通过人工智能图像生成和 Janus-Pro-7B 的发布来重现。

资料来源拥抱的脸

虽然人们对它是否真的像《中途岛》、《DALL-E》和其他图像生成器一样出色还存在争议，但它还是给人留下了深刻印象。

如果它遵循 DeepSeek v3 LLM 的模式，很可能会非常高效。

直接影响

对人工智能产业的影响

DeepSeek 在人工智能行业掀起风暴的同时，也带来了一些直接影响：

市场动荡:当市场意识到可能在人工智能硬件上浪费数千亿美元的影响时，英伟达的股价和整个纳斯达克指数都崩溃了（有关此话题的进一步讨论，请参阅下文）。
加速人工智能竞赛:几个月前，中国还被美国科技大亨们认为是 "无关紧要 "的，而现在，一场新的人工智能竞赛正在太平洋彼岸展开。
一夜成名:DeepSeek 几乎瞬间成为 App Store 下载量最高的应用程序。
离线测试:许多人还在测试如何在高端家用电脑上本地运行，因为计算要求似乎比以前的 LLM 低得多。

附带损害赔偿

DeepSeek 造成的损失不仅限于美国人工智能和科技公司的形象和未来潜在利润。

例如，有望成为兆瓦级人工智能数据中心供电核心的创新型核电企业受到的打击更大：27^第 2025 年 1 月，SMR 开发人员努斯卡尔 (SMR -6.33%) 下跌 27.5%，铀矿商 Cameco 下跌 15%。

另一个连带受害者是非美国科技股。Nvidia 的供应商 Advantest 等日本科技股也下跌了 8.6%，软银股票下跌了 8.3%。同时，荷兰芯片生产商 ASML 也下跌了 6.5%。

DeepSeek 是如何做到的？

尚无明确答案

这显然是一个在发布后不久仍在热议的话题。只要我们考虑一些已知的事实，就可以讨论一些不同的观点。

第一个事实是，无论 DeepSeek V3 是如何做到的，它都与迄今为止发布的最佳人工智能一样强大。

也许更重要的是，由于它是开源的，许多人已经在测试并证实它所需的计算能力要低得多。

DeepSeek R1 是我见过的最令人惊叹和印象最深刻的突破之一，作为开放源代码，它是献给世界的一份厚礼。

马克-安德烈森

因此，不应将其视为 "炒作 "或中国政府阴谋的结果。马克-安德森（Marc Andreessen）和查马特-帕利哈皮蒂亚（Chamath Palihapitiya）等受人尊敬的硅谷重量级人物也持此观点。

人工智能模型的构建是一个金钱陷阱（......）开源显然是赢家。

闭源人工智能将被迫对其最佳模型保密，并将其出售给企业，或尝试用其创建一些令人难以置信的消费者应用。

Chamath Palihapitiya

2024 年 7 月对梁文峰的采访就在 DeepSeek V2 发布之后，该报告也给了我们一些启示。

不同的方法

第一种可能的解释是，DeepSeek 只是采取了不同的人工智能开发策略。

这里的一个关键因素是，这是梁文锋公司的一个内部项目，而不是风险投资企业。在这方面，这有点让人想起特斯拉和 SpaceX 早期依靠埃隆-马斯克自己的资金的情况。

这种差异为 DeepSeek 带来了一个重点，那就是开发自己的模型结构，而不是照搬 Llama 的结构来快速制作应用程序。

"我们的目标是 AGI（人工通用智能），这要求我们探索新的模型结构，在有限的资源内实现卓越的能力。这是扩大规模的基础研究。除了架构，我们还研究了数据整理和类人推理，这些都体现在我们的模型中。"

梁文峰

这也反映在公司文化中，公司不再那么注重利润，因为这是 High-Flyer 对冲基金的 "工作"。相反，创新本身就是公司宣称的目标。

"三十年来，我们重利润轻创新。创新不是纯粹的商业驱动，它需要好奇心和创造性的雄心。我们被旧习惯所束缚，但这只是一个阶段。

最持久盈利的美国公司都是建立在长期研发基础上的科技巨头"。

梁文峰

从这个角度来看，DeepSeek 文化可能是一种持久的优势，它代表了对大多数人工智能思想领袖的责难批评。

"我们认为，中国的人工智能不能永远做追随者。我们经常说中美人工智能有一两年的差距，但真正的差距是原创和模仿的差距。如果这一点不改变，中国将永远是追随者。有些探索是不可避免的。"

梁文峰

人工智能技术的自然发展

另一种选择是，随着越来越多的研究人员掌握了创造人工智能的技能，创新将不断推动这一领域向前发展。随着技术的成熟，DeepSeek 所取得的成就，总有一天会被一些零散的人工智能初创公司实现。而由于制裁限制了先进芯片的获取，中国的人工智能公司首先要做的就是少花钱多办事。

这也可以被看作是开源软件相对于封闭的营利系统的长期优势，后者希望通过制造垄断来实现利润最大化。

这种观点同样不能很好地反映大科技公司计划在 2025 年花费的数千亿美元。

因此，这与其说是对 DeepSeek 优越性的控诉，不如说是对中美两国昔日创新型大科技公司官僚化的控诉。

一个阴谋

在西方与欧亚大陆（俄罗斯/中国/伊朗）之间激烈的大国竞争背景下，许多人很快就从 DeepSeek 中看到了针对美国经济中最具竞争力部分的外国敌对行动，这或许是不可避免的。

有一种明显不可信的阴谋论认为，DeepSeek 只是对西方人工智能的复制或伪造，因为这已经得到了独立证实。由于 DeepSeek 是一款开源软件，将其作为间谍软件或 CCP 审查工具进行攻击也是不合逻辑的，因为任何人都可以自由地部署和修改它。

不过，有一点是有道理的，那就是 DeepSeek 可能获得了更先进的芯片，而这些芯片是官方批准并禁止出口到中国的。如果是这样的话，该公司不公开承认并撒谎就说得通了。

一种可能是来自政府的隐性支持，从直接资助到提供大量走私的 H100 Nvidia 芯片集群，用于训练人工智能。例如，我们知道大量芯片销往新加坡，很可能再转售给中国.

"中国实验室拥有的 H100 比人们想象的要多。据我所知，DeepSeek 大约有 5 万台 H100，但他们显然不能谈论这些，因为这违反了美国的出口管制。

培训数据提供商 Scale 首席执行官 Alexandr Wang 人工智能

另一个争论点是培训费用，这一点尚未得到独立核实。

最后一种可能是，DeepSeek 可能会在发布未决索赔之前，大举押注 Nvidia 的股票，而不考虑任何地缘政治阴谋。High-Flyer 毕竟是一家对冲基金，尽管这可能被认为是操纵市场，因此是一种冒险之举。

初步收获

人工智能领域的发展速度令人难以置信，而 DeepSeek 已经在一些重要方面改变了游戏规则：

我们现在有了一种新方法，可以生成超高效的 LLM 模型和一般可能的人工智能模型。
与 OpenAI（具有讽刺意味的名字）所倡导的封闭模式相比，开源人工智能具有坚实的战斗力。
中美两国在人工智能领域的竞争日趋激烈。
对向中国出口先进人工智能芯片的制裁是失败的，要么是因为 DeepSeek 还是获取了这些芯片，要么是因为他们根本不需要这些芯片。
- 无论如何，华为也有可能成为 DeepSeek 提供更多芯片的有力竞争者。
- 但这并不能阻止一些人继续尝试。

"DeepSeek成功建造R1的事实说明了2022年10月出口管制失败的滞后影响。但很快，我们将迎来 2023 年 10 月出口管制的成功。

战略与国际研究中心瓦德瓦尼人工智能中心主任 Greg Allen 先生。

忘掉 DeepSeek，TikTok 复仇怎么办？

在围绕 DeepSeek 的恐慌分析和阴谋论中，有一条重要新闻被忽略了。

另一家中国公司，TikTok 的创建者字节跳动于 1 月 24 日发布了豆瓣-1.5-pro。^第也是对 ChatGPT-4o 的回应。

它的价格也比美国同行便宜得多，比 DeepSeek 的模型便宜 5 倍，比 OpenAI 的 GPT-4o 便宜 200 多倍。

新版豆宝 1.5 Pro 采用了一种更高效的方法来训练其人工智能模型，ByteDance 称这有助于在降低成本的同时兼顾系统性能。

这是通过将模型的训练和实时使用相结合的设计来实现的，在保持较低基础设施成本的同时，优化模型以获得更好的结果。

资料来源金融快报

该模型还击败了来自 OpenAI、Anthropic 和阿里巴巴的领先模型.

资料来源人工智能企业家

如果这是独立努力的结果，那就证明芯片短缺迫使中国公司在效率上展开竞争，暴露出美国人工智能公司在某种程度上的自满情绪，因为它们似乎拥有无限的现金和计算能力。

此外，ByteDance 为避免 TikTok 在美国被禁售或强制出售，经过几个月的斗争，寻找竞争和反击的方法也并非不可能。

其他中国机型

现在，有两家公司似乎在类似性能的价格上碾压了人工智能市场，人们很可能也会关注中国的其他人工智能模型。这可能包括

从鸟瞰的角度来看，而不是从 DeepSeek 的角度来看，这似乎更像是来自中国的新的增强型人工智能模型的涌入，而不是 DeepSeek 单独发动的突然袭击，就像现在人们经常描述的那样。

结论

随着人工智能战争的加剧，获得资金和快速提升计算能力将不再是唯一的决定性因素。

此外，如果 LLM 代币的价格在一夜之间暴跌 50-200 倍，那么该行业最终的盈利能力究竟如何，也是个未知数。不过，这应该不会引发太强烈的反应。归根结底，更便宜、更高效的人工智能也意味着人工智能将被大规模采用，并且无所不在。

这也意味着，对人工智能芯片的最终需求可能会居高不下，即使略低于最初的预测。

同样重要的是，通过开放源代码获得的广泛而超低价的法学硕士学位，意味着人工智能对就业市场、生产力、制造业、教育、国际贸易等的任何影响都将提前到来。

相关主题中国人工智能 DeepSeek AI DeepSeek 定价 DeepSeek V3 豆包-1.5-pro

人工智能设计的 3D 打印纳米材料：比钢铁更强，比泡沫更轻

不要错过

记忆晶体管 "是人工智能模仿人脑的关键吗？

乔纳森-施拉姆

乔纳森曾是一名生物化学家，从事过基因分析和临床试验。他现在是一名股票分析师和金融作家，在他的出版物''中重点关注创新、市场周期和地缘政治。欧亚世纪".

Securities.io