DeepSeek引发AI领域热议，开源模式挑战硅谷霸主地位

国际财经 2025-01-31 16:19:32 来源：证券时报作者：网络

AI导读：

DeepSeek凭借低成本、高性能及开源特性，在硅谷引发广泛讨论，挑战了硅谷在人工智能领域的领先地位。同时，其开源模式也引发了AI领域闭源与开源路线的分歧。此外，OpenAI正在洽谈新一轮融资，以应对DeepSeek带来的竞争压力。

DeepSeek在硅谷持续掀起热议浪潮。

中国大模型创业公司DeepSeek凭借此前发布的开源模型V3和R1，成功吸引了全球范围内的广泛关注。凭借其低廉的成本、卓越的性能以及透明公开的运营模式，DeepSeek不仅引发了人们对AI投资泡沫的担忧，更对硅谷在人工智能领域的霸主地位构成了挑战。

针对这一现象，硅谷创业公司Anthropic的联合创始人、大语言模型的开创性研究者Dario Amodei近日发表长文，深入阐述了对DeepSeek的看法。他指出，DeepSeek的训练成本并非外界所传的那么低廉，“600万美元模型”的说法忽略了诸多关键背景信息。实际上，DeepSeek以更低的成本打造出了接近7至10个月前美国模型水平的产品。此外，Dario Amodei还呼吁美国加强芯片出口管制，以确保自身在人工智能领域的领先地位。

顶尖硅谷风险投资家、A16Z联合创始人Marc Andreessen随即对Dario Amodei的观点作出回应：“闭源、不透明、吹毛求疵、政治操纵与开源和免费相比，并非美国所追求的胜利之道。”虽然Marc Andreessen并未直接点名，但显然是在暗指DeepSeek以开源及免费的模式，在全球AI开源社区中赢得了广泛认可。而Anthropic开发的Claude模型与OpenAI的GPT模型一样，均属于闭源模型，其训练过程及技术细节并未对外公开。Marc Andreessen的评论无疑是在讽刺Dario Amodei作为AI行业的领军人物，却试图利用地缘政治来遏制对手，否认开源工作的价值，这与其实现通用人工智能目标的初衷已背道而驰。

早在1月24日，Marc Andreessen便在社交平台发声：“DeepSeek R1是我见过的最令人惊叹、最令人印象深刻的突破之一，且其开源的特性更是给全世界的礼物。”这一言论无疑为DeepSeek的火爆出圈再添一把火。随着DeepSeek的崛起，英伟达股价当日下跌超3%，华尔街也开始注意到这匹AI黑马。他们发现，AI模型或许无需过度依赖算力堆积，便能取得卓越性能，从而打破了美股近两年来在AI浪潮中形成的“算力为王”的投资逻辑。有美股大V分析称，Marc Andreessen的推文或许正是DeepSeek爆火出圈的导火索之一。

不仅Marc Andreessen对DeepSeek表示支持，AI领域的另一位标志性人物——斯坦福大学计算机科学系客座教授、谷歌大脑（Google Brain）创始人吴恩达也发文力挺DeepSeek。吴恩达认为，中国在生成式AI领域正迅速缩小与美国的差距，或将重塑AI供应链格局。同时，开源权重模型推动了基础模型层走向大众化，为应用开发开辟了新的机遇。他强调，单纯扩大模型规模并非AI发展的唯一出路，在算力军备竞赛的喧嚣中，算法革新正在显著降低训练成本。

事实上，Dario Amodei、吴恩达与Marc Andreessen之间的争论，正是闭源与开源两条路线分歧的体现。DeepSeek之所以在业界掀起轩然大波，除了其在有限算力资源下实现的技术突破外，完全开源的特性更是其核心优势之一。“开源+低成本”的模式让DeepSeek颠覆了行业的传统范式，证明了开放可能是更好的战略。Meta首席人工智能科学家杨立昆也曾公开表示，DeepSeek的成功彰显了AI模型开源的重要性，“DeepSeek的胜利并非是中国AI的胜利，而是开源模型的胜利”。

有业内人士指出：“当OpenAI在2019年以安全为由转向闭源时，他们实际上是在建立垄断。而DeepSeek证明了开放可能是更好的战略，它能吸引最好的人才，建立生态系统，并通过降低成本而不是提高价格来获取优势。”英伟达高级研究科学家Jim Fan在读完DeepSeek的技术报告后也表示：“我们正身处这样一个历史时刻：一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。这看似不合常理，但最有趣的结局往往最可能成真。”

DeepSeek创始人梁文锋在接受媒体采访时表示：“在颠覆性的技术面前，闭源形成的护城河是短暂的。即使OpenAI闭源，也无法阻止被别人赶超。”同时，对于DeepSeek开源的做法，梁文锋认为，“开源更像一个文化行为，而非商业行为……我们不会闭源。我们认为先有一个强大的技术生态更重要。”

在大模型领域具有先发优势和技术领先地位的公司，如OpenAI和Anthropic，往往倾向于选择闭源以保护自身技术秘密。然而，DeepSeek作为纯技术驱动的公司，其代码和训练方法完全开源。相比之下，互联网大厂往往出于商业化等方面的考量不会完全开源。当DeepSeek向市场推出了一款低成本、高性能且开源的模型时，无疑对选择闭源路线的公司构成了巨大冲击。

在DeepSeek引发大模型高额投入效用质疑的同时，据华尔街日报报道，OpenAI正在洽谈新一轮融资，计划筹集至多400亿美元，估值将达到3000亿美元，较此前估值1570亿美元接近翻倍，有望成为仅次于埃隆·马斯克旗下SpaceX的全球估值第二高的初创公司。这一轮融资将打破OpenAI在2023年创下的融资纪录，并有望成为硅谷历史上最大的一轮融资。

值得注意的是，1月22日，美国总统特朗普宣布，OpenAI、软银集团和甲骨文将合资成立一家名为“星际之门”（Stargate）的新公司，计划未来4年在美国投资5000亿美元建设AI基础设施，其中1000亿美元将立即部署。OpenAI首席执行官山姆·奥特曼此前透露，OpenAI、软银集团、甲骨文和MGX将为该项目总共投入450亿美元。而最新一笔融资的资金将部分用于帮助OpenAI履行其对“星际之门”的投资承诺。

DeepSeek发布的AI模型凭借高性能、便宜、开源等优势，令许多投资者对OpenAI等美国AI开发商的高额AI资本开支策略产生了质疑。奥特曼在评价DeepSeek时承认，DeepSeek R1令人印象深刻，尤其是在成本方面，“但我们无疑将带来更好的模型”。他还表示，“我们相信，要实现我们的使命，更多的计算能力比以往任何时候都更重要。”

然而，据彭博社报道，近期OpenAI与微软展开了一项联合调查，针对DeepSeek去年使用OpenAI API接口的账户进行审查，并以涉嫌违反服务条款的模型蒸馏为由，取消了他们的访问权限。OpenAI曾向媒体表示，它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据，也即DeepSeek涉嫌“蒸馏”其模型，但拒绝进一步透露证据的细节。

蒸馏是模型训练中常见的一种做法，即用预先训练好的复杂模型作为“教师模型”，用其输出的结果作为监督信号，再去训练另外一个“学生模型”，使学生模型能够逐渐接近于教师模型的水平。由于“从零开始”训练一个模型需要重复耗费大量计算资源，蒸馏也被视为AI普惠的一种途径。无论是在中国还是美国，初创公司和学术机构使用ChatGPT等领先模型输出数据来训练自己的模型，是业内普遍的现象。

值得注意的是，美东时间1月30日，OpenAI全球事务副总裁Chris LeHane表示，“o3”模型将于周五发布。紧急上线新模型表明，DeepSeek的崛起已经让OpenAI感受到了威胁，也将使AI领域的竞争更加激烈。

（文章来源：证券时报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。