AI导读:

DeepSeek凭借低成本、高性能及开源特性,在硅谷引发广泛讨论,挑战了硅谷在人工智能领域的领先地位。同时,其开源模式也引发了AI领域闭源与开源路线的分歧。此外,OpenAI正在洽谈新一轮融资,以应对DeepSeek带来的竞争压力。

DeepSeek在硅谷持续掀起热议浪潮。

中国大模型创业公司DeepSeek凭借此前发布的开源模型V3和R1,成功吸引了全球范围内的广泛关注。凭借其低廉的成本、卓越的性能以及透明公开的运营模式,DeepSeek不仅引发了人们对AI投资泡沫的担忧,更对硅谷在人工智能领域的霸主地位构成了挑战。

针对这一现象,硅谷创业公司Anthropic的联合创始人、大语言模型的开创性研究者Dario Amodei近日发表长文,深入阐述了对DeepSeek的看法。他指出,DeepSeek的训练成本并非外界所传的那么低廉,“600万美元模型”的说法忽略了诸多关键背景信息。实际上,DeepSeek以更低的成本打造出了接近7至10个月前美国模型水平的产品。此外,Dario Amodei还呼吁美国加强芯片出口管制,以确保自身在人工智能领域的领先地位。

顶尖硅谷风险投资家、A16Z联合创始人Marc Andreessen随即对Dario Amodei的观点作出回应:“闭源、不透明、吹毛求疵、政治操纵与开源和免费相比,并非美国所追求的胜利之道。”虽然Marc Andreessen并未直接点名,但显然是在暗指DeepSeek以开源及免费的模式,在全球AI开源社区中赢得了广泛认可。而Anthropic开发的Claude模型与OpenAI的GPT模型一样,均属于闭源模型,其训练过程及技术细节并未对外公开。Marc Andreessen的评论无疑是在讽刺Dario Amodei作为AI行业的领军人物,却试图利用地缘政治来遏制对手,否认开源工作的价值,这与其实现通用人工智能目标的初衷已背道而驰。

早在1月24日,Marc Andreessen便在社交平台发声:“DeepSeek R1是我见过的最令人惊叹、最令人印象深刻的突破之一,且其开源的特性更是给全世界的礼物。”这一言论无疑为DeepSeek的火爆出圈再添一把火。随着DeepSeek的崛起,英伟达股价当日下跌超3%,华尔街也开始注意到这匹AI黑马。他们发现,AI模型或许无需过度依赖算力堆积,便能取得卓越性能,从而打破了美股近两年来在AI浪潮中形成的“算力为王”的投资逻辑。有美股大V分析称,Marc Andreessen的推文或许正是DeepSeek爆火出圈的导火索之一。

不仅Marc Andreessen对DeepSeek表示支持,AI领域的另一位标志性人物——斯坦福大学计算机科学系客座教授、谷歌大脑(Google Brain)创始人吴恩达也发文力挺DeepSeek。吴恩达认为,中国在生成式AI领域正迅速缩小与美国的差距,或将重塑AI供应链格局。同时,开源权重模型推动了基础模型层走向大众化,为应用开发开辟了新的机遇。他强调,单纯扩大模型规模并非AI发展的唯一出路,在算力军备竞赛的喧嚣中,算法革新正在显著降低训练成本。

事实上,Dario Amodei、吴恩达与Marc Andreessen之间的争论,正是闭源与开源两条路线分歧的体现。DeepSeek之所以在业界掀起轩然大波,除了其在有限算力资源下实现的技术突破外,完全开源的特性更是其核心优势之一。“开源+低成本”的模式让DeepSeek颠覆了行业的传统范式,证明了开放可能是更好的战略。Meta首席人工智能科学家杨立昆也曾公开表示,DeepSeek的成功彰显了AI模型开源的重要性,“DeepSeek的胜利并非是中国AI的胜利,而是开源模型的胜利”。

有业内人士指出:“当OpenAI在2019年以安全为由转向闭源时,他们实际上是在建立垄断。而DeepSeek证明了开放可能是更好的战略,它能吸引最好的人才,建立生态系统,并通过降低成本而不是提高价格来获取优势。”英伟达高级研究科学家Jim Fan在读完DeepSeek的技术报告后也表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。这看似不合常理,但最有趣的结局往往最可能成真。”

DeepSeek创始人梁文锋在接受媒体采访时表示:“在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。”同时,对于DeepSeek开源的做法,梁文锋认为,“开源更像一个文化行为,而非商业行为……我们不会闭源。我们认为先有一个强大的技术生态更重要。”

在大模型领域具有先发优势和技术领先地位的公司,如OpenAI和Anthropic,往往倾向于选择闭源以保护自身技术秘密。然而,DeepSeek作为纯技术驱动的公司,其代码和训练方法完全开源。相比之下,互联网大厂往往出于商业化等方面的考量不会完全开源。当DeepSeek向市场推出了一款低成本、高性能且开源的模型时,无疑对选择闭源路线的公司构成了巨大冲击。

在DeepSeek引发大模型高额投入效用质疑的同时,据华尔街日报报道,OpenAI正在洽谈新一轮融资,计划筹集至多400亿美元,估值将达到3000亿美元,较此前估值1570亿美元接近翻倍,有望成为仅次于埃隆·马斯克旗下SpaceX的全球估值第二高的初创公司。这一轮融资将打破OpenAI在2023年创下的融资纪录,并有望成为硅谷历史上最大的一轮融资。

值得注意的是,1月22日,美国总统特朗普宣布,OpenAI、软银集团和甲骨文将合资成立一家名为“星际之门”(Stargate)的新公司,计划未来4年在美国投资5000亿美元建设AI基础设施,其中1000亿美元将立即部署。OpenAI首席执行官山姆·奥特曼此前透露,OpenAI、软银集团、甲骨文和MGX将为该项目总共投入450亿美元。而最新一笔融资的资金将部分用于帮助OpenAI履行其对“星际之门”的投资承诺。

DeepSeek发布的AI模型凭借高性能、便宜、开源等优势,令许多投资者对OpenAI等美国AI开发商的高额AI资本开支策略产生了质疑。奥特曼在评价DeepSeek时承认,DeepSeek R1令人印象深刻,尤其是在成本方面,“但我们无疑将带来更好的模型”。他还表示,“我们相信,要实现我们的使命,更多的计算能力比以往任何时候都更重要。”

然而,据彭博社报道,近期OpenAI与微软展开了一项联合调查,针对DeepSeek去年使用OpenAI API接口的账户进行审查,并以涉嫌违反服务条款的模型蒸馏为由,取消了他们的访问权限。OpenAI曾向媒体表示,它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据,也即DeepSeek涉嫌“蒸馏”其模型,但拒绝进一步透露证据的细节。

蒸馏是模型训练中常见的一种做法,即用预先训练好的复杂模型作为“教师模型”,用其输出的结果作为监督信号,再去训练另外一个“学生模型”,使学生模型能够逐渐接近于教师模型的水平。由于“从零开始”训练一个模型需要重复耗费大量计算资源,蒸馏也被视为AI普惠的一种途径。无论是在中国还是美国,初创公司和学术机构使用ChatGPT等领先模型输出数据来训练自己的模型,是业内普遍的现象。

值得注意的是,美东时间1月30日,OpenAI全球事务副总裁Chris LeHane表示,“o3”模型将于周五发布。紧急上线新模型表明,DeepSeek的崛起已经让OpenAI感受到了威胁,也将使AI领域的竞争更加激烈。

(文章来源:证券时报)