AI导读:

中国人工智能公司DeepSeek发布其R1模型,性能卓越,成本低廉,引发科技界和投资界热议。市场认为DeepSeek R1的成功可能削弱市场对英伟达AI芯片需求的预期,导致英伟达股价大跌。同时,DeepSeek R1的开源模式也引发了关于开源与闭源模式的讨论。

热度骤然攀升!

本周末,科技界与投资界再度聚焦于DeepSeek。中国人工智能企业DeepSeek本周发布了其R1模型(DeepSeek R1),这一消息让硅谷倍感紧张。在第三方基准测试中,DeepSeek R1的表现超越了OpenAI、Meta、Anthropic等美国顶尖的人工智能公司。

从性能层面来看,DeepSeek R1的确出类拔萃。据券商中国记者的亲身体验,其在文学素养与文字组织能力方面,已远超众多文字工作者,引发了职业危机感。同时,其阅读总结能力与数理逻辑处理能力也极为卓越。

尤为关键的是,DeepSeek R1的成本优势极为显著。因此,市场将英伟达周五的大幅下跌归因于DeepSeek的火爆。市场普遍认为,DeepSeek R1的成功可能降低了市场对英伟达AI芯片需求的预期。

DeepSeek的冲击

中国人工智能研究人员成功实现了许多人认为难以企及的目标:一个免费且开源的人工智能模型,其性能可与OpenAI最先进的推理系统相媲美,甚至更胜一筹。更令人惊叹的是他们的实现方式:通过反复试验让人工智能进行自学,与人类的学习方式颇为相似。

在春节前的一周,DeepSeek发布了其R1模型,这一消息令硅谷感到紧张。在第三方基准测试中,DeepSeek R1的表现超越了OpenAI、Meta、Anthropic等美国领先的人工智能公司。

其性能数据令人印象深刻。在AIME2024数学基准测试中,DeepSeek R1的成功率高达79.8%,超越了OpenAI的o1推理模型。在标准化编码测试中,DeepSeek R1展现出了“专家级”的性能,在Codeforces上获得了2029Elo评级,超越了96.3%的人类竞争对手。

然而,DeepSeek R1真正与众不同之处在于其低成本——或者说几乎没有成本。该模型每百万个token的查询成本仅为0.14美元,而OpenAI的成本为7.50美元,便宜了98%。与专有模型不同,DeepSeek R1的代码和训练方法均在MIT许可下完全开源,这意味着任何人都可以不受限制地获取、使用和修改该模型。

DeepSeek R1所展现出的卓越推理能力,以及其“突破开源AI界限”的特点,让硅谷措手不及,并轻松成为本周科技界最受瞩目的热点,风头甚至盖过了达沃斯经济论坛、TikTok的不确定性以及特朗普总统的上任。

扎克伯格的焦虑

面对人工智能差距的快速缩小,Meta创始人兼CEO扎克伯格呼吁美国政府加强封锁。他表示,DeepSeek非常先进,中美在AI领域的差距已经微乎其微。

扎克伯格近日指出,我们应该希望美国的模型能够胜出,中国正在全力冲刺。如果将来有一个开源模型能被全世界广泛使用,我们希望它是一个美国模型。

如果美国政府能够更多地支持美国公司,而不是在每个环节都设置障碍,那就更好了。美国科技行业目前确实处于领先地位,所以政府偶尔制造些麻烦,美国科技行业也许依然能保持领先。但我觉得政府很容易将这种领先地位视为理所当然。实际上,这是一场竞争激烈的较量,我们需要支持。政府不能成为阻碍我们实现目标的力量,而应该帮助我们。在DeepSeek发布几天后,Meta计划在2025年投入超过600亿美元,加大对人工智能的投入。

然而,对于Meta的首席人工智能科学家Yann LeCun而言,DeepSeek成功的最大意义并非来自中国竞争对手的加剧威胁,而是保持人工智能模型开源的价值,以便任何人都能受益。LeCun在社交媒体Threads上的一篇文章中表示,并非中国的人工智能“超越了美国”,而是“开源模型正在超越专有模型”。

DeepSeek R1本身是开源的,Meta的Llama亦是如此。OpenAI最初是一家开源人工智能公司,其使命是创造造福全人类的技术,但最近已转向闭源。LeCun表示,DeepSeek“受益于开放研究和开源”。“他们想出了新的办法,并在其他人的工作基础上加以实现。由于他们的工作成果已发表并开源,因此每个人都可以从中受益。”LeCun说,“这就是开放研究和开源的力量。”

支持开源的人认为,开源让技术得以快速、民主地发展,因为任何人都可以修改和重新发布代码。另一方面,支持闭源模式的人则认为闭源模式更安全,因为代码是保密的。OpenAI首席执行官Sam Altman在去年11月Reddit的AMA上表示,闭源方法为他的公司提供了“一种更容易达到安全门槛的方法”。不过,他补充说,“希望我们将来能开源更多的东西。”

英伟达受波及?

另一类感到焦虑的人可能是英伟达的多头。周五收盘,英伟达股价大跌超过3%,盘后继续下跌0.42%。

市场认为,DeepSeek R1的成功可能削弱了市场对英伟达AI芯片需求的预期。因为DeepSeek似乎以极低的成本构建了一个突破性的人工智能模型,并且无需使用尖端芯片。这引发了人们对投入芯片行业的数千亿美元资本支出实际效用的质疑。

DeepSeek仅用2048颗英伟达H800GPU和560万美元,就训练出了6710亿参数的开源大模型,这只是OpenAI和谷歌训练同等类型模型花费的一小部分。加州大学伯克利分校人工智能政策研究员里特维克·古普塔表示,DeepSeek最近发布的模型表明,“没有阻碍人们获取人工智能能力的壕沟”。他说:“训练模型的第一人必须花费大量资源才能实现目的,但跟进者可用更少的费用且以更快的速度实现目的。”

另一方面,苹果研究员Awni Hannun提到,人们可以在Apple Mac上本地运行该模型的量化版本。传统上,由于与英伟达的CUDA软件不兼容,苹果设备在AI方面一直较弱,但这种情况似乎正在改变。例如,AI研究员Alex Cheema在利用8台Apple Mac Mini设备共同运行后能够运行完整模型,这仍然比运行目前最强大的AI模型所需的服务器便宜。也就是说,用户可以在Apple Mac上运行更轻量的DeepSeek R1版本,并且获得良好的准确度和效率。

(文章来源:券商中国)