AI导读:

DeepSeek最新发布的开源模型DeepSeek-R1引发全球震动,其性能比肩OpenAI GPT-4,并采用MIT许可协议支持免费商用。DeepSeek坚定选择开源路线,推动AI技术普及和应用。同时,其技术降本策略使AI产品价格大幅降低,成为“AI价格屠夫”。预计随着模型性价比的持续提升,国内AI应用将加速在各领域落地。

近日,DeepSeek在一天内迅速登顶中美App Store免费榜,火爆程度导致服务器在两天内崩溃两次,甚至引起Meta的高度关注,开设四个作战室对其进行深入研究。DeepSeek犹如一颗“东方核弹”,在全球范围内引爆了AI圈。

DeepSeek此次引发全球震动的核心是其最新发布的开源模型DeepSeek-R1。据公司透露,该模型在数学、代码、自然语言推理等任务上的性能已比肩OpenAI GPT-4正式版,并采用了MIT许可协议,支持免费商用、任意修改和衍生开发。这一举措不仅展示了DeepSeek的技术实力,更为全球AI社区带来了一份宝贵的开源大礼。

DeepSeek的选择与国内众多大模型创业公司截然不同,它坚定地走上了开源路线,将代码、模型权重和训练日志全部公开。这一做法赢得了AI行业大佬们的广泛赞誉。A16Z创始人Marc Andreessen表示,DeepSeek-R1是他见过最令人惊叹、最让人印象深刻的突破之一,而且它还是开源的,可以说是一份给全球的大礼。英伟达高级研究科学家Jim Fan则认为,DeepSeek-R1可能是第一个展示了RL(强化学习)飞轮可发挥作用,且能带来持续增长的OSS(开源软件)项目。

随着DeepSeek-R1的发布,全球AI技术人员们掀起了“DeepSeek复现热潮”。UC伯克利博士生潘家怡和两位研究人员在游戏CountDown中成功复现了DeepSeek R1-Zero,并验证了通过RL,3B的基础语言模型也能够自我验证和搜索,且复现成本不到30美元。此外,全球最大开源平台HuggingFace团队也宣布复刻DeepSeek R1所有pipeline,复刻完成后将全部开源。

DeepSeek不仅以开源赢得了业界的尊重,更以“物美价廉”的大模型产品赢得了市场的青睐。最新发布的DeepSeek-R1在API服务定价上仅为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元,输出API价格仅为OpenAI GPT-4的3%。这一价格策略不仅降低了AI技术的使用门槛,更推动了AI技术的普及和应用。

DeepSeek的成功并非偶然,其背后离不开技术团队的持续创新和降本提效。DeepSeek-V3就曾以预训练成本之低引发业内高度关注,该模型参数量高达671B,但在预训练阶段仅使用2048块GPU训练了2个月,且只花费557.6万美元。与此同时,DeepSeek-V3的性能却足以比肩乃至超越其他前沿大模型。

DeepSeek的创始人梁文锋曾强调,DeepSeek的目标是实现AGI(通用人工智能),而不仅仅是短期的商业化。他相信,随着经济的发展,中国也应该成为技术创新的贡献者。DeepSeek的降价并非为了抢用户,而是基于成本下降和对普惠AI的追求。随着AI应用渗透率的提高和产业的不断发展,DeepSeek有望成为推动AI技术普及和应用的重要力量。

中信证券指出,DeepSeek模型相比GPT-4模型更小的参数量也意味着更低的推理成本。这一降低将是AI应用普及的前奏,正如4G提速降费给我国移动互联网产业带来的助力。预计随着模型性价比的持续提升,国内AI应用将依托丰富的生态和成熟的流量,加速在各领域落地。其中,Agent模式有望以更长的任务流程、更好的场景理解、更高的自主能力,成为所有互联网用户的数字助手,在企业管理、教育、办公、金融等领域展现应用价值。

值得一提的是,Meta生成AI小组和基础设施团队已开设四个作战室,学习DeepSeek的工作原理。这一举动不仅证明了DeepSeek的技术实力,更展示了其在全球AI领域的影响力。或许在不久的将来,DeepSeek将成为托举更多人的巨人,推动全球AI技术的持续发展和创新。

DeepSeek模型展示

(文章来源:科创板日报)