AI导读:

DeepSeek凭借其低成本、高性能及开源特性迅速走红,国内多家云平台纷纷宣布上线DeepSeek旗下模型,以期在AI热潮中分得一杯羹。文章还探讨了AI算力需求的变化及未来热点向应用端转移的趋势。

DeepSeek所引发的AI热潮持续高涨,其低成本、高性能及开源特性,使得DeepSeek-R1模型迅速“走红”。近日,国内多家云平台紧跟潮流,纷纷宣布上线DeepSeek旗下模型。

2月4日,字节跳动旗下的云服务平台火山引擎率先宣布,将支持包括V3、R1在内的不同尺寸的DeepSeek开源模型。紧接着,腾讯云也宣布其高性能应用服务HAI支持DeepSeek-R1一键部署,并在同日宣布腾讯云TI平台上架DeepSeek系列模型。百度智能云也不甘落后,于3日晚宣布,百度智能云千帆平台已正式上架DeepSeek-R1和DeepSeek-V3模型。此外,阿里云PAI Model Gallery也已支持DeepSeek-V3、DeepSeek-R1以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署。

在这场AI盛宴中,云厂商们纷纷推出自家产品、服务及算力,以期在DeepSeek的火爆中分得一杯羹。更深层次的变化在于,大模型的算力需求正悄然发生变化。DeepSeek曾公开透露,DeepSeek-V3的训练预算高达“2048个GPU、2个月、近600万美元”,外界推测DeepSeek-R1的训练成本可能也相对较低。这或许预示着,大模型训练虽能为云厂商带来算力需求,但开发者部署偏重推理的大模型或将为云厂商带来更多算力机遇。

海外市场方面,春节期间,DeepSeek的出色表现以及不及OpenAI近1/20的算力成本,令英伟达(Nasdaq:NVDA)股价一夜之间暴跌17%。尽管英伟达等科技巨头股价在后续几天有所反弹,但华尔街已开始对“中国AI冲击”进行更理性的分析。DeepSeek的问世意味着更多新进入者将涌入AI领域,算力需求将持续增长。然而,未来的热点或将从基础设施层向应用端转移,更多AI公司有望受益。

多个云平台上线DeepSeek相关模型背后,是DeepSeek-R1作为一款开源模型,提供了API调用方式,凭借其强大的推理能力,在极少标注数据的情况下实现了性能对标OpenAI GPT-3正式版。该模型的推出,迅速引发了业界的广泛关注。1月27日,DeepSeek应用更是一度登顶苹果中国地区和美国地区应用商店免费APP下载排行榜。

为了满足潜在的算力需求,腾讯云TI平台上架了“满血”的V3、R1原版模型,参数量均达到671B(B即十亿),并提供了基于DeepSeek-R1蒸馏得到的系列模型,参数规模从1.5B到70B不等。此外,腾讯云TI平台还提供模型服务管理、监控运营、资源伸缩等能力,助力企业和开发者将DeepSeek模型接入实际业务。

百度智能云千帆平台上架的DeepSeek-R1和DeepSeek-V3模型则已全面融合千帆推理链路,集成百度独家内容安全算子,实现模型安全增强与企业级高可用保障,同时支持完善的BLS日志分析和BCM告警。阿里云则面向开发者提供了蒸馏过后的DeepSeek-R1-Distill-Qwen-7B模型,通过蒸馏技术将推理模式迁移到较小的Qwen(通义)模型上,实现高性价比的DeepSeek系列模型与现有业务的高效融合。

值得一提的是,不少云厂商都给出了低于DeepSeek官方刊例价的折扣。目前,DeepSeek-R1的官方刊例价为输入4元/M tokens,输出16元/M tokens;DeepSeek-V3的官方刊例价为输入2元/M tokens,输出8元/M tokens。而百度云上架的对应模型调用价格仅为DeepSeek-V3官方刊例价的3折、DeepSeek-R1官方刊例价的5折,并提供限时2周的免费服务。阿里云百炼上架的DeepSeek-R1和DeepSeek-V3也宣布限时免费。火山引擎则通过全栈自研推理系统对DeepSeek进行优化和降本,为企业提供有竞争力的价格及全网最高的限流。

回顾2024年,DeepSeek-V2的发布曾引发了一轮大模型价格战,字节、百度、腾讯、阿里等大模型厂商都曾跟进降价。如今,被誉为“AI界拼多多”的DeepSeek是否会掀起大模型的下一轮价格战,备受业界关注。不过,业界对大模型价格竞争已有预期。腾讯集团副总裁、政企业务总裁李强曾表示,价格变化若非基于技术创新则难以长期持续。预计2025年传统云计算领域的价格竞争会趋缓,但与大模型相关的部分仍会有价格竞争。长期来看,大模型行业化应用将带来更多推理相关的计算需求。

随着AI技术的不断发展,焦点正从基础设施层转向应用层。高盛科技分析师Eric Sheridan及其团队强调,AI主题的下一阶段演进可能会从基础设施层转向应用层,如AI智能体、企业应用场景、消费者实用性提升和计算习惯的改变等。这些将成为未来2025年及以后的关键驱动力,带来更线性、可理解的资本回报。谷歌和Meta在AI应用层推进方面走得最远,处于特别有利的位置。同时,更多中小企业也将迎来更多机会。

近两年来,中国AI企业的发展大超预期,DeepSeek的爆红无疑增加了相关主题的吸引力。OpenAI原全球市场应用负责人、人工智能与商业战略专家Zack Kass表示,早在两年前他就认为,在未来AI竞赛中,中国不一定会落后,中国可以用更少的GPU构建模型。2025年,人工智能的发展可能会进入新阶段,人们将开始真正认同“模型即商品”的理念。随着模型逐步趋同,人们的关注点将从“谁的模型更强”转向如何更有效地采用和应用这些模型。

高盛认为,未来AI推理与后训练环节将受到更多重视。推理计算资源需求低于预训练,将成为下阶段增长重点。中国AI企业具备全球竞争力,特别是在To C应用方面,中国企业具备先发优势,核心盈利模式为广告、订阅等增量收入,最终实现AI应用可持续变现。在云计算和数据中心领域,围绕芯片、算力限制的地缘政治不确定性依然存在,但训练、推理成本优化的进展也在提速。机构预计,互联网巨头的云业务和数据中心将受益于持续增长的公共云和AI计算需求。

(文章来源:第一财经,版权所有,未经授权不得转载)

DeepSeek模型相关图片