DeepSeek旗下大模型火爆,云平台争相上线抢滩算力市场
AI导读:
DeepSeek旗下大模型DeepSeek-R1火爆出圈,引发多家云平台争相上线DeepSeek系列模型,竞相提供适配服务以吸引用户,反映出大模型算力需求的变迁及云厂商的市场布局。
近期,AI领域的明星企业DeepSeek再次成为焦点,其旗下的大模型DeepSeek-R1“火爆出圈”,引发多家云平台争相上线DeepSeek系列模型。2025年2月4日,火山引擎率先宣布,将全面支持包括V3、R1在内的不同规格的DeepSeek开源模型。用户可以通过在火山引擎机器学习平台veMLP中部署或在火山方舟中直接调用模型,轻松享受AI带来的便捷。
紧接着,2月2日,腾讯云也不甘落后,宣布其高性能应用服务HAI将支持DeepSeek-R1的一键部署。仅仅两天后的2月4日,腾讯云TI平台再次发力,正式上架了DeepSeek系列模型,为用户提供更多选择。而在2月3日晚,百度智能云也传来消息,其千帆平台已正式引入DeepSeek-R1和DeepSeek-V3模型,进一步丰富平台生态。
作为开源模型的佼佼者,DeepSeek-R1不仅性能卓越,对标OpenAI GPT-1正式版,而且提供了便捷的API调用方式。据悉,DeepSeek-R1在后训练阶段大规模采用了强化学习技术,即便在标注数据极少的情况下,也能显著提升模型的推理能力。这一创新使得DeepSeek-R1自推出以来,热度持续攀升。1月27日,DeepSeek应用更是一举登上苹果中国及美国地区应用商店免费APP下载排行榜榜首。
面对DeepSeek系列模型的火爆,云厂商们纷纷瞄准了潜在的算力需求。腾讯云TI平台不仅上架了参数量高达671B(B即十亿)的V3、R1原版模型,还推出了基于DeepSeek-R1蒸馏得到的系列模型,参数规模灵活多样,从1.5B到70B不等。此外,腾讯云TI平台还提供了一站式模型服务管理、监控运营、资源伸缩等能力,助力企业和开发者将DeepSeek模型无缝接入实际业务场景。
在这场AI盛宴中,云厂商们不仅卖起了自身的产品和服务,更通过提供适配服务,简化了模型开发流程,吸引了大量DeepSeek用户。例如,百度智能云千帆平台上的DeepSeek-R1和DeepSeek-V3模型已全面融入千帆推理链路,集成了百度独家内容安全算子,实现了模型安全增强与企业级高可用保障。阿里云则面向开发者推出了蒸馏后的DeepSeek-R1-Distill-Qwen-7B模型,通过高性价比的方式实现了DeepSeek系列模型与现有业务的高效融合。
值得注意的是,为了争夺市场份额,不少云厂商都给出了低于DeepSeek官方刊例价的折扣。目前,DeepSeek-R1和DeepSeek-V3的官方刊例价分别为输入4元/M tokens、输出16元/M tokens和输入2元/M tokens、输出8元/M tokens。然而,百度云、阿里云等云厂商纷纷推出优惠措施,如百度云提供的对应模型调用价格为DeepSeek官方刊例价的3-5折,并限时免费服务两周;阿里云百炼平台上的DeepSeek模型也宣布限时免费。火山引擎则通过全栈自研推理系统对DeepSeek进行优化和降本,为企业提供有竞争力的价格及全网最高的限流服务。
回顾2024年,DeepSeek-V2的发布曾引发一轮大模型价格战。如今,随着DeepSeek-R1的火爆,业界普遍关注DeepSeek是否会掀起新一轮的价格战。不过,也有业内人士表示,价格竞争应基于技术创新才能长期持续。预计2025年传统云计算领域的价格竞争会趋缓,但与大模型相关的部分仍会有竞争。
更深层次来看,云平台积极上线DeepSeek旗下模型背后,反映出大模型算力需求的变迁。DeepSeek正在探索压缩大模型训练成本,其备受瞩目的DeepSeek-R1更侧重推理部分。这或许意味着,大模型训练不一定能为云厂商持续带来大量算力需求,但开发者部署偏重推理的大模型,或将为云厂商带来更多商机。随着越来越多企业用户和创业公司转向大模型应用,预计应用爆发将带来大量推理需求,为云厂商带来新的增长点。
(文章来源:第一财经,经编辑整理)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。