DeepSeek模型热度飙升,合作伙伴阵容迅速壮大
AI导读:
DeepSeek模型热度持续攀升,吸引京东云、阿里云等六大云巨头及华为、摩尔线程等国产芯片厂商纷纷支持。DeepSeek的开源策略推动AI模型低成本化,扩大应用场景,有望带动AI产业迎来新的发展机遇。
随着DeepSeek模型的持续升温,其合作伙伴阵容也在迅速壮大。近日,京东云正式推出DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署及专混私有化实例部署,为用户提供多样化的选择。此前,阿里云、百度智能云、华为云、腾讯云、火山引擎以及天翼云等国内云巨头已纷纷接入DeepSeek模型,海外云服务商如亚马逊AWS、微软Azure等也宣布提供支持。
在芯片领域,华为率先宣布DeepSeek-R1、DeepSeek-V3、DeepSeek-V2及Janus-Pro等模型上线昇腾社区,同时,DeepSeek-V3满血版在国产沐曦GPU上首发体验。天数智芯、摩尔线程、海光信息等国产芯片厂商也在近期宣布了对DeepSeek模型的支持,而英伟达、AMD、英特尔等海外芯片巨头更早前已完成适配。此外,无问芯穹、硅基流动等AI基础设施厂商,以及青云科技、PPIO派欧云、云轴科技等独立云厂商也已宣布适配及上架DeepSeek模型服务。
从底层芯片到云服务商,DeepSeek的合作伙伴范围不断扩大,这有望进一步推动大模型的低成本化,并扩大AI的垂直应用场景。目前,华为小艺助手App的智能体广场已上线DeepSeek-R1的Beta版,科创板上市公司光云科技、当虹软件等企业也接入了DeepSeek系列模型,积极探索应用创新。
六大云巨头携手DeepSeek,共推开源生态发展
DeepSeek旗下大模型的火爆表现吸引了国内主流云平台的关注,这些平台纷纷上线了相关模型。京东云言犀AI开发计算平台宣布支持DeepSeek-V3、DeepSeek-R1及所有蒸馏小参数模型的一键部署,极大提升了用户的使用便捷性。春节期间,华为云与硅基流动联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务,阿里、腾讯、百度、火山引擎等云厂商也紧随其后,上线了DeepSeek系列模型。其中,百度智能云还推出了限时免费的服务方案,进一步降低了用户的使用门槛。至此,国内六大云巨头均已正式支持DeepSeek。
AI产品榜的数据显示,DeepSeek上线仅18天时日活就突破了1500万,而ChatGPT达到这一数字则花了244天,DeepSeek的增速是ChatGPT的13倍。上线20天后,DeepSeek的日活已达到2215万,实现了快速增长。云基础设施厂商有望从DeepSeek的火爆中受益,而DeepSeek的成功也将提振整个开源社区的共建氛围,推动更多开源模型实现快速发展。
相比OpenAI的闭源路线,DeepSeek选择了开源的开放路线,这一策略得到了业界的广泛认可。面对DeepSeek的火爆表现,OpenAI首席执行官萨姆·阿尔特曼承认OpenAI在开源策略上犯了错误,并表示需要考虑制定不同的开源策略。
华泰证券认为,开源模型的优势在于社区共建和技术共享。理论上,所有的小参数模型都可以利用DeepSeek-R1蒸馏出的标签数据来增强推理性能。2025年有望成为开源模型快速进步的一年,国产大模型的进展值得期待。
国产芯片兼容支持DeepSeek,挑战与机遇并存
在芯片领域,DeepSeek系列模型已正式上线昇腾社区,支持一键获取并开箱即用。摩尔线程也实现了对DeepSeek蒸馏模型推理服务的部署,并计划开放自主设计的夸娥(KUAE)GPU智算集群,全面支持DeepSeek-V3、R1模型及新一代蒸馏模型的分布式部署。天数智芯与Gitee AI成功完成了与DeepSeek-R1的适配工作,并上线了多款大模型服务。此外,Gitee AI联合沐曦首发全套DeepSeek-R1千问蒸馏模型,实现了从芯片到平台、从算力到模型的全国产研发与制造。
主流国产芯片已基本实现对DeepSeek蒸馏版小模型的兼容支持,这意味着此前能够运行Llama、Qwen等常见模型的用户,如今可以直接无修改地运行DeepSeek蒸馏版小模型。随着基于DeepSeek的应用不断涌现,越来越多芯片厂商将加入其中,新一轮市场竞争与价格调整或许即将拉开帷幕。然而,满血版的V3和R1拥有高达6710亿参数,对硬件的要求大幅提升,且需要额外的推理框架支持。目前仅有少数几家国产芯片成功上线了满血版,这对所有国产芯片厂商而言既是挑战也是机遇。
DeepSeek扩大AI应用场景,推动产业发展
谈及DeepSeek对国内AI产业链的利好影响,沐曦联合创始人杨建表示,最大的影响在于强化学习的蒸馏流程开源,这将使大模型在垂直领域的后训练和推理成本急剧下降,可用性急剧上升。同时,DeepSeek的开源将催生大模型在各行各业的认知,拉升私有化垂直模型部署的愿望。随着DeepSeek带动模型成本的下降,有望推动AI应用的爆发。科创板上市公司光云科技、当虹科技等都在积极探索DeepSeek模型的落地应用。
TrendForce集邦咨询研究指出,虽然DeepSeek模型降低了AI训练成本,但AI模型的低成本化有望扩大应用场景,进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件,将受益于高速数据传输的需求。未来AI服务器之间的数据传输需要大量高速光收发模块,这些模块负责将电信号转换为光信号并通过光纤传输,再将接收到的光信号转换回电信号。预计2025年全球400Gbps以上的光收发模块出货量将超过3190万个,年增长率达56.5%。
随着DeepSeek模型成本的下降和应用场景的扩大,AI产业将迎来新的发展机遇。各大研究机构将加快新算法的落地速度,推动算法创新爆发。同时,大模型应用人才培养也将受到更多重视,今年全国有望培养大模型应用开发人才30-50万。
(文章来源:科创板日报,部分数据和信息来源于公开资料及行业分析)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。