DeepSeek模型热度飙升，合作伙伴阵容迅速壮大

国内财经 2025-02-05 17:52:24 来源：科创板日报作者：网络

AI导读：

DeepSeek模型热度持续攀升，吸引京东云、阿里云等六大云巨头及华为、摩尔线程等国产芯片厂商纷纷支持。DeepSeek的开源策略推动AI模型低成本化，扩大应用场景，有望带动AI产业迎来新的发展机遇。

随着Deepseek模型的持续升温，其合作伙伴阵容也在迅速壮大。近日，京东云正式推出DeepSeek-R1和DeepSeek-V3模型，支持公有云在线部署及专混私有化实例部署，为用户提供多样化的选择。此前，阿里云、百度智能云、华为云、腾讯云、火山引擎以及天翼云等国内云巨头已纷纷接入DeepSeek模型，海外云服务商如亚马逊AWS、微软Azure等也宣布提供支持。

在芯片领域，华为率先宣布DeepSeek-R1、DeepSeek-V3、DeepSeek-V2及Janus-Pro等模型上线昇腾社区，同时，DeepSeek-V3满血版在国产沐曦GPU上首发体验。天数智芯、摩尔线程、海光信息等国产芯片厂商也在近期宣布了对DeepSeek模型的支持，而英伟达、AMD、英特尔等海外芯片巨头更早前已完成适配。此外，无问芯穹、硅基流动等AI基础设施厂商，以及青云科技、PPIO派欧云、云轴科技等独立云厂商也已宣布适配及上架DeepSeek模型服务。

从底层芯片到云服务商，DeepSeek的合作伙伴范围不断扩大，这有望进一步推动大模型的低成本化，并扩大AI的垂直应用场景。目前，华为小艺助手App的智能体广场已上线DeepSeek-R1的Beta版，科创板上市公司光云科技、当虹软件等企业也接入了DeepSeek系列模型，积极探索应用创新。

六大云巨头携手DeepSeek，共推开源生态发展

DeepSeek旗下大模型的火爆表现吸引了国内主流云平台的关注，这些平台纷纷上线了相关模型。京东云言犀AI开发计算平台宣布支持DeepSeek-V3、DeepSeek-R1及所有蒸馏小参数模型的一键部署，极大提升了用户的使用便捷性。春节期间，华为云与硅基流动联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务，阿里、腾讯、百度、火山引擎等云厂商也紧随其后，上线了DeepSeek系列模型。其中，百度智能云还推出了限时免费的服务方案，进一步降低了用户的使用门槛。至此，国内六大云巨头均已正式支持DeepSeek。

AI产品榜的数据显示，DeepSeek上线仅18天时日活就突破了1500万，而ChatGPT达到这一数字则花了244天，DeepSeek的增速是ChatGPT的13倍。上线20天后，DeepSeek的日活已达到2215万，实现了快速增长。云基础设施厂商有望从DeepSeek的火爆中受益，而DeepSeek的成功也将提振整个开源社区的共建氛围，推动更多开源模型实现快速发展。

相比OpenAI的闭源路线，DeepSeek选择了开源的开放路线，这一策略得到了业界的广泛认可。面对DeepSeek的火爆表现，OpenAI首席执行官萨姆·阿尔特曼承认OpenAI在开源策略上犯了错误，并表示需要考虑制定不同的开源策略。

华泰证券认为，开源模型的优势在于社区共建和技术共享。理论上，所有的小参数模型都可以利用DeepSeek-R1蒸馏出的标签数据来增强推理性能。2025年有望成为开源模型快速进步的一年，国产大模型的进展值得期待。

国产芯片兼容支持DeepSeek，挑战与机遇并存

在芯片领域，DeepSeek系列模型已正式上线昇腾社区，支持一键获取并开箱即用。摩尔线程也实现了对DeepSeek蒸馏模型推理服务的部署，并计划开放自主设计的夸娥（KUAE）GPU智算集群，全面支持DeepSeek-V3、R1模型及新一代蒸馏模型的分布式部署。天数智芯与Gitee AI成功完成了与DeepSeek-R1的适配工作，并上线了多款大模型服务。此外，Gitee AI联合沐曦首发全套DeepSeek-R1千问蒸馏模型，实现了从芯片到平台、从算力到模型的全国产研发与制造。

主流国产芯片已基本实现对DeepSeek蒸馏版小模型的兼容支持，这意味着此前能够运行Llama、Qwen等常见模型的用户，如今可以直接无修改地运行DeepSeek蒸馏版小模型。随着基于DeepSeek的应用不断涌现，越来越多芯片厂商将加入其中，新一轮市场竞争与价格调整或许即将拉开帷幕。然而，满血版的V3和R1拥有高达6710亿参数，对硬件的要求大幅提升，且需要额外的推理框架支持。目前仅有少数几家国产芯片成功上线了满血版，这对所有国产芯片厂商而言既是挑战也是机遇。

DeepSeek扩大AI应用场景，推动产业发展

谈及DeepSeek对国内AI产业链的利好影响，沐曦联合创始人杨建表示，最大的影响在于强化学习的蒸馏流程开源，这将使大模型在垂直领域的后训练和推理成本急剧下降，可用性急剧上升。同时，DeepSeek的开源将催生大模型在各行各业的认知，拉升私有化垂直模型部署的愿望。随着DeepSeek带动模型成本的下降，有望推动AI应用的爆发。科创板上市公司光云科技、当虹科技等都在积极探索DeepSeek模型的落地应用。

TrendForce集邦咨询研究指出，虽然DeepSeek模型降低了AI训练成本，但AI模型的低成本化有望扩大应用场景，进而增加全球数据中心建置量。光收发模块作为数据中心互连的关键组件，将受益于高速数据传输的需求。未来AI服务器之间的数据传输需要大量高速光收发模块，这些模块负责将电信号转换为光信号并通过光纤传输，再将接收到的光信号转换回电信号。预计2025年全球400Gbps以上的光收发模块出货量将超过3190万个，年增长率达56.5%。

随着DeepSeek模型成本的下降和应用场景的扩大，AI产业将迎来新的发展机遇。各大研究机构将加快新算法的落地速度，推动算法创新爆发。同时，大模型应用人才培养也将受到更多重视，今年全国有望培养大模型应用开发人才30-50万。

（文章来源：科创板日报，部分数据和信息来源于公开资料及行业分析）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。