DeepSeek模型引领AI普惠化，国产算力迎爆发｜科技财经

产业经讯 2025-02-12 11:16:41 来源：财中社作者：网络

AI导读：

DeepSeek通过技术创新降低对高端GPU依赖，适配国产芯片，引爆国产算力需求。16家国产AI芯片企业和多家云计算巨头宣布支持DeepSeek，AI普惠化已拉开序幕。

银河证券发表研究报告称，截至2月7日，16家国产AI芯片企业(华为异腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技、太初元基、云天励飞、燧原科技、昆仑芯、灵汐科技、鯤云科技、希姆计算、算能、清微智能、芯动力)相继宣布适配或上架Deepseek模型服务。

DeepSeek通过工程化创新实现降本增效。2025年1月20日, DeepSeek发布了全新的开源推理大模型DeepSeek-R1，震动海内外科技圈。DeepSeek从三个核心角度进行了技术创新，实现了仅用2048块英伟达H800GPU，耗费了557.6万美元就完成GPT-4、Claude-3.5-Sonnet等同等规模的模型训练。在技术评估过程中，DeepSeek-V3的教育类基准测试表现超越了所有的开源模型，在数学领域的所有非CoT模型中也取得了最优性能。1)架构创新：采用了经DeepSeek-V2验证的MLA和DeepSeekMoE技术，并创新性地引入了无辅助损失负载均衡策略。2)高效预训练：设计了专门的FP8训练混合精度框架，以实现训练效率和数值稳定性的最优平衡。开发了DualPipe算法实现高效的流水线并行处理，降低训练过程中的通信开销。3)知识蒸馏：创新性的将从longChain-of-Thought (CoT)模型中提炼推理能力集成到标准LLM中。

DeepSeek降低制程依赖，成为AI普惠化的里程碑。传统的AI训练多依赖高算力芯片，英伟达上半年的芯片更是一卡难求。Deepseek通过技术创新成功降低了对高端GPU的依赖，可以适配国产芯片架构，并为国产芯片提供技术验证场景。截至2月7日，华为异腾、沐曦、天数智芯、摩尔线程、海光信息、壁仞科技等16家国产AI芯片企业相继宣布适配或上架DeepSeek模型服务；华为云、腾讯云、阿里云等10家国内云计算巨头和至少12家独立云及智算企业，均宣布对DeepSeek的支持，AI普惠化已拉开序幕。

DeepSeek引爆国产算力，带动国产供应链发展。DeepSeek这种“小而美”的模型的出现，为开发者、内容创作者乃至小型初创者提供了更多的选择，端侧小模型或将遍地开花，进一步带动了国产算力的需求。DeepSeek和国产算力芯片的适配不仅给予我国AI发展弯道超车的机会，也将进一步抬升我国半导体制造产业链的天花板。

（文章来源：财中社）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。