AI技术新突破：DeepSeek-R1模型与UltraMem架构引领科技潮流

财经聚焦 2025-02-17 11:27:14 来源：财中社作者：网络

AI导读：

国联民生证券报告称，字节跳动豆包大模型团队提出全新稀疏模型架构UltraMem，解决MoE推理时高额访存问题。中兴努比亚手机率先内嵌DeepSeek-R1到操作系统，国内模组厂商积极支持。DeepSeek-R1与UltraMem有望降低模型成本，推动端侧部署。

　　国联民生证券发表研究报告称，科技领域迎来新突破。

　　字节跳动豆包大模型团队提出了全新的稀疏模型架构UltraMem。这一架构显著优化了MoE推理时的访存问题，推理速度较MoE架构提升2-6倍，推理成本最高降幅达83%。研究还揭示了UltraMem的ScalingLaw，证明其不仅具有卓越的Scaling特性，还在性能上超越了MoE。实验显示，训练规模达2000万value的UltraMem模型，在同等计算资源下，实现了业界领先的推理速度和模型性能，为构建更大规模的value或expert模型提供了新途径。

　　AI技术在手机领域的应用也取得新进展。中兴努比亚手机率先将大模型内嵌到操作系统中，预计后续其他厂商将跟进。中兴努比亚星云AI全尺寸内嵌DeepSeek-R1，并在努比亚Z70Ultra机型上线，带来多项优势：直接调用DeepSeek-R1，简化操作流程；与努比亚Z70Ultra星云AI多模态能力无缝交互；与努比亚AI耳机等智能设备互联，实现语音唤醒。

　　国内模组厂商积极支持DeepSeek模型。美格智能推出AIMO智能体产品，加速DeepSeek-R1模型在端侧的落地应用及端云结合方案。移远通信在边缘计算模组SG885G上成功运行DeepSeek-R1蒸馏小模型，生成Tokens速度超每秒40个。广和通高算力AI模组及解决方案已全面支持小尺寸的DeepSeek-R1模型。未来，这些技术有望在自动驾驶、机器人控制、智能制造、智慧医疗、AI智能体等场景广泛应用。

　　DeepSeek-R1模型的成功发布及豆包提出的UltraMem架构，有望降低推理侧模型成本，推动模型在端侧的部署。

（文章来源：财中社）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。