豆包大模型发布UltraMem架构，推理速度大幅提升

财经聚焦 2025-02-12 19:20:44 来源：每日经济新闻作者：网络

AI导读：

豆包大模型团队发布全新稀疏模型架构UltraMem，有效解决MoE推理时高额访存问题，推理速度提升2~6倍，成本最高降83%，性能超越MoE，该研究还揭示了新架构的Scaling Law。

每经北京2月11日电（记者杨昕怡）豆包大模型团队今日宣布，提出了全新的稀疏模型架构UltraMem，该架构有效解决了MoE（混合专家模型）推理时高额的访存问题，推理速度较MoE架构提升2~6倍，推理成本最高可降低83%。示意图该研究还揭示了新架构的Scaling Law（规模定律），证明其不仅具备优异的Scaling特性，更在性能上超越了MoE。

（文章来源：每日经济新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。