智元发布通用具身基座模型引领机器人智能化发展

财经聚焦 2025-03-10 10:01:22 来源：界面新闻作者：网络

AI导读：

3月10日，智元发布了首个通用具身基座模型——智元启元大模型（Genie Operator-1），融合了VLM与MoE技术，具备卓越的场景感知、语言理解和动作执行能力，降低了具身智能门槛，为机器人产业智能化发展注入新活力。

3月10日，智元发布了首个通用具身基座模型——智元启元大模型（Genie Operator-1），这标志着AI技术在机器人领域的又一重大突破。该模型创新性地提出了Vision-Language-Latent-Action (ViLLA) 架构，该架构融合了VLM（多模态大模型）与MoE（混合专家）技术。VLM通过海量互联网图文数据的训练，获得了卓越的通用场景感知和语言理解能力。而MoE中的Latent Planner（隐式规划器）则利用大量跨本体和人类操作视频数据，实现了通用的动作理解能力。同时，MoE中的Action Expert（动作专家）借助百万真机数据的训练，具备了精细的动作执行能力。这一创新使得智元启元大模型能够利用人类视频进行学习，完成小样本的快速泛化，极大地降低了具身智能的门槛，并已成功部署到智元的多款机器人本体上。

此次智元启元大模型的发布，不仅展示了智元在AI技术研发上的深厚实力，也为机器人产业的智能化发展注入了新的活力。随着该模型的应用推广，我们有理由相信，未来的机器人将更加智能、更加灵活，为人们的生活带来更多便利。（文章来源：界面新闻）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。