AI导读:

银河通用创始人兼CTO王鹤在中关村论坛年会表示,人形机器人已迈入运动时代,即将进入生产力时代。银河通用通过大规模生产和使用合成数据,发布全球首个完全基于合成数据训练的端到端具身大模型GraspVLA,引领人形机器人技术创新。

3月27日,2025中关村论坛年会盛大开幕。银河通用创始人兼CTO王鹤在会上发表演讲,阐述人形机器人寄托了人类对美好生活及尖端科技的无限向往。

自20世纪70年代以来,人形机器人便初具规模,本田ASIMO机器人和波士顿动力Atlas机器人成为该时期的代表,展现了基本的行走与简单运动能力。然而,这些传统技术驱动的机器人存在开发周期长、地形适应性差及部署可靠性不足等问题。

近年来,机器人技术突飞猛进。宇树科技在春晚展示了群体舞蹈机器人,而国地共建的“天工”机器人已能在复杂地形中奔跑,备战马拉松,标志着人形机器人迈入运动时代。王鹤强调,机器人地形适应性和可靠性大幅提升,背后得益于无需视觉输入的强化学习技术。

尽管当前人形机器人无需视觉输入便能展现出卓越的运动能力,但这绝非终点。特斯拉的Optimus机器人已在电车工厂展示电池分拣能力,依赖连续视觉输入。银河通用的Galbot机器人同样依赖此技术实现泛化操作。

王鹤预测,视觉引领肢体控制,实现自主泛化操作的能力,将使人形机器人真正成为人类得力助手,预示人形机器人即将进入生产力时代。此时代,基于视觉输入的端到端具身大模型成为核心,但面临数据缺乏的挑战。银河通用通过大规模生产和使用合成数据破解难题。

银河通用的全仿真合成数据生产管线,一周内即可生成十亿级机器人操作数据集,涵盖视频、语言、动作三模态。基于此,银河通用发布全球首个完全基于合成数据训练的端到端具身大模型GraspVLA。

王鹤指出,大量合成数据使大模型无需真实世界数据即可获得高可靠性,成本低廉。进一步训练其按人类意图工作,仅需少量人工数据。GraspVLA大模型具备强大举一反三能力和柔性物体操作能力。

目前,银河通用的机器人已在药店、新能源汽车工厂等场景应用。

(文章来源:21世纪经济报道)