AI导读:

上海智元新创技术有限公司推出AgiBot World开源项目,基于全域真实场景提供百万真机数据集,涵盖80余项工作技能,助力人形机器人技术创新与行业应用。

人形机器人在未来有望广泛进入家庭、工厂、商超等场所,替代人类执行多样化任务。上海智元新创技术有限公司携手上海人工智能实验室、国家地方共建人形机器人创新中心及上海库帕思科技公司,共同推出了AgiBot World开源项目,该项目基于全域真实场景,提供了百万真机数据集。该数据集涵盖了打饭倒水、熨烫衣物、洗刷马桶、搬运重物、商品扫码等80余项工作技能,预示着人形机器人在多个领域具有广阔的应用潜力。

智元联合创始人兼首席技术官彭志辉(网名“稚晖君”)表示,在具身智能领域,数据的多样性和真实性对算法创新至关重要,但真机数据的采集成本高且门槛高。因此,智元决定将这些数据开源,以促进具身智能算法的训练和技术创新。智元的数据采集工厂位于张江科学城,占地约2000平方米,拥有上百台人形机器人,构建了家居、餐饮、商超、办公和工业五大应用场景,包含3000多件真实物品,员工每天都在训练人形机器人执行各种任务。

工厂内,员工通过手持手柄,遥控机器人执行抓取、扫码等任务,所有数据都会上传至云端,成为AgiBot World数据集的备选数据。为确保数据集质量,员工采集到的备选数据将经过端侧、云侧的严格筛选,数采系统会自动剔除不符合要求的数据,再由审核员逐帧审核,最后接受算法的二次验证。每台机器人配备了8个环绕式摄像头、6自由度灵巧手、六维力传感器和高精度触觉传感器,以及32个主动自由度,能够灵活应对多种复杂任务。

AgiBot World数据集目前覆盖100多种真实场景,其中家居场景占比最高,达40%,餐饮和工业场景各占20%,商超和办公场景各占10%。与谷歌开源的Open X-Embodiment数据集相比,AgiBot World的长程数据量多10倍,场景覆盖面大100倍。该数据集的开源,将助力科研团队训练具身智能大模型,让人形机器人掌握更多标准化技能。

从基础操作到复杂动作,数据集涵盖了人类日常生活所需的大多数“原子动作”。例如,在训练机器人使用洗碗机时,机器人能够准确无误地将餐具放入洗碗机的各个卡槽;在安装电脑内存条的场景中,机器人经过反复训练,实现了毫米级控制,精准插入内存条。智元希望AgiBot World成为具身智能领域的里程碑式开源项目,推动技术创新、跨学科合作和行业应用。

展望未来,彭志辉认为,人形机器人将在未来2-3年内逐步在制造业领域普及,特别是在柔性生产和装配线等场景中发挥不可替代的作用;未来5年内,它们将进入家政领域,从事简单的家务、陪伴和照护工作,成为家庭的新成员。今年,智元计划举办一系列AgiBot World挑战赛,吸引全球科研团队和创新人才参赛,共同推动人形机器人产业的发展。