AI导读:

上海智元新创技术有限公司推出AgiBot World项目,基于全域真实场景的百万真机数据集开源,展示人形机器人在80多种工作技能上的应用潜力,助力具身智能领域技术创新和产品应用。

家庭、工厂、商超等场景,人形机器人能力大揭秘

上海智元新创技术有限公司携手上海人工智能实验室、国家地方共建人形机器人创新中心及上海库帕思科技公司,共同推出了AgiBot World项目,一个基于全域真实场景的百万真机数据集开源项目。该项目展示了人形机器人在打饭倒水、熨烫衣物、清洁马桶、重物搬运、商品扫码等超过80种工作技能上的应用潜力,预示着人形机器人将广泛应用于各个领域。

智元联合创始人兼首席技术官彭志辉(网名“稚晖君”)表示,具身智能领域的发展高度依赖于数据的多样性和真实性,但真机数据的采集成本高昂且门槛较高。因此,智元决定开放其技术资源,通过AgiBot World数据集,助力全球具身智能开发者加速技术创新和产品应用。

AgiBot World数据集来源于智元位于张江科学城、占地约2000平方米的数据采集工厂,拥有上百台人形机器人,并构建了家居、餐饮、商超、办公和工业五大应用场景,涵盖3000多件真实物品。在家居场景中,公司还原了真实的住宅布局,包括客厅、卧室、厨房和卫生间等空间;而在工业场景中,则模拟了仓库和生产线环境,包括分拣系统、打包设备和传输带等,用于训练机器人进行分拣、打包和搬运等工作。

数据采集工厂设有五大应用场景。

在高度仿真的环境中,数据采集师们每天都在训练人形机器人执行各种任务。他们通过手柄遥控操作机器人,使机器人模仿他们的动作,并将所有数据上传至云端,成为AgiBot World数据集的备选数据。据一名数据采集师透露,每天大约采集150条数据,预计需要上万条数据才能使机器人掌握一项任务。

数据采集师正在训练人形机器人执行流水线作业。

彭志辉介绍,智元为每台机器人配备了8个环绕式摄像头、6自由度灵巧手以及六维力传感器和高精度触觉传感器,使机器人能够360度感知环境变化,实现精准灵活的动作,并感知力的微小变化。此外,机器人全身具有32个主动自由度,能够灵活应对多种复杂任务。

为确保数据集质量,员工采集到的备选数据将经过严格的筛选和审核。数采系统会自动剔除不符合要求的数据,再由审核员逐帧审核,确保每个动作都符合任务标准。最后,这些数据还将接受算法的二次验证。

人形机器人正在学习熨烫衣物。

AgiBot World数据集目前覆盖100多种真实场景,其中家居场景占比最高,达到40%,餐饮和工业场景各占20%,商超和办公场景各占10%。数据集中约80%的任务为长程任务,任务时长在60至150秒之间。与谷歌开源的Open X-Embodiment数据集相比,AgiBot World的长程数据量多出10倍,场景覆盖面大100倍。

人形机器人正在学习家庭除尘。

数据集涵盖了从抓取、放置、推、拉等基础操作到搅拌、折叠、熨烫等复杂动作的“原子动作”,并组成长程任务。例如,在洗碗机使用场景中,机器人能够准确无误地将层层堆叠的餐具放入洗碗机的各个卡槽;在安装内存条的场景中,机器人实现了毫米级控制,精准地将内存条插入电脑主机。

人形机器人正在学习清洗马桶。

彭志辉表示,AgiBot World项目是一个里程碑式的开源项目,标志着具身智能领域迎来了“ImageNet时刻”。该项目包含传感器数据、操作数据和环境交互数据,有望大幅降低研究门槛,推动人形机器人技术创新、跨学科合作和行业应用。

人形机器人正在学习插花。

今年,智元计划举办一系列AgiBot World挑战赛,吸引全球科研团队和创新人才参与。在这个技术共享平台上,参赛者将利用数据集开发各种机器人,并进行技术交流和合作,共同探讨未来产业的技术标准和规范。

展望未来,彭志辉认为,人形机器人将在未来2至3年内逐步普及于制造业领域,特别是在柔性生产和装配线等场景中发挥重要作用;而在未来5年内,它们将进入家政领域,凭借成熟的技能从事简单的家务、陪伴和照护工作,成为许多家庭的新成员。

(文章来源:上观新闻)