AI导读:

日本冲绳科学技术研究所研发出一种新颖架构的具身智能模型,实现了高效泛化学习,揭示了神经网络认知发展的关键信息。该研究为AI更安全、合乎道德的发展指明了方向,也为认知科学提供了宝贵见解。

日本冲绳科学技术研究所的认知神经机器人团队近期取得了一项突破性进展,他们研发出了一种采用新颖架构的具身智能模型。这一创新模型不仅使科学家能够深入访问神经网络的各类内部状态,更以类似人类儿童的学习方式,实现了高效的泛化能力,揭示了神经网络在认知发展和信息处理过程中的关键机制。相关研究成果已在新一期《科学·机器人学》权威杂志上发表。

在人工智能(AI)领域,大型语言模型(LLM)虽占据重要地位,但其高度依赖大规模数据集,难以像人类一样,仅凭有限信息就能进行有效泛化。相比之下,具身智能作为一种基于物理实体感知与行动的智能系统,通过与环境的互动来获取信息、理解问题、制定决策并执行行动,展现了独特的优势。

该具身智能模型以预测编码为灵感,融合了变分递归神经网络框架,通过整合视觉、本体感觉以及语言指令三种感官输入进行训练。模型接收的输入包括观看机械臂移动彩色块的视频、感知人体四肢运动的感觉及机械臂移动时的关节角度,以及执行如“把红色物体放在蓝色物体上”的语言指令。

该模型的设计理念源自大脑根据过往经验预测感官输入,并通过行动来最小化预测与实际观察之间差异的机制。由于大脑的工作记忆和注意力资源有限,它必须按顺序处理输入并更新预测,而非像LLM那样一次性处理所有信息。

研究表明,这一新模型仅需较小的训练集和较少的计算资源,便能实现泛化学习。尽管其犯错频率高于LLM,但这些错误模式却与人类错误相似,为AI的行为效果提供了更直观的理解。

这一发现意味着,将语言与行为相结合可能是儿童快速学习语言的关键因素。这种具身智能不仅提升了AI系统的透明度,还为未来更安全、更合乎道德的AI发展指明了方向。

该研究为理解和模拟人类认知提供了全新视角,展示了整合多种感官输入以实现高效泛化能力的方法。这一成果不仅有助于开发更加智能、灵活的AI系统,也为认知科学领域带来了宝贵的见解。

(来源:科技日报,版权归原作者所有)

相关图片描述