AI导读:

MetaGPT团队快速复刻了爆红的Manus产品,推出OpenManus。两者均采用Multi-Agent架构,具备工具链集成属性。AI Agent产品的不断涌现,标志着人工智能行业进入了新的发展阶段。

  凌晨三点敲完代码,次日早上八点新增三十多个好友申请,在开源社区GitHub上迅速收获7000多颗星星——Manus爆红不足三日,隶属于国内AI Agent初创公司DeepWisdom(深度赋智)的MetaGPT 团队,就进行了产品复刻,并将产品Open Manus上传至开源社区。

  第一财经记者对话MetaGPT 团队,试图理清此次技术复刻的底层逻辑,以及行业喧嚣背后的意义。这一过程既反映出产品功能复刻离不开DeepWisdom公司具备的技术沉淀,也通过MetaGPT 团队的视角肯定了Manus团队在规划、后训练、交互方式等方面的投入。

  在复刻过程中理解差异

  早在2023年,MetaGPT 团队开始研究多智能体框架,并在 GitHub 上开源相关代码,获得了社区的广泛关注。2024年10月,团队开始探索 Agent 的规划能力和工具使用能力,提出Data Interpreter等工作。

  Manus火了之后,MetaGPTAI算法研究员向劲宇与MetaGPT算法研究员梁新兵讨论:是否可以直接做一个开源版本。

  在具体产品属性上,OpenManus 是类Manus的多智能体框架,为开发者提供了快速上手和定制化开发的平台,但向劲宇也不忘提醒:目前OpenManus是demo级(演示版本),暂时还没有GALA benchmark评测结果,效果可能一般。后续团队会进一步投入DeepResearch方向与SWE(软件工程)代码方向。

  此前Manus披露在GALA Benchmark 评测中达到当前最优水平(SOTA),超越OpenAI 的 Deep Research 等竞品。人工智能行业在快速发展,Manus与OpenManus这样的AI Agent产品正引领潮流。

  向劲宇推测,Manus团队本身实现了非常复杂的规划与后训练,才能够如同其demo提供良好的产品交互。Manus面临效果不理想时的问题也是行业性问题,OpenManus暂时也没有达到非常强的效果。

  对于三小时便能够复刻“爆品”Manus,梁新兵对第一财经记者表示,本质在于团队已储备的技术积淀,且前两个月前团队已经在思考如何通过简单的、优雅的形式,去呈现一个Agent形态。

  从Manus与OpenManus对外披露的演示视频来看,两者均属于AI Agent 产品,采用Multi-Agent(多智能体)架构,能够将复杂任务拆解为多个子任务,并分配给不同的Agent(智能体)执行。另外,两者均具备工具链集成属性,集成多种工具,如网络搜索、代码执行、文件处理等,以增强智能体的功能。

  相较而言,两者最大差异在于OpenManus的开源属性。与Manus的技术架构主要依靠使用者猜测不同,OpenManus产品团队直接在项目致谢中提及Claude厂商Anthropic去年上线的computer-use,YC投资的项目browser-use等。OpenManus作者张佳钇公开总结产品成果结合了computer-use、基本的Agents,以及规划能力。

  多智能体将普及

  AI Agent和Multi-Agent概念的兴起为行业发展带来了新的启示。

  梁新兵认为,Manus让更多普通人了解到智能体为何物,放大了Multi-Agent这条路径。

  从发展历史来看,Multi-Agent概念雏形最早可以追溯至20世纪80年代,分布式人工智能理念兴起。2017年以后,随着大型语言模型成熟,AI Agent应用开始从理论走向实际,例如AutoGPT 的出现标志着AI Agent的雏形诞生。

  2024年,微软、谷歌、苹果、OpenAI等厂商纷纷布局AI Agent市场。AI Agent产品的不断涌现,标志着人工智能行业进入了新的发展阶段。

  AIGCLINK发起人、行行AI合伙人占冰强对记者表示,Manus此类产品类型,之前MetaGPT团队已经实现过,也算是国内首批投入智能体研发的团队之一。

  MetaGPT NLP/Agent方向研究员洪思睿在交流中表示,目前的行业发展状态中,通过大模型或Agent去做工具的使用,已经不再新奇。随着大家对具体产品与技术的关注越来越多,行业的技术难点在于:当很多相似的工具可解决同样的问题,如何让Agent把决策做得更好。