AI导读:

OpenAI首席执行官山姆·奥特曼演示了新智能体Operator,可自动执行任务。同时,国内AI智谱公司的GLM-PC也展现出强大功能,两款智能体在功能和应用场景上存在异同。

北京时间1月24日,OpenAI首席执行官山姆·奥特曼在直播间向全球观众展示了其公司最新研发的智能体Operator(操作员)。这一创新技术允许用户在电脑端输入需求后,智能体Operator能够自动执行任务,无需用户持续操作,所有操作过程均可在桌面上清晰展现。

山姆·奥特曼(图中左1)亲自参与了此次直播演示,图片来源于官方直播视频截图。

在直播演示中,Operator展现了其强大的功能。例如,当直播人员在对话框中输入前往某餐厅预订餐桌的需求后,Operator迅速打开网页并进入预订网站,成功搜索到餐厅并完成了网上预订。此外,当上传一张包含“鸡蛋、蘑菇”等食物的购物清单后,Operator自动打开浏览器进入买菜网站,搜索并将这些食物加入购物车。值得注意的是,尽管Operator能够自动完成大部分流程,但在付款环节仍需用户手动操作。

山姆·奥特曼表示,Operator的发布标志着OpenAI正式迈入Level 3(等级三)智能体的新纪元,并预告在未来几周和几个月内将推出更多智能体。根据OpenAI此前发布的“人工智能发展等级”,等级三代表智能体阶段,等级四为能够进行创新的人工智能,而等级五则是能够完成组织工作的人工智能。

值得注意的是,在OpenAI发布Operator的前一天,国内AI领域的佼佼者之一——智谱公司更新了其电脑智能体大模型GLM-PC(中文昵称牛牛)。GLM-PC早在去年11月就已开放内测,并在今年1月23日进行了深度思考模式的升级。有开发者向贝壳财经记者透露,GLM-PC同样具备Operator在视频中展示的功能。

两款智能体在多个方面存在相似之处,如输入的模态(图像感知)、输出的操作空间(点击、滚动、输入)一致,都具备敏感性检测功能,能够在用户进行敏感操作(如确认提交)时提示用户接盘,并都具备推理能力和一定程度的自反馈机制。然而,它们也存在差异,Operator现阶段主要针对网页操作,而GLM-PC则能够覆盖电脑的任何操作,包括浏览器在内的各种应用程序。