AI导读:

OpenAI发布首个AI智能体Operator,可访问网络为用户执行任务,像人类一样与图形用户界面进行交互。国产大模型智谱AI也推出电脑智能体GLM-PC。随着一系列科技公司产品的密集发布,AI智能体正在加速尝试代替人类去做一些力所能及的事情。


AI智能体领域再迎重量级选手。当地时间1月23日,OpenAI震撼发布了其首个AI智能体Operator。据官方阐述,Operator作为一款研究预览版智能体,能够接入互联网为用户执行各类任务,与人类操作图形用户界面(GUI)的方式无异,无需依赖特定于操作系统或网络的API,即可灵活执行数字任务。OpenAI CEO山姆·奥特曼携手三名团队成员,通过在线直播向观众直观展示了Operator如何模拟人类操作电脑。

事实上,AI智能体的概念早已有之。在OpenAI之前,已有部分AI企业推出了自家的AI智能体产品。尤为值得一提的是,就在OpenAI发布Operator的前一天,国产大模型领域的佼佼者智谱AI推出了全球首个面向公众的即用型电脑智能体GLM-PC,昵称“牛牛”,其能够如人类般操作电脑,圆满完成各类复杂任务。

智能体概念的火爆,直接带动了智谱AI股价的大幅上涨,当日收盘涨幅接近7%。成份股中,值得买涨幅超过13%,凌云光、金现代涨幅均超过10%。

AI智能体:人类电脑的“新管家”

据OpenAI官网介绍,Operator由全新模型CUA(计算机使用代理)驱动,融合了GPT-4的视觉能力,并借助强化学习实现高级推理功能。

简而言之,Operator能够助力人类操作电脑,不仅能执行网页层面的操作,如浏览、输入、点击、滚动网页,更能完成更为复杂的智能任务。演示显示,用户只需输入需求,Operator即可实现餐厅订位、商品购买、比赛门票预订等功能,并支持用户实时查看进度,随时接管操作。在涉及付款信息、家庭住址等隐私信息及关键步骤时,Operator会暂停操作,交由用户接管。

以预定餐厅为例,Operator在接收到指令后,会自动打开网页,进入相应网站并搜索餐厅完成预定。在餐厅座位紧张的情况下,Operator还会灵活调整,询问用户是否愿意改订其他时间段。

Operator的发布,引发了ChatGPT访问量的激增,众多用户争相体验,导致ChatGPT一度宕机三小时。目前,Operator的使用权限尚有限制,仅面向每月200美元订阅费的ChatGPT Pro美国用户开放,且从本周四起生效。但山姆·奥特曼透露,Operator后续将向ChatGPT Plus、Team及企业用户开放,并计划在其他国家推出,不过欧洲地区可能需要更长时间。

2025:智能体时代的元年

在Operator发布后,OpenAI总裁格雷格·布洛克曼在个人社交平台评论称:“2025年是智能体之年”。此前,OpenAI前首席科学家、安全超级智能公司联合创始人伊利亚·苏茨克维也曾预测,下一代模型将“以真正的方式实现代理化”,未来的AI智能体将取得丰硕成果,具备更深入的理解和自我意识,人工智能将像人类一样进行逻辑推理。

AI智能体,作为基于人工智能技术构建的超级智能数字助手,能够学习并理解各类信息,并根据用户需求提供帮助、建议或进行互动。海通证券研报指出,AI智能体前景广阔,随着大模型的发展,智能体将从理论走向实践,成为各行各业的重要助力。借助多模态大模型,智能体能够整合图片、语音等异构数据,提高任务处理效率,解决跨行业、跨领域的问题。在技术层面,智能体具备长期和短期记忆、自主规划、工具使用及自动执行任务的能力,这些能力不仅能够提升工作效率,还能为用户带来更佳的体验。单智能体通过试错学习适用于简单任务,而多智能体则在复杂环境中通过合作或竞争调整最佳策略。

当前,AI智能体已成为各大科技巨头和初创企业竞相布局的关键领域。从国际层面看,OpenAI的主要竞争对手Anthropic在去年10月发布了computeruse功能;谷歌则在去年底推出了基于大模型Gemini2.0的智能体Mariner,可浏览电子表格、购物网站等,助力用户填满虚拟购物车。

在国产大模型方面,智谱AI于去年10月发布了AI手机端的AutoGLM,作为其大模型GLM的首个产品化智能体,只需接收简单的文字或语音指令,即可模拟人类操作手机。用户通过语音向手机发送命令后,AutoGLM会在用户授权下自动打开目标APP,执行相关命令,功能包括在淘宝上购买历史订单产品、在携程上预订酒店、在美团上点外卖、在微信群里领取红包等。

AutoGLM发布后迅速引发广泛关注,并催生了“智谱AI概念股”。值得注意的是,在OpenAI发布Operator的前一天,智谱AI还推出了可自主操作电脑的多模态智能体新版GLM-PC。作为全球首个面向公众的即用型电脑智能体,GLM-PC(昵称“牛牛”)能够帮助用户实现网上购物、发微信拜年、编辑文档等功能。

在其演示视频中,“牛牛”能够自动提取图片中的商品数据,存储至Excel,并自动将商品加入淘宝购物车,实现一站式购物流程。视频中,“牛牛”在淘宝网站中依次将魔芋爽、薯片、猪肉脯、辣条等零食添加进购物车。

业内人士分析指出,AI智能体的推出,反映了当前AI开发者更加注重如何帮助用户自动完成日常任务。随着一系列科技公司产品的密集发布,AI智能体正加速尝试替代人类执行力所能及的任务。

尽管Operator目前仍处于早期研究预览阶段,尚存在诸多不完善之处,但山姆·奥特曼在直播中表示,“这是OpenAI进军智能体领域的开端”。可以预见的是,OpenAI的强势入局必将为AI智能体领域再添一把火,2025年的“智能体大战”已正式打响,人机交互方式将迎来更深层次的变革。

(文章来源:证券时报)