AI导读:

OpenAI计划推出代号为“Operator”的全新AI助理产品,国内外厂商也在积极布局AI助理领域,AI助理被视为通往通用人工智能的核心基础,或成为终端智能化的重要突破口。

据媒体报道,OpenAI正紧锣密鼓地筹备一款代号为“Operator”的全新AI助理产品,该产品旨在自动执行编写代码、预订旅行、自动电商购物等一系列复杂操作。据内部员工透露,OpenAI领导层计划于2025年1月正式推出该产品,初期将以研究预览版和开发工具的形式亮相,并向开发人员开放API接口。

OpenAI一直在推进多个与智能体相关的研究项目,其中,一款可在网络浏览器中执行任务的通用工具已接近完成。AI助理(AI Agent)作为一种能够感知环境、进行决策和执行动作的智能实体,具备独立思考、调用工具逐步完成给定目标的能力,既能满足C端用户的个性化需求,也能为B端用户提供降本增效的解决方案。对于普通用户而言,AI助理最吸引人的功能在于能够自主操作手机,辅助完成复杂推理任务。

OpenAI首席执行官阿尔特曼曾多次表示对AI助手的期待。几周前,他在Reddit的“问我任何问题”论坛上直言:“我们将拥有越来越好的模型,但我认为下一个重大突破将是AI助手。”在公司年度开发日前的新闻发布会上,首席产品官Kevin Weil也预测:“2025年将是Agent系统最终进入主流的一年。”

面对商业化进程中的巨大压力,OpenAI急需一款突破性产品来证明对AI开发的巨额投资物有所值。目前,OpenAI已开源了多功能协同AI Agent——Swarm,可创建多个智能体协同工作,以更高效地完成任务。其GPT o1模型在推理能力上的提升,使其在复杂问题的解决和用户交互的自然性方面均取得了显著进步,更加适用于AI Agent场景。

AI助理被视为通往通用人工智能(AGI)的核心基础,在硬件厂商纷纷拥抱AI的时代,AI助理或将成为终端智能化的重要突破口。甬兴证券指出,AI Agent或将成为移动互联的新入口,重塑流量分发格局。AI Agent智能体因具备强交互性和便利性,或可打破原先同个终端不同App之间的壁垒。

国内外头部厂商正争相推出AI助理产品。微软近期低调开源了AI工具OmniParser,帮助用户创建个性化智能体,以操作个人计算机;并在Dynamics 365中集成了10个自主AI Agent,支持OpenAI最新模型o1,具备自主学习能力,可自动执行跨平台复杂业务。此外,微软还推出了Windows Agent Arena基准框架,同样属于AI助理开发范畴。谷歌则计划在12月预览其大型动作模型“Project Jarvis”,帮助用户执行诸如收集研究、购买产品或预订航班等任务。Anthropic为大模型Claude迭代了新功能——Computer Use,让AI能够像人一样操控电脑。苹果则将Siri与ChatGPT集成,实现更智能的人机交互,并发布了Ferret-UI技术,让AI理解手机屏幕。华为也公布了一项新研究成果,可让AI像人类一样操作手机。

中国独角兽企业智谱AI已上线AI助理工具AutoGLM,用户只需发出语音指令,即可让AutoGLM自动打开手机上的各类App,进行网购、点外卖、订高铁票等操作,甚至还能发微信、抢红包、评论朋友圈、整理笔记并生成攻略、总结论文。中信证券认为,AutoGLM等终端AI助理技术将带来更短路径的交互形式,为消费者带来极大便利,有望成为AI终端的亮点功能。华泰证券也表示,AI助理的落地将带来多个层次的产业机遇,其中Agent+终端有望推动人机交互变革,对终端应用的商业模式产生深远影响。

(文章来源:财联社)