AI导读:

春节将至,AI智能体成为传递新春祝福的新方式。智谱科技推出GLM-PC电脑智能体,OpenAI发布Operator智能体,两者均具备独立思考和调用工具的能力。随着AI技术的不断进步,2025年或将成为智能体元年。

随着春节的临近,年味愈发浓厚,AI技术为传统拜年习俗带来了新创意。AI智能体(AI Agent)正成为春节期间传递新春祝福的新方式,只需一句话,即可实现个性化祝福的发送。

据自媒体实测,向AI智能体下达“为微信群内所有人发送新春祝福语”的任务后,该智能体迅速为微信群内的每位成员定制了专属贺词,并细心地附上了对方的名字,整个过程无需手动操作,即可一键发送。

这一创新功能由智谱科技最新上线的电脑智能体GLM-PC实现。GLM-PC基于智谱多模态大模型CogAgent打造,是全球首个面向公众、回车即用的电脑智能体。它不仅能够像人类一样“观察”和“操作”计算机,还能协助用户高效完成各类电脑任务。此外,GLM-PC还推出了深度思考模式,并新增了逻辑推理和代码生成功能。

与手机版智能体AutoGLM相比,GLM-PC引入了代码机制。在深度思考模式下,GLM-PC接收任务后会生成一套详细的思维链,再执行任务。这种代码式的思维链可进一步强化GLM-PC对复杂任务的规划、推理和反思能力。

目前,GLM-PC的Window和Mac客户端已同步上线。智谱科技表示,正在与联想、华硕等知名PC厂商展开深度合作,共同推动AIPC的创新与发展。

与此同时,OpenAI的AI智能体Operator也在北京时间1月24日凌晨亮相。Operator能够代理用户执行基于网页的操作,直接与网页交互,像人类一样点击、滚动和输入文字,自动执行各种复杂操作,包括编写代码、预订餐厅、购物等。后续的用户测试显示,Operator还能完成在Arxiv上进行论文分类搜索、阅读多篇论文并完成综述整理等复杂工作。

Operator通过新模型“计算机使用智能体”(Computer-Using Agent,简称CUA)的系统进行复杂的思维链反思和步骤规划,大大提高了完成任务的精度和复杂性。目前,OpenAI的“Operator”智能体以“研究预览”的形式向美国的ChatGPT Pro用户开放。

OpenAI表示,还将扩展智能体的动作空间,在接下来几周或几个月内推出更多的智能体,并计划开放API接口,让开发者能够基于CUA构建自定义的计算机智能体。

随着GLM-PC和Operator等AI智能体的相继推出,2025年或将成为智能体元年。OpenAI总裁Greg Brockman强调,“2025年是智能体之年”。智谱科技同样将AGI的实现划分为五级,并表示智能体将极大地提升L3级使用工具的能力,同时开启对L4级自我学习能力的探索。

AI智能体的最大独特之处在于具备独立思考和调用工具的能力。对于普通用户而言,其最核心的功能是AI自主操作硬件设备,辅助完成复杂推理任务。无论是手机上的智能体还是电脑端的智能体,都被训练用于与图形用户界面GUI进行交互,意味着AI能适应几乎所有的计算机和手机环境。

此外,谷歌、微软、Anthropic等头部厂商也在争相推出AI智能体产品。微软在Dynamics365平台推出了10个自主AI智能体,谷歌发布了号称“智能体时代”最强大模型Gemini 2,Anthropic为大模型Claude迭代了新功能——Computer Use。华为也公布了一项可让AI像人类一样操作手机的新研究成果。

随着AI技术的不断进步,AI Agent已经实现了从0到1的跨越式创新。众多企业和研究机构投入研发,推出创新产品,行业结构初步形成,相关产业链和生态系统逐渐完善。根据Root analysis预测,全球AI代理市场规模将从2024年的52.9亿美元增长到2035年的2168亿美元,复合年增长率为40.15%。

展望未来,AI Agent和推理需求的指数级增长有望引领规模化AI应用元年。以字节跳动为代表的企业通过广泛应用豆包AI等核心产品,率先全面布局AI市场,为国内AI Agent技术实践提供了落地基础。智能化应用场景的加速拓展将助力企业级市场实现降本增效,引领ToBSaaS行业迎来新一轮成长机遇。

中国银河证券表示,AI Agent将是通往通用人工智能时代的必经之路。大模型的快速迭代升级将推动AI Agent能力提升,长期来看,AI Agent的关键在于推理能力。未来,随着AI Agent的广泛渗透,对推理算力的需求将呈现指数级增长。