DeepSeek鲶鱼效应显现,OpenAI紧急上线o3-mini应对竞争
AI导读:
DeepSeek的崛起引发了全球AI大模型行业的激烈竞争。OpenAI紧急上线全新推理模型o3-mini,以应对来自DeepSeek的压力。文章介绍了o3-mini的特点、性能以及与DeepSeek的对比,同时分析了AI大模型行业的竞争态势。
DeepSeek这条“鲶鱼”在全球大模型竞赛中掀起了新的波澜,进一步加速了行业的竞争步伐。
北京时间2025年2月1日凌晨,科技巨头OpenAI震撼发布其全新的推理模型o3-mini。据悉,o3-mini作为OpenAI推理模型系列中的最新力作,不仅性能卓越,更具备极高的成本效益。该模型包含low、medium和high三个版本,并已成功上线ChatGPT和API平台。尤为引人注目的是,ChatGPT的免费用户现可通过选择“推理(Reason)”功能或重新生成响应来体验o3-mini模型,这标志着OpenAI首次向免费用户开放推理模型的使用权限。
此前,DeepSeek凭借其性能出色的V3和R1模型,以及开源且免费的特性,赢得了业界的广泛关注。其低廉的模型训练成本更是为AI领域带来了一股清流,通过开源的方式重构了全球AI竞争格局,使得低成本创新成为颠覆行业的关键路径。在DeepSeek的推动下,过去一周多时间里,国内外大模型厂商纷纷紧急上线新模型、降价乃至免费提供服务,AI大模型行业的竞争态势愈发激烈。
OpenAI火速推出新模型,力挽狂澜
o3-mini作为OpenAI的最新成果,不仅在复杂推理和对话能力上实现了显著提升,还在科学、数学、编程等多个领域超越了其前辈o1模型。同时,o3-mini保持了OpenAI一贯的低成本及低延迟特点,为用户提供了更加高效、便捷的服务体验。在GPQA Diamond(理化生)、AIME2022-2024(数学)、Codeforces ELO(编程)等基准测试中,o3-mini取得了令人瞩目的成绩,比肩甚至超越了o1推理模型。在medium推理能力下,o3-mini在额外的数学和事实性评估中更是表现出色。此外,o3-mini的平均响应速度达到了7.7秒,较o1-mini的10.16秒平均响应速度提升了24%。
值得注意的是,DeepSeek的网页及移动应用端均已实现了模型与网络的连接,支持联网搜索功能。而o1模型则尚未具备这一功能。此外,DeepSeek的R1推理模型还能够向用户展示具体的思考过程,这一特性受到了众多用户的青睐。在与DeepSeek互动的过程中,用户们纷纷表示,欣赏其思考过程甚至比最终得到的答案更具有启发性。或许是受到了DeepSeek的启发,o3-mini也具备了与联网搜索功能搭配使用的能力,并能够展示完整的思考过程。OpenAI首席执行官山姆·奥特曼在社交平台上介绍o3-mini时,不仅称赞其“聪明、反应快速”,还特意强调了其“能够搜索网页,还可以展示搜索过程”的特点。
在使用权限方面,ChatGPT首次向所有用户免费提供推理模型o3-mini。用户只需在消息编辑器中选择“推理(Reason)”或重新生成响应,即可试用该模型。对于ChatGPT Pro用户而言,他们将享有无限访问的特权;而Plus和Team用户的速率限制也从原来o1-mini的每天50条消息增加至o3-mini的每天150条消息。在定价方面,o3-mini每百万token的输入(缓存未命中)/输出价格为1.10美元/4.40美元,较完整版o1便宜了93%。然而,尽管o3-mini的性价比已经相当出色,但相较于DeepSeek的R1模型而言,仍略显逊色。DeepSeek的API提供的R1模型每百万token的输入(缓存未命中)/输出价格仅为0.55美元/2.19美元。
美国知名播客主持人Lex Fridman在个人社交平台上表示,虽然OpenAI的o3-mini表现出色,但DeepSeek的R1模型以更低的成本实现了同等的性能,并开创了开放模型透明度的先河。这一评价无疑进一步凸显了DeepSeek在AI领域的领先地位。
DeepSeek引领大模型“内卷”风潮
早在DeepSeek爆火之初,奥特曼就曾指出其R1模型令人印象深刻,尤其是考虑到成本方面。他同时表示,OpenAI将很快发布新的模型以应对竞争压力。业内人士分析认为,o3-mini模型的紧急上线正是OpenAI感受到来自竞争对手压力的直接体现。他们需要加快发布性能更强的模型来证明自身的领先优势。
值得注意的是,在o3-mini推出后,OpenAI首席执行官山姆·奥特曼与一众高管在reddit上回答了网友的问题。奥特曼坦诚地承认了中国竞争对手DeepSeek的崛起对OpenAI技术领先优势的削弱。他表示:“DeepSeek是个非常优秀的模型。我们将继续推出更优质的模型,但将无法维持往年的领先优势。”对于“更优质的模型”,奥特曼透露下一代推理模型o3将在“数周至月内”发布。然而,被业界期待已久的旗舰模型GPT-5则尚无明确的发布时间表。
此外,奥特曼还罕见地对开源与闭源的问题进行了回应。他指出OpenAI过去在开源方面站在了“历史错误的一边”,并表示未来将重新制定开源战略。OpenAI首席产品官Kevin Well也表示公司正考虑将非前沿的旧模型如GPT-2、GPT-3等开源。
在OpenAI发布新模型的同时,国产大模型的降价浪潮仍在持续。1月30日,阿里云发布了百炼qwen-max系列模型的调整通知,对qwen-max、qwen-max-2025-01-25、qwen-max-latest三款模型的输入输出价格进行了调整,并同步降低了qwen-max batch和cache的价格。而在1月29日凌晨,阿里云才刚刚正式发布升级了通义千问旗舰版模型Qwen2.5-Max。该模型是阿里云通义团队对MoE模型的最新探索成果,预训练数据超过20万亿tokens,展现出极强劲的综合性能,在多项公开主流模型评测基准上均取得了高分,全面超越了包括DeepSeek-V3在内的全球领先开源MoE模型以及最大的开源稠密模型。
天风国际分析师郭明錤认为,目前从生成式AI趋势中获利的主要方式仍然是“卖铲子”和降低成本,而非创造新业务或提升既有业务的附加值。DeepSeek-R1的定价策略将带动生成式AI的整体使用成本下降,这有助于增加AI算力需求,并降低投资人对AI投资能否获利的疑虑。然而,使用量的提升程度能否抵消价格降低带来的影响仍有待观察。同时,郭明錤指出,只有大量部署者才会遇到Scaling law边际效益的放缓问题。因此当边际效益再度加速时,英伟达将依然是赢家。
(文章来源:证券时报,经重新编辑整理以符合SEO优化要求)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。