DeepSeek鲶鱼效应显现，OpenAI紧急上线o3-mini应对竞争

财经聚焦 2025-02-01 16:00:43 来源：证券时报作者：网络

AI导读：

DeepSeek的崛起引发了全球AI大模型行业的激烈竞争。OpenAI紧急上线全新推理模型o3-mini，以应对来自DeepSeek的压力。文章介绍了o3-mini的特点、性能以及与DeepSeek的对比，同时分析了AI大模型行业的竞争态势。

DeepSeek这条“鲶鱼”在全球大模型竞赛中掀起了新的波澜，进一步加速了行业的竞争步伐。

北京时间2025年2月1日凌晨，科技巨头OpenAI震撼发布其全新的推理模型o3-mini。据悉，o3-mini作为OpenAI推理模型系列中的最新力作，不仅性能卓越，更具备极高的成本效益。该模型包含low、medium和high三个版本，并已成功上线ChatGPT和API平台。尤为引人注目的是，ChatGPT的免费用户现可通过选择“推理（Reason）”功能或重新生成响应来体验o3-mini模型，这标志着OpenAI首次向免费用户开放推理模型的使用权限。

此前，DeepSeek凭借其性能出色的V3和R1模型，以及开源且免费的特性，赢得了业界的广泛关注。其低廉的模型训练成本更是为AI领域带来了一股清流，通过开源的方式重构了全球AI竞争格局，使得低成本创新成为颠覆行业的关键路径。在DeepSeek的推动下，过去一周多时间里，国内外大模型厂商纷纷紧急上线新模型、降价乃至免费提供服务，AI大模型行业的竞争态势愈发激烈。

OpenAI火速推出新模型，力挽狂澜

o3-mini作为OpenAI的最新成果，不仅在复杂推理和对话能力上实现了显著提升，还在科学、数学、编程等多个领域超越了其前辈o1模型。同时，o3-mini保持了OpenAI一贯的低成本及低延迟特点，为用户提供了更加高效、便捷的服务体验。在GPQA Diamond（理化生）、AIME2022-2024（数学）、Codeforces ELO（编程）等基准测试中，o3-mini取得了令人瞩目的成绩，比肩甚至超越了o1推理模型。在medium推理能力下，o3-mini在额外的数学和事实性评估中更是表现出色。此外，o3-mini的平均响应速度达到了7.7秒，较o1-mini的10.16秒平均响应速度提升了24%。

值得注意的是，DeepSeek的网页及移动应用端均已实现了模型与网络的连接，支持联网搜索功能。而o1模型则尚未具备这一功能。此外，DeepSeek的R1推理模型还能够向用户展示具体的思考过程，这一特性受到了众多用户的青睐。在与DeepSeek互动的过程中，用户们纷纷表示，欣赏其思考过程甚至比最终得到的答案更具有启发性。或许是受到了DeepSeek的启发，o3-mini也具备了与联网搜索功能搭配使用的能力，并能够展示完整的思考过程。OpenAI首席执行官山姆·奥特曼在社交平台上介绍o3-mini时，不仅称赞其“聪明、反应快速”，还特意强调了其“能够搜索网页，还可以展示搜索过程”的特点。

在使用权限方面，ChatGPT首次向所有用户免费提供推理模型o3-mini。用户只需在消息编辑器中选择“推理（Reason）”或重新生成响应，即可试用该模型。对于ChatGPT Pro用户而言，他们将享有无限访问的特权；而Plus和Team用户的速率限制也从原来o1-mini的每天50条消息增加至o3-mini的每天150条消息。在定价方面，o3-mini每百万token的输入（缓存未命中）/输出价格为1.10美元/4.40美元，较完整版o1便宜了93%。然而，尽管o3-mini的性价比已经相当出色，但相较于DeepSeek的R1模型而言，仍略显逊色。DeepSeek的API提供的R1模型每百万token的输入（缓存未命中）/输出价格仅为0.55美元/2.19美元。

美国知名播客主持人Lex Fridman在个人社交平台上表示，虽然OpenAI的o3-mini表现出色，但DeepSeek的R1模型以更低的成本实现了同等的性能，并开创了开放模型透明度的先河。这一评价无疑进一步凸显了DeepSeek在AI领域的领先地位。

DeepSeek引领大模型“内卷”风潮

早在DeepSeek爆火之初，奥特曼就曾指出其R1模型令人印象深刻，尤其是考虑到成本方面。他同时表示，OpenAI将很快发布新的模型以应对竞争压力。业内人士分析认为，o3-mini模型的紧急上线正是OpenAI感受到来自竞争对手压力的直接体现。他们需要加快发布性能更强的模型来证明自身的领先优势。

值得注意的是，在o3-mini推出后，OpenAI首席执行官山姆·奥特曼与一众高管在reddit上回答了网友的问题。奥特曼坦诚地承认了中国竞争对手DeepSeek的崛起对OpenAI技术领先优势的削弱。他表示：“DeepSeek是个非常优秀的模型。我们将继续推出更优质的模型，但将无法维持往年的领先优势。”对于“更优质的模型”，奥特曼透露下一代推理模型o3将在“数周至月内”发布。然而，被业界期待已久的旗舰模型GPT-5则尚无明确的发布时间表。

此外，奥特曼还罕见地对开源与闭源的问题进行了回应。他指出OpenAI过去在开源方面站在了“历史错误的一边”，并表示未来将重新制定开源战略。OpenAI首席产品官Kevin Well也表示公司正考虑将非前沿的旧模型如GPT-2、GPT-3等开源。

在OpenAI发布新模型的同时，国产大模型的降价浪潮仍在持续。1月30日，阿里云发布了百炼qwen-max系列模型的调整通知，对qwen-max、qwen-max-2025-01-25、qwen-max-latest三款模型的输入输出价格进行了调整，并同步降低了qwen-max batch和cache的价格。而在1月29日凌晨，阿里云才刚刚正式发布升级了通义千问旗舰版模型Qwen2.5-Max。该模型是阿里云通义团队对MoE模型的最新探索成果，预训练数据超过20万亿tokens，展现出极强劲的综合性能，在多项公开主流模型评测基准上均取得了高分，全面超越了包括DeepSeek-V3在内的全球领先开源MoE模型以及最大的开源稠密模型。

天风国际分析师郭明錤认为，目前从生成式AI趋势中获利的主要方式仍然是“卖铲子”和降低成本，而非创造新业务或提升既有业务的附加值。DeepSeek-R1的定价策略将带动生成式AI的整体使用成本下降，这有助于增加AI算力需求，并降低投资人对AI投资能否获利的疑虑。然而，使用量的提升程度能否抵消价格降低带来的影响仍有待观察。同时，郭明錤指出，只有大量部署者才会遇到Scaling law边际效益的放缓问题。因此当边际效益再度加速时，英伟达将依然是赢家。

（文章来源：证券时报，经重新编辑整理以符合SEO优化要求）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。