AI导读:

OpenAI正式推出全新推理模型o3-mini,并首次向免费用户开放。该模型在ChatGPT和API中上线,展现出强大的推理能力。同时,OpenAI考虑展示模型思维过程,以应对DeepSeek等竞争对手的挑战。

在人工智能领域,竞争的火药味愈发浓烈。当DeepSeek以其卓越实力震撼业界之时,OpenAI于当地时间1月31日强势回应,正式推出了全新的推理模型o3-mini,并史无前例地向免费用户开放该推理模型的使用权限。作为OpenAI推理系列中的最新成员,o3-mini凭借其出色的成本效益比,已在ChatGPT和API平台上线,为用户带来更加智能的体验。

图片来源:OpenAI

在o3-mini的盛大发布之际,OpenAI的首席执行官Sam Altman携公司高管团队亮相reddit,亲自回答网友提问。期间,Altman罕见地承认了OpenAI在开源方面的历史局限性,并坦言:“我们需要探索一种全新的开源策略。”这一表态无疑为OpenAI未来的发展注入了新的期待。

谈及DeepSeek时,Altman给予了高度评价,称其为“一个卓越的模型”。同时,他也坦诚地表示:“虽然我们将继续打造更优秀的模型,但与以往相比,我们的领先优势将有所缩小。”然而,Altman进一步透露,受DeepSeek启发,OpenAI或将更多地揭示其推理模型(如O3-Mini)的“思考过程”,以展现其内在的智慧。

Altman强调,目前OpenAI的模型隐藏了推理过程,以防止竞争对手获取训练数据。而DeepSeek的R1模型则向用户开放思维链输出,这一做法或将成为未来趋势。为此,OpenAI正在积极寻求平衡之道,以更好地满足用户需求。

OpenAI首席产品官Kevin Weil也对此进行了补充:“我们正在努力展示更多内容,这一目标将很快实现。虽然展示所有思维链(CoT)可能会导致竞争性蒸馏,但我们也深知用户(尤其是高级用户)对此的渴望。因此,我们将找到合适的方法来平衡这一矛盾。”

在1月31日的新闻稿中,OpenAI披露了o3-mini在2024年美国数学邀请赛(AIME 2024)中的测试表现。在低推理努力下,o3-mini的准确率与o1-mini相当,但速率更快;而在中等努力下,其准确率能提升至79.6%,与o1模型持平。在最高努力水平时,o3-mini的准确率更是高达87.3%,展现出强大的推理能力。

与此同时,DeepSeek-R1模型在AIME 2024测试中的准确率为79.8%,在GPQA Diamond测试中的准确率为71.5%。这一横向对比结果,进一步凸显了OpenAI与DeepSeek在人工智能领域的激烈竞争。

有专家在社交媒体上指出:“受DeepSeek影响,OpenAI也开始展示推理模型的思维过程。”这一观察无疑揭示了人工智能领域的新趋势。

此外,对于付费用户而言,o3-mini将在模型选择器中替代o1-mini。作为升级的一部分,ChatGPT Plus和Team用户的速率限制从o1-mini的每天50条提升至o3-mini的150条,而每月支付200美元的ChatGPT Pro用户则能无限制地访问o3-mini。这一升级无疑将为用户带来更加流畅、高效的使用体验。

本文综合公开资料整理,旨在为读者提供关于OpenAI最新动态的全面了解。

(文章来源:每日经济新闻)