AI导读:

OpenAI举行活动,推出推理大模型o1的满血版本和进阶模式,以及每月200美元的ChatGPT Pro订阅服务,提供无限制访问最佳模型和工具的权利,并计划增加新功能。

  北京时间12月6日凌晨,OpenAI拉开了“12天12场直播”活动的序幕,推出了备受期待的推理大模型o1的满血版本与进阶模式,并隆重介绍了每月费用高达200美元(约人民币1450元)的ChatGPT Pro订阅服务

  OpenAI强调,该订阅套餐赋予用户全面访问其顶级模型和工具的权利,包括无限制地使用其最尖端的模型OpenAI o1及同系列小型模型o1-mini、GPT-4o,以及类人化的ChatGPT高级语音模式Advanced Voice

  此外,ChatGPT Pro套餐中独家包含了o1 pro mode——这一新版本o1,凭借更强大的计算能力,能够更深入地进行思考,并针对复杂问题提供更精准的答案。OpenAI计划在未来为ChatGPT Pro增添更多高效计算密集型生产力功能。

  OpenAI指出,相较于预览版,o1模型现在“思维更加精炼”(提速约50%),且在回答现实难题时,重大错误率降低了34%。在演示中,当被要求“列出2世纪罗马皇帝的名字、任期和主要成就”时,o1模型仅用14秒即完成“思考”,而预览版则需34秒。相比之下,功能较弱的GPT-4o在回答此问题时会出现错误。

  o1模型的另一重大更新在于其支持图片输入功能,用户可以在向模型提问“太空数据中心散热问题”时,附上手绘示意图。OpenAI透露,未来几个月内将增加网页浏览、文件上传等新功能

  在数学、科学及编码等挑战性机器学习(ML)基准测试中,o1 pro mode的表现均优于o1和o1-preview。具体而言,在数学领域,o1 pro mode得分86,而o1和o1-preview分别为78和50;在编码方面,o1 pro mode得分90,高于o1的89和o1-preview的62;在回答博士级科学问题时,o1 pro mode得分79,高于o1的76和o1-preview的74。

  为了凸显o1 pro mode的高可靠性,OpenAI提高了评估标准,要求模型在四次尝试中均正确回答问题才算成功。即使在这一严格要求下,o1 pro mode的表现仍显著优于o1和o1-preview。

  下图展示了在四次回答均须正确的标准下,o1 pro mode的优势更加明显。在数学领域,o1 pro mode得分80,而o1和o1-preview分别为67和37;在编码方面,o1 pro mode得分75,高于o1的64和o1-preview的26;在回答博士级科学问题时,o1 pro mode得分74,高于o1的67和o1-preview的58。

  值得注意的是,ChatGPT Pro是OpenAI推出的最高级别订阅服务,费用是ChatGPT Plus的10倍

  用户支付每月200美元后,将能够无限制地使用o1模型(Plus用户目前每周限用50条信息),以及无限制地使用o1 mini和高级语音模式,同时享受o1 pro模式

  OpenAI官方定义,o1 pro将利用更多计算资源进行深入思考,为“最棘手的问题提供最佳答案”。未来,该订阅服务还将加入更多强大且计算密集的功能。

  在演示中,OpenAI展示了如何通过设定一系列严格条件,让o1 pro筛选出符合条件的蛋白质

  OpenAI的公告还提到,向10名医学研究人员赠送了免费的ChatGPT Pro,研究领域涵盖孤儿病、癌症、痴呆等,这或许预示了该订阅服务的主要用户群体。

  发布会尾声,OpenAI首席执行官奥尔特曼预告,次日演示将带来“对开发者极具吸引力的内容”。

(文章来源:每日经济新闻)