AI导读:

OpenAI在12月5日至20日连续12天进行直播,发布了满血版o1模型、Sora Turbo、ChatGPT Pro等一系列新品,标志着AGI的实现又迈出了重要一步。同时,AI竞赛愈发激烈,OpenAI面临诸多挑战。

  当地时间12月5日至20日,人工智能巨头OpenAI连续12天进行了12场直播活动,从首日的满血版o1模型及ChatGPT Pro的发布,到备受期待的Sora Turbo正式亮相,最终以新一代推理模型o3圆满收官。OpenAI CEO山姆·奥特曼(Sam Altman)在四场直播中亲自站台,标志着AGI(Artificial General Intelligence,通用人工智能)的实现又迈出了重要一步。

  CNBC评价指出,OpenAI通过这12天的直播活动,成功聚焦技术并为其产品造势,这是其积极发展计划的一部分,旨在争夺生成式人工智能市场的更大份额。活动因强有力的年终宣传而受到称赞,但也有人批评其炒作成分过多。同时,《纽约》杂志认为,OpenAI在展示新产品和功能的同时,也表现出一定的防御性,面临着内部领导层变动、与微软的资源紧张关系,以及对AGI进展的争论。

  回顾这12天,OpenAI的发布亮点频现:

  首日,满血版o1模型发布,其推理逻辑能力显著提升,能解决国际数学奥林匹克资格考试中83%的问题,响应时间也得到改善,并解锁了多模态图像识别功能。同时推出的ChatGPT Pro订阅计划,提供了无次数限制使用o1等模型的权限。

  第二日,OpenAI推出了强化学习微调(RFT)技术,使用户能利用少量训练数据在特定领域快速构建专家级模型。强化微调后的o1-mini在多个性能指标上均优于o1。

  第三日,Sora Turbo正式发布,可生成1080p、最长20秒的视频,并支持多种常见比例和Remix、Re-cut等视频编辑功能。然而,用户反馈显示,Sora对物理规律的理解尚不够完美。

  第四日,Canvas功能升级,为用户提供了与ChatGPT协作编写和编码的全新工作方式,提升了用户与AI在写作和编码方面的协作体验。

  第五日,ChatGPT正式集成到苹果系统中,用户可通过Siri访问ChatGPT功能,并支持语音控制设备。这一发布正值圣诞节假日购物旺季,可能对苹果产品的销售产生影响。

  第六日,GPT-4o的多模态能力得到进一步加强,推出实时视频理解功能和限时圣诞老人语音模式。

  第七日,Projects功能发布,支持用户将文件、聊天记录等信息集中到一个“Project”中,与竞争对手Anthropic的Claude新功能相似。

  第八日,ChatGPT Search正式向所有用户开放,优化了搜索速度和准确性,并新增语音搜索功能与地图集成。

  第九日,o1 API正式版发布,为开发人员提供了功能更强大的模型、新的定制工具以及提高性能、灵活性和成本效益的升级。

  第十日,推出ChatGPT热线服务,用户可通过拨打免费号码享受15分钟的免费ChatGPT使用时间。

  第十一日,ChatGPT桌面版新增跨应用访问功能,可读取其他应用程序中的数据,实现实时协作。

  第十二日,发布最新推理模型o3和o3-mini,推理能力大幅提升,支持多模式推理。然而,尽管o3给人留下了深刻印象,但距离真正的AGI仍有相当长的路要走。

  此外,在OpenAI发布o3后,华尔街日报指出OpenAI在其代号为“猎户座”的新项目中遇到了诸多问题,项目进度落后且耗资巨大。同时,AI竞赛愈发激烈,谷歌、Pika等竞争对手也发布了各自的新产品进行“狙击”。OpenAI面临的最大挑战之一来自于曾经的联合创始人埃隆·马斯克(Elon Musk),他目前拥有的人工智能初创公司xAI准备在特朗普政府中发挥重要影响。

  在OpenAI连续密集发布的新品中,ChatGPT Pro的推出进一步证明了大模型的“烧钱”速度,多模态、定制化、隐私等“安全易用”相关内容被多次强调,也体现出OpenAI急需通过更强的模型产品来证明自己。

(文章来源:澎湃新闻)