AI导读:

字节跳动在火山引擎 Force 大会上发布豆包视觉理解模型,以超低价格推动AI技术普及。同日,OpenAI也宣布降价。云计算巨头纷纷响应,大模型应用加速渗透各行各业。

  大模型价格战再度掀起波澜。

  在12月18日举行的火山引擎 Force 大会上,字节跳动隆重推出了豆包视觉理解模型,旨在为企业提供高性价比的多模态大模型能力。据发布会公布的数据,豆包视觉理解模型的千tokens输入价格仅为3厘,这意味着一元钱可以处理惊人的284张720P图片,相较于行业价格,其降幅高达85%,极大地推动了AI技术的普及与应用发展。

  研究表明,人类所接收的信息中,超过80%来自视觉。视觉理解技术不仅极大地扩展了大模型的能力边界,还有效降低了人们与大模型交互的门槛,为大模型解锁了更为广泛的应用场景。

  火山引擎总裁谭待在会上介绍,豆包视觉理解模型不仅具备精准的视觉内容识别能力,还能基于图像信息进行复杂的逻辑计算,完成诸如分析图表、处理代码以及解答学科问题等任务。

  会上,豆包3D生成模型也惊艳亮相。此外,豆包大模型的多款产品也迎来了重要更新:豆包通用模型pro已全面对齐GPT-4o,而其使用价格仅为后者的1/8;音乐模型则从原先只能生成60秒的简单结构,升级至能够生成3分钟的完整音乐作品。大会还透露,2025年春季将推出功能更为强大的豆包视频生成模型1.5版,具备更长的视频生成能力。

  值得一提的是,在同一天,OpenAI也加入了“降价大军”。其正式版o1模型的API与预览版本相比,思考成本下降了60%;GPT-4o的音频成本也降低了60%;而降价幅度最大的GPT-4o mini的音频价格更是比当前价格便宜了整整10倍。

  回顾今年5月,字节跳动首次推出了豆包大模型,并在企业市场中以每千Tokens 0.0008元的超低价格亮相,这一价格使得处理1500多个汉字仅需0.8厘,相较于行业平均水平便宜了99.3%,大模型的价格体系实现了从分至厘的跨越性调整。

  随后,云计算领域的其他巨头也积极响应。阿里云宣布其9款商业化及开源系列模型降价,百度智能云则宣布文心大模型的两款主力产品ENIRE Speed与ENIRE Lite全面免费。在2024年的云栖大会上,阿里云再次宣布三款通义千问主力模型降价,最高降价幅度达到了90%,进一步推动了AI技术的普及与应用。

  数据显示,截至12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,与七个月前首次发布时相比,增长了33倍。这一数据充分表明,大模型应用正在向各行各业加速渗透,为经济发展注入了新的活力。

(文章来源:羊城晚报)