AI导读:

阿里云宣布通义千问视觉理解模型全线降价超80%,Qwen-VL-Plus和Qwen-VL-Max降幅显著,同时推出全新KV Cache计费模式降低用户成本。

大模型价格战在业界再度掀起波澜。

近日,字节跳动旗下的豆包视觉理解模型率先于12月18日将价格大幅下调至0.003元/千Tokens。随后,阿里云于12月31日宣布,其通义千问视觉理解模型全面降价,降幅超过80%,且立即生效!这一举措标志着阿里云在2024年内第三次对大模型价格进行调整。

在此次降价中,阿里云的Qwen-VL-Plus模型降价幅度达到81%,输入价格低至0.0015元/千tokens,创下了全网最低价格记录;而性能更为出色的Qwen-VL-Max模型也降至0.003元/千tokens,降幅高达85%。

根据阿里云降价后的最新价格计算,用户现在仅需1元钱即可处理约600张720P图片或1700张480P图片,相较于豆包大模型降价后的处理能力有了显著提升。

Qwen-VL作为开源社区中备受欢迎的多模态大模型,凭借其强大的视觉推理能力,能够识别各种分辨率和长宽比的图片,理解长达20分钟以上的长视频,并具备自主操作手机和机器人的视觉智能体能力。这些特性使得Qwen-VL可广泛应用于手机、汽车等终端的视觉识别场景。

阿里云百炼相关负责人透露,此次降价主要得益于阿里云在基础设施和模型结构方面的持续优化,以及大模型调用量指数型增长所带来的规模效应。阿里云希望将这些技术红利及时传递给所有用户。

在推理效率方面,阿里云构建了高度弹性的AI算力调度系统,并结合百炼分布式推理加速引擎,显著降低了模型推理成本,并加快了推理速度。自2024年以来,随着通义千问团队不断优化视觉理解效果,Qwen-VL已成为百炼平台上增长最快的模型之一。

此外,为进一步降低用户使用文本大模型API的成本,阿里云百炼还推出了全新的KV Cache计费模式。该模式通过自动缓存上下文来避免重复计算,从而进一步降低模型调用成本。这一新模式特别适用于长文本、代码补全、多轮对话以及特定文本摘要等场景。