AI导读:

阿里云通义千问超大规模MoE模型Qwen2.5-Max正式上线,在多项主流权威基准测试中表现出色,展现了中国AI技术在高性能、低成本路线上的强劲竞争力。同时,阿里云作为总台春晚云计算AI独家合作伙伴,为春晚直播提供了强大的技术支持。

据通义千问Qwen微信公众号最新消息,2025年1月29日凌晨,阿里云通义千问宣布其超大规模的MoE模型Qwen2.5-Max正式上线,标志着中国AI技术领域的又一重大进展。

据悉,Qwen2.5-Max在多项主流权威基准测试中表现出色,包括知识测试(MMLU-Pro,针对大学水平知识)、编程能力(LiveCodeBench)、全面能力评估(LiveBench)以及人类偏好对齐(Arena-Hard)等。该模型展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet相当,甚至在部分测试中领先的性能,彰显了中国AI技术在高性能、低成本路线上的强劲竞争力。

尤为引人注目的是,Qwen2.5-Max的发布不仅巩固了阿里云在AI领域的领先地位,更是继DeepSeek之后,中国AI阵营在技术创新上的又一里程碑。这一成就标志着中国在高性能AI模型研发方面取得了显著突破。

通义团队对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本进行了全面评估。指令模型版本作为用户可直接对话体验的版本,在多项基准测试中表现出色,几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B等竞争对手。而在基座模型对比中,Qwen2.5-Max同样展现出了显著优势,与目前领先的开源MoE模型DeepSeek V3、最大的开源稠密模型Llama-3.1-405B等进行了对比,结果均显示出Qwen2.5-Max的卓越性能。

市场分析师指出,此前业界过度聚焦于DeepSeek,而忽视了中国AI技术的整体性追赶,特别是阿里通义等企业的快速发展。行业权威媒体《信息平权》也表示,若阿里Qwen-2.5-max此次性能确实超过V3,则对其RL推理模型的发展前景充满期待。

值得一提的是,农历除夕夜,阿里巴巴股价在收盘前出现异常波动,从涨幅1%快速拉升至6.71%,收盘报96.03美元,总市值达到2284亿美元。这一涨幅或与市场对阿里云及通义千问AI技术的积极预期有关。

此外,阿里云作为总台春晚云计算AI独家合作伙伴,首次亮相中央广播电视总台蛇年春晚,为春晚直播提供了强大的全球云基础设施和通义大模型AI技术支持。这不仅展示了阿里云在云计算和AI技术方面的领先地位,也为中国传统节日带来了全新的科技体验。

在春晚主舞台上,阿里云通义大模型AI技术被广泛应用于节目呈现中。例如,通过先进的AI技术呈现科幻电影中的“子弹时间”经典画面,为观众带来前所未有的观看体验。同时,阿里云通义AIGC技术成果也首次大规模应用在节目画面中,将舞台画面瞬间转化为静态油画等艺术作品,为观众带来虚实交融的视觉盛宴。这些创新应用不仅提升了春晚节目的观赏性和互动性,也展示了阿里云在AI技术领域的深厚积累和创新能力。

(文章来源:读创,经编辑整理)