AI导读:

3月21日,腾讯混元宣布推出自研深度思考模型混元T1正式版,在多项benchmark上取得优异成绩。此前,腾讯混元大模型已登上Chatbot Arena榜单全球Top 15。腾讯发布的新一代大模型混元Turbo实现推理效率大幅提升,成本降低50%。


3月21日深夜,腾讯混元宣布,正式推出自研深度思考模型混元T1正式版,标志着腾讯在AI技术领域的又一重要突破。

在体现推理模型基础能力的常见benchmark上,如大语言模型评估增强数据集MMLU-PRO中,混元T1取得87.2分,仅次于行业顶尖水平。在CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,混元T1的成绩也达到了业界领先推理模型的水平,彰显出腾讯在AI技术上的深厚积累。

此前,腾讯宣布,混元大模型首次登上Chatbot Arena榜单,跻身全球Top 15。用户在该平台上以匿名方式与多个模型互动,投票决定何种模型更佳,从而根据分数生成排行榜。这一测评被视为大模型直接比拼的竞技场,腾讯混元的表现令人瞩目。

去年9月5日,腾讯发布了新一代大模型混元Turbo,采用MoE架构,实现了推理效率的大幅提升,比上一代产品提升100%,推理成本降低50%,展现了腾讯在技术创新上的强劲实力。

本月1日发布的腾讯元宝电脑版App中,内置了混元和Deepseek两种模型,支持双模切换,为用户提供更多样化的选择。

(文章来源:e公司,关键词:腾讯,AI技术,混元T1,推理模型)