AI导读:

春节期间,中国大模型技术领域迎来密集更新,阿里云通义千问推出超大规模MoE模型Qwen2.5-Max,DeepSeek推出多模态框架,百度智能云曦灵数字人推出微信小程序功能,AI应用成为厂商比拼焦点。

  春节期间,中国大模型技术领域迎来了一波密集更新,各大厂商纷纷放大招,展现出强大的创新实力。

  今日凌晨,阿里云通义千问的超大规模MoE模型Qwen2.5-Max正式上线。该模型是阿里云通义团队在MoE领域的最新成果,预训练数据量高达20万亿tokens,展现了强大的数据处理能力。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等多项基准测试中,Qwen2.5-Max的整体表现均优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o,彰显出其在自然语言处理领域的领先地位。

  随着新模型的发布,阿里巴巴美股股价大涨6.76%。而在前一日,通义千问还开源了全新的视觉模型Qwen2.5-VL,并推出了3B、7B和72B三个尺寸版本。Qwen2.5-VL在图像内容解析方面表现出色,支持长达1小时的视频理解,能够实现给指定朋友送祝福、电脑修图、手机订票等多种功能,进一步丰富了通义千问的应用场景。

  与此同时,1月28日,刚刚暴击美股的DeepSeek团队也推出了两款多模态框架——Janus-Pro和JanusFlow。其中,Janus-Pro是一款统一多模态理解与生成的创新框架,是Janus的升级版本。在图像生成基准测试中,Janus-Pro的表现超越了OpenAI的“文生图”模型DALL·E 3,再次证明了开源模型在技术创新方面的优势。DeepSeek团队与之前的Janus系列一样,选择了开源路线,为行业发展注入了新的活力。

  当前,国内外厂商在开闭源路线上各有侧重。OpenAI的GPT-4模型采用闭源模式,而Meta则选择完全开源。其他大模型公司则采取折中策略,将模型“低配版”开源,而更高参数量的模型则保持闭源。然而,DeepSeek和阿里云通义团队始终坚持开源路线,此次DeepSeek的成功也被视为开源模型的胜利。

  图灵奖得主、Meta首席人工智能科学家Yann LeCun此前表示,对于DeepSeek的成功,正确的理解应该是开源模型正在超越专有模型。LeCun认为,DeepSeek之所以这次一鸣惊人,是因为他们从开放研究和开源中获益。DeepSeek提出了新想法,并在他人工作的基础上构建。这种开放和共享的精神,正是开放研究和开源的力量所在。

  一位大模型青年学者在接受《科创板日报》记者采访时表示,开源和闭源路线各有特色,但开源无疑更能促进行业发展。开源模型可以降低技术门槛,促进技术创新和应用落地,为行业发展注入更多活力。

  云基础设施厂商也有望受益于这次开源的胜利。阿里云通义大模型坚持开源路线的原因之一,就是希望借助开源模型在中文世界的广泛影响力,推动阿里云服务的普及和应用。当开发者使用阿里云的开源模型时,他们往往会选择将应用部署到阿里云上,从而带动阿里云业务的增长。

  除了基础模型的更新外,春节期间,各种AI应用也成为了厂商比拼的焦点。百度智能云曦灵数字人推出了“飞帖贺新春”微信小程序功能,用户只需上传一张照片,即可快速生成数字人拜年视频,为春节增添了一份别样的乐趣。

  阿里云则担任了央视春晚云计算AI独家合作伙伴,为春晚直播提供了强大的云基础设施和通义大模型AI技术支持。在春晚舞台上,《在岁月里的花》、《方的言》、《难忘今宵》等歌曲的舞美画面均利用了通义万相的AI生成能力,为观众带来了更加震撼的视觉体验。同时,阿里云通义万相还将舞台画面瞬间转化为静态油画,展现了AI技术在艺术创作方面的无限可能。

阿里云通义万相将舞台画面瞬间转化静态油画

  此外,宇树科技的人形机器人H1也登上了春晚舞台,扭起了秧歌。作为全球首款能完成原地空翻的全尺寸电驱人形机器人,H1的核心黑科技是AI驱动全身运动控制技术。其最大关节扭矩能达到360N·m,还配备了360°全景深度感知技术,成为了春晚舞台上最吸睛的明星之一。

宇树机器人彩排照片

宇树科技团队在春晚合影

  值得一提的是,今年也是央视第四次开展8K春晚直播。在“8K超高清+三维菁彩声”公共信号的制作中,全部采用了国产装备。科创板上市公司当虹科技为其提供了技术支持,通过“百城千屏”超高清传播平台,将8K画面呈现在全国上百个城市、近千块公共大屏上。三维菁彩声是我国具有自主知识产权的音频标准,已获得国际电信联盟(ITU)技术报告认可,成为与杜比AC-4等并列的音频标准,为观众带来了更加震撼的视听体验。

(文章来源:财联社)