AI导读:

小米正在搭建GPU万卡集群,加大对AI大模型的投入。小米大模型团队已成立并配备6500张GPU资源,持续扩展计算能力。雷军等领导层对此高度重视,计划轻量化、本地部署技术,并考虑与第三方合作。

12月26日,界面新闻独家报道,小米正积极搭建GPU万卡集群,旨在加大对AI大模型的投入力度。据悉,小米大模型团队自成立之初即已配备了6500张GPU资源,并持续扩展其计算能力。

界面新闻就此事向小米求证,但截至发稿时,小米方面尚未发表评论。然而,一名知情人士透露,该计划已秘密进行数月,且雷军在其中起到了关键的领导作用。他强调,在AI硬件领域,手机是核心,小米对此的投入可谓全力以赴。

小米对AI大模型的重视并非空穴来风。早在12月20日,第一财经就报道了DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉将加入小米的消息,或将领导小米AI实验室的大模型团队。DeepSeekV2在模型架构上的创新,特别是MLA(Multi-head Latent Attention)的采用,对降低大模型使用成本起到了关键作用,而罗福莉正是这一创新的核心人物之一。

2023年4月,小米AI实验室正式组建了大模型团队,并任命栾剑为负责人。栾剑此前在AI实验室语音生成团队担任负责人,拥有丰富的语音技术背景,曾在东芝(中国)研究院、微软(中国)工程院等知名企业担任高级职位。

雷军在公开场合多次表达了对大模型和AIGC的看法,强调小米在AI领域的深耕细作,包括AI实验室、小爱同学、自动驾驶等团队的建立。他表示,小米将全力以赴拥抱大模型,并正在研发有趣的技术和产品,待成熟后将向公众展示。

在小米2023周年演讲上,雷军进一步透露了大模型业务的进展。他表示,团队成立后,小米大模型技术的主要突破方向为轻量化、本地部署。目前,小米已初步在手机端实现了13亿参数级别的大模型运行,效果接近云端60亿参数级别的大模型,并计划将这一技术同步应用于小爱同学的升级中。

小米在自研大模型的同时,也保持开放态度,不排斥与第三方大模型合作。王斌在接受媒体采访时表示,小米所训练的模型都是从零开始,但团队也欢迎与第三方大模型合作,共同推动大模型技术的发展。值得注意的是,小爱同学首次升级时即采用了第三方和自研的混合方案。

自2016年组建AI团队以来,小米人工智能团队经过多次扩展,人员规模已达3000多人。其AI技术能力已覆盖多个领域,并逐步接入手机、汽车、AIoT、机器人等业务板块,为小米的未来发展注入了强劲动力。

(文章来源:界面新闻)