AI导读:

哈尔滨智算中心凭借独特气候优势实现高效节能,AI芯片100%国产化,提供极致算力。万卡集群赋能国内AI产业发展,国产化进程加速,市场前景广阔。

哈尔滨冬日的严寒,室外温度常常骤降至零下二十摄氏度,然而,在中国移动智算中心(哈尔滨)(以下简称“哈尔滨智算中心”)的展厅内,却温暖宜人,春意盎然。

相较于其他地区的数据中心,哈尔滨智算中心凭借其得天独厚的温度优势脱颖而出。数据中心作为公认的“耗能大户”,在哈尔滨,得益于其寒冷的气候,每年有长达157天无需依赖空调进行降温,从而显著降低了智算中心的能耗。中国移动通信集团(以下简称“中国移动”)黑龙江有限公司政企事业部经理郅刚在展厅内向《证券日报》记者介绍道:“我们不仅享受到了自然气候带来的节能效益,还实现了对智算中心热能的精细化二次利用,展厅的温度以及整个园区的供暖均来源于机房免费提供的‘热能’。”

正是凭借这样的气候优势,全球运营商中规模最大的单集群智算中心选择落户哈尔滨。目前,哈尔滨智算中心已实现AI芯片100%国产化,并首次通过国产网络设备探索了1.8万张智算卡单集群部署的规模上限,可提供高达6.93EFLOPS(每秒693亿亿次半精度浮点运算)的智能算力,这一算力水平相当于300多万台高性能计算机的算力总和。

构建“极致算力”基石

据悉,哈尔滨智算中心的前身——哈尔滨数据中心,作为“四云合一”的数据中心,拥有强大的数据处理和存储能力,承载了中国移动用户十亿量级的行程码数据。同时,作为全国5G网络东北大区的核心节点,它还承担着北京和河北地区的通信备份任务,在诸如冬奥会等重大活动期间,哈尔滨能够提供与北京同等级别的通信保障。此外,哈尔滨数据中心还汇聚了包括百度、阿里巴巴、腾讯等在内的120余家知名互联网企业的服务器。

郅刚表示:“我们还具备强大的算力输送能力。”为此,中国移动在哈尔滨建设了全国400G的OTN(光传送网)省际骨干网,实现了地市之间1毫秒、省内5毫秒、全国20毫秒的信息传输速度,为算力“大脑”构建起高速运转的“神经”。

在哈尔滨智算中心内部,一条醒目的红色横幅上写着“大干两个百天奋力书写智算领域自立自强的时代答卷”。在两个“一百天”的奋斗历程中,中国移动完成了哈尔滨数据中心向哈尔滨智算中心的转型升级,对3千多平方米的高功耗机房进行了重大调整改造,完成了千万级精密器件的复杂施工。通过30多个单位、千余人的协同作战,提前4个月建成了全球运营商中规模最大的单集群智算中心。

谈及哈尔滨智算中心,郅刚用“极致算力、极限组网、极效存储、极速运维”四个词进行了概括。“极致算力”指的是6.93EFLOPS的智能算力;“极限组网”则是指采用国产46KW风冷网络设备,构建了最大规模的两级组网;“极效存储”是指采用大规模融合分级存储,以满足大模型训练时海量、多样数据的高效处理和高吞吐要求;“极速运维”则是通过制度、技术和标准三大措施,实现了分钟级故障定界定位和小时级模型断点续训,保障了万张AI加速卡能够长时间稳定并行训练,为万亿模型训练提供了高性能、高可用、高可靠的算力底座。目前,中国移动的九天千亿参数模型已在该集群上实现了高效、长期稳定的训练。

国产化进程加速

哈尔滨智算中心红色横幅上提到的“智算领域的自立自强”,不仅体现在万卡集群对国内AI产业发展的赋能上,更体现在AI芯片100%的国产化率上。

“万卡集群”是由超过一万张加速卡(如GPU、TPU、NPU等专用AI芯片)组成的高性能计算系统,主要用于加速人工智能模型的训练和推理。郅刚介绍道:“我们每台机柜都安装了三台全国产化的算力服务器——昇腾智算服务器Atlas 800 TA2,每台服务器搭载4颗CPU芯片和8颗NPU芯片。每一颗NPU芯片提供376TFLOPS(每秒一万亿次浮点运算)的算力,八颗NPU芯片一共能够提供3PFLOPS(每秒一千万亿次浮点运算)的算力。哈尔滨智算中心拥有2304台这样的服务器,整体能够保障6930PFLOPS高效稳定的算力输出。”

值得注意的是,随着技术、性能和生态建设的不断完善,我国的AI芯片已经具备了与国际顶尖产品竞争的实力。2024年4月,中国移动智算中心(呼和浩特)成为当时全球运营商中规模最大的单体智算中心,其AI芯片国产化率超过85%,智能算力规模高达6.7EFLOPS。四个月后,哈尔滨智算中心正式上线投产,其AI芯片国产化率以及智能算力规模均较呼和浩特智算中心有所提升。此外,政府主导的城市智能计算中心也多采用国产AI芯片。

中昊芯英(杭州)科技有限公司首席解决方案架构师平晓峰表示,目前国内国产GPU芯片厂商以及NPU、TPU等芯片厂商都在积极布局万卡集群市场。他介绍道,GPU芯片与NPU、TPU芯片各有优势,均能充分满足万卡集群智算中心的算力需求。GPU芯片出现较早,最初用于图像处理,因其高并行计算能力而在大模型出现的早期阶段成为支撑模型计算的硬件选择,但其功耗和成本较高。而以TPU为代表的AI芯片则是专门针对AI大模型计算框架而设计的,在AI智算场景中所表现出来的计算性能、算力利用率、能效比等方面更具优势。

平晓峰认为:“万卡集群智算中心的国产化趋势已经愈发明显。”随着智能算力建设迈入万卡时代,算力需求旺盛,市场前景广阔。预计国产AI芯片的蓬勃发展与万卡集群智算中心的算力需求将相互促进,共同推动中国AI产业的繁荣发展。

(文章来源:证券日报)