AI导读:

百度智能云成功点亮国内首个自研万卡集群——昆仑芯三代万卡集群,为AI算力领域带来重大突破,助力模型降本与算力优化,引领中国科技界、互联网行业及AI行业发展新机遇。

近日,百度智能云宣布成功点亮国内首个自研万卡集群——昆仑芯三代万卡集群,这一里程碑式的成就不仅彰显了百度在人工智能算力领域的深厚积累与创新能力,更为中国科技界、互联网行业以及AI行业开辟了新的发展机遇与前景。

昆仑芯三代万卡集群的正式点亮,标志着百度在算力领域的重大突破。这一集群不仅为百度提供了前所未有的强大算力支持,更在模型降本方面展现出显著优势。在当前算力紧张、成本居高不下的行业背景下,百度通过自研芯片与大规模集群建设,不仅有效解决了自身算力瓶颈,更为整个行业树立了新的标杆,引领了算力优化与成本降低的新趋势。

从算力性能来看,昆仑芯三代万卡集群凭借超大规模并行计算能力,实现了训练效率的显著提升。这一集群能够大幅降低千亿参数模型的训练周期,满足AI原生应用快速迭代的需求,同时支持更大规模、更复杂任务以及多模态数据的处理,为Sora类应用的开发提供了有力支撑。此外,万卡集群还具备强大的多任务并发能力,通过动态资源切分与通信优化,实现了训练成本的指数级下降,进一步提升了算力的利用效率。

随着国产大模型的兴起,昆仑芯三代万卡集群逐渐从“单任务算力消耗”向“集群效能最大化”转变。通过模型优化、有效训练率提升以及动态资源分配等策略,这一集群实现了训练、微调、推理任务的混合部署,从而提升了集群的综合利用率,降低了单位算力成本。这一转变不仅有助于百度自身技术的发展,更为整个行业带来了全新的发展思路与机遇。

在万卡集群的建设过程中,百度百舸AI异构计算平台4.0发挥了至关重要的作用。该平台在硬件扩展性、能效与散热、分布式训练优化、稳定性提升以及机间通信带宽需求等方面均取得了显著突破。通过构建十万卡级别的超大规模HPN高性能网络,百舸4.0实现了跨地域通信的低延迟与高效率,为万卡集群的稳定运行提供了有力保障。

在多芯混训方面,百舸4.0展现了强大的资源整合与管理能力。它能够将不同地点、不同规模的异构算力进行统一管理,构建起多芯资源池,实现资源的最大化利用。当业务提交工作负载时,百舸可自动进行芯片选型,选择性价比最高的芯片来运行任务,从而提高了集群的整体效能与训练效率。

此外,在集群稳定性方面,百度自研的BCCL(百度集合通信库)为万卡集群提供了全面的故障诊断与自动化容错能力。这一技术能够快速定位故障节点并提供自动化的恢复方案,将故障恢复时间从小时级降低到分钟级,极大地提高了集群的可靠性和可用性。

日前,花旗银行发布的研报指出,DeepSeek、百度等中国模型在高效与低成本方面展现出显著优势,将有助于加速全球AI应用开发,推动2025年人工智能应用的拐点到来。这一观点不仅肯定了百度在AI领域的创新成果与领先地位,更为整个行业的发展前景注入了新的信心与动力。

(文章来源:上观新闻,图片来源于网络)