AI大模型推动算力需求激增,浪潮信息与智源研究院共建多元算力生态
AI导读:
2024年AI全领域迎来迅猛量变积累,大模型技术突破模态界限,企业对算力需求激增。浪潮信息与智源研究院达成战略合作,共建大模型多元算力开源创新生态,旨在提升算力效率,降低应用开发门槛,推动AI技术全面落地。
2024年,AI全领域迎来了更为迅猛的量变积累,大模型技术迈入崭新发展阶段。在这一背景下,模型已跨越模态界限,实现了文本、语音、视觉等多种形式的深度融合,显著增强了模态多样性。
与此同时,大模型的应用场景不断拓展,企业对算力的需求持续增长,依赖性也显著提升。业内普遍认为,大模型的Scaling Law依然有效,因此,对大模型能力的追求将推动对大算力需求的不断增加。算力已不仅是技术基础设施,更成为影响企业竞争力的核心要素。
当前,算力行业面临“需求大、能耗高、效率低”的困境。以GPT-3与LLaMA3-405B为例,尽管模型规模仅增长2.3倍,但所需算力却激增116倍。这种指数级的算力消耗增长,使得传统单一算力架构难以为继,行业亟需高效、多元的算力解决方案。
算法的创新将推动算力需求的持续增长,同时,算法结构的创新也带来了MoE(混合专家模型)、模型量化、定制算子等复杂计算需求。这要求企业具备更强的技术积累,也对算力生态的协同发展提出严峻挑战。因此,构建一个多元化的算力系统生态至关重要。
为应对这一挑战,12月25日下午,浪潮信息与智源研究院达成战略合作,共同建设大模型多元算力开源创新生态,旨在提升大模型创新研发的算力效率,降低应用开发门槛。此次合作不仅是技术层面的互补,更是产业生态的一次深度整合。
目前,智源的开源大模型通用算子库FlagGems已接入浪潮信息的元脑企智EPAI企业大模型开发平台,助力企业实现多元算力的适配与使用。然而,由于硬件架构、指令集差异及算子库独立实现,生态系统碎片化问题严重,导致大模型应用的技术门槛高,企业实际部署困难重重。
特别是技术力量薄弱的传统企业用户,在多元芯片、模型选择及部署中面临诸多挑战,软件框架多、易用性差等问题频发。此次合作通过深度融合FlagGems与EPAI平台,实现跨硬件、多框架兼容的算子集合,满足企业多种开发框架需求,实现大模型在跨算力平台上的无缝开发与迁移。
截至12月,FlagGems已提供超过130个大模型算子,成为目前提供算子数量最多、覆盖广度最大的开源算子库。借助EPAI平台,企业可在多种算力平台上高效开发AI算法,灵活应对不同硬件架构带来的技术差异。
浪潮信息高级副总裁刘军表示:“在多元多模的产业格局下,AI产业化落地需推动人工智能与各行各业的深度融合。过去,算力产业因硬件架构、指令集差异及算子库独立实现而形成生态藩篱。此次合作旨在化解这些高门槛问题,为AI应用创新提供强大、多元的算力支持。”
未来,随着更多企业与开发者的加入,大模型多元算力生态有望逐渐成熟,成为推动AI技术全面落地的关键力量。
(文章来源:21世纪经济报道)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。