马斯克xAI超级计算机Colossus算力将扩大十倍
AI导读:
美国大孟菲斯商会发布声明,马斯克的人工智能初创公司xAI计划将超级计算机Colossus的算力扩大十倍,预计搭载100万块GPU,与谷歌、OpenAI等竞争对手展开激烈竞争。
当地时间12月5日,美国大孟菲斯商会(Greater Memphis Chamber)发布官方声明,揭示了马斯克的人工智能初创企业xAI的一项雄心勃勃的计划。xAI承诺将其超级计算机项目Colossus的算力扩大十倍,预计未来将搭载高达100万块GPU,以此强化与谷歌、OpenAI和Anthropic等强劲对手的竞争格局。
Colossus不仅被誉为全球最大的超级计算机,更因其惊人的建设速度而被业界瞩目。马斯克仅用了短短三个月的时间便完成了这一超级计算机集群的建设,而英伟达创始人兼CEO黄仁勋曾指出,如此规模的数据中心通常需要三年的建设时间。黄仁勋对马斯克的成就表示赞赏,称其为“奇迹”。
目前,Colossus超级计算机正在运行由超过10万块英伟达GPU组成的集群,这些强大的芯片正被用于训练xAI的聊天机器人Grok。然而,尽管Grok在技术上有所突破,但其用户数量尚不及市场领导者OpenAI的ChatGPT或谷歌的Gemini。
马斯克规划的Colossus扩张项目预计耗资数百亿美元,除了巨大的硬件投资外,还需要大规模的服务器供电和冷却系统,这将带来高昂的运营成本。
大孟菲斯商会最新的声明还透露,除了马斯克的xAI外,英伟达、戴尔和超微电脑(SuperMicro)等科技巨头也将在孟菲斯地区进行扩张。今年早些时候,戴尔和超微电脑已宣布将为xAI提供服务器机架。
马斯克在数据中心基础设施方面的投入堪称大手笔。xAI今年已融资约110亿美元,其中大部分资金用于采购英伟达的GPU芯片。
根据LessWrong网站近日发表的一篇博客文章显示,根据公开数据和各大科技巨头GPU数量的预估,目前全球GPU数量最多的公司依次为谷歌、微软、Meta、亚马逊以及xAI。以H100芯片算力为例,谷歌拥有100万至150万块等效H100,预计明年将达到350万至420万块;微软拥有75万至90万块等效H100,预计明年将达到250万至310万块;Meta拥有55万至65万块等效H100,预计明年将达到190万至250万块;亚马逊拥有25万至40万块等效H100,预计明年将达到130万至160万块;而xAI目前拥有10万块等效H100,预计明年将达到55万至100万块。
这些数据表明,马斯克的xAI要想赶上谷歌、微软等科技巨头,仍需付出巨大努力。目前,xAI正在使用约2万块H100芯片训练Grok 2大模型,并计划使用10万块H100芯片训练Grok 3大模型。随着英伟达最新一代Blackwell芯片的大量出货,马斯克表示,他计划在2025年夏天部署一个拥有30万块Blackwell芯片的运算集群。
一份最新发布的2024 AI现状报告对Blackwell芯片的采购量进行了估算。报告指出,大型云计算公司正在大规模采购英伟达的GB200系统,其中微软预计采购量在70万到140万块之间,谷歌为40万块,OpenAI也将拥有至少40万块,亚马逊AWS为36万块。
过去一年,科技公司在人工智能芯片资源的争夺上愈演愈烈,纷纷加大AI基础设施建设的投入。风投机构Menlo Ventures的最新数据显示,生成式AI市场的收入预计将在十年内超过1万亿美元,而今年企业在生成式AI上的支出激增了500%。
(文章来源:第一财经,有删改)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。