AI导读:

特斯拉创始人马斯克旗下xAI推出的大模型Grok 3在MMLU得分追上ChatGPT,并在多个性能上超越竞争对手。Grok 3的成功进一步验证了算力堆积的有效性,为AI行业带来了新的突破。分析人士指出,Grok 3证明了缩放法则在达到上限前仍有发展空间。

  Grok 3表明,依靠算力堆积的“大力出奇迹”路径在当前AI发展中依旧可行,为行业带来了新的突破。

  2月18日,特斯拉创始人埃隆·马斯克旗下xAI推出最新大模型Grok 3。据介绍,尽管Grok起步较晚,但在MMLU(大规模多任务语言理解基准测试)上的得分已追上ChatGPT,Grok 3及其轻量化的版本Grok 3 mini在多个性能上都超越或媲美了Gemini、Deepseek和GPT-4等竞争对手。

  Grok 3在xAI位于孟菲斯的Colossus超算中心接受训练。xAI透露,该超算中心的算力已实现翻倍,拥有的英伟达GPU数量达到20万颗。

  业内人士对Grok 3的优秀表现给予了高度评价,认为这进一步验证了算力堆积的有效性。分析人士指出,Grok 3的成功证明了缩放法则(scaling law)在达到上限前仍有很大的发展空间,这对AI行业来说是一个积极的信号。

  AI领域的知名人士Andrej Karpathy在成为Grok 3首批用户后,在社交媒体上分享了详细的测评报告。他称赞了Grok 3的逻辑推理能力,并指出其性能与OpenAI的GPT-4模型相当。同时,他还认为Grok 3的推理能力略优于DeepSeek-R1和谷歌的Gemini 2.0。

  然而,Karpathy也指出了Grok 3在搜索功能DeepSearch中存在的一些局限性,如偶尔出现的幻觉和事实错误。

  科技领域的分析人士认为,Grok 3的成功在很大程度上得益于算力的堆积。沃顿商学院人工智能教授Ethan Mollick指出,速度和算力是AI行业的护城河,而人才和芯片则是打造前沿模型的关键因素。

  随着更多超算集群的规划,xAI有望继续提升模型能力。华泰证券、国泰君安和中信证券等机构也对算力在AI模型进步中的关键作用给予了肯定。

  华泰证券在研报中提出,Grok 3证明了在算力提升下,预训练仍能取得突破。国泰君安则强调了算力与算法的同等重要性,认为高昂的算力投入已经形成了显著的技术门槛。中信证券指出,Grok 3作为全球首个在十万卡集群上训练的大模型,其综合能力的显著提升意味着算力堆积仍是模型进步的关键变量之一。

(文章来源:澎湃新闻)