AI导读:

斯坦福大学与华盛顿大学研究团队以不到50美元云计算费用训练出S1推理模型,在数学和编码能力测试中与OpenAI的O1和DeepSeek的R1表现相当,引发业界对AI创新及核心竞争力的思考。

  近期,一则震撼全球的AI新闻掀起了轩然大波。

  斯坦福大学与华盛顿大学的科研团队联合发布了一项研究成果,他们仅花费不到50美元(折合人民币约364元)的云计算成本,便成功训练出一款名为S1的推理模型。在数学及编码能力测试中,这款S1模型的表现与业界巨头OpenAI的O1模型以及DeepSeek的R1模型旗鼓相当,这一成果迅速吸引了全球范围内的广泛关注。

  这是否标志着AI领域迎来了又一次里程碑式的突破?然而,事实并非如此简单。

  据研究论文透露,S1模型的诞生并非从零到一的全新创造,而是基于阿里通义千问Qwen2.5-32B开源模型进行二次开发。科研人员在16块H100 GPU上,仅用了26分钟对模型进行了监督微调,最终孕育出了新模型S1-32B。此外,在推理能力的提升上,研究团队还巧妙地运用了蒸馏技术,从谷歌强大的AI推理模型Gemini 2.0中汲取了智慧。

  一位知名大模型厂商的研发专家向21世纪经济报道透露,S1模型虽然在性能上表现不俗,但其核心在于复制并整合了前人的研究成果,而非实现了真正的技术创新。

  尽管如此,S1模型的横空出世仍为头部大模型厂商敲响了警钟。面对这一挑战,人们不禁要问:当头部厂商投入巨资训练的模型,被他人以极低的成本复制并达到相似水平时,这些头部企业的核心竞争力究竟何在?

(文章来源:21世纪经济报道)