AI新突破？斯坦福团队低成本训练出S1推理模型引热议

国际财经 2025-02-07 22:00:36 来源：21世纪经济报道作者：网络

AI导读：

斯坦福大学与华盛顿大学研究团队以不到50美元云计算费用训练出S1推理模型，在数学和编码能力测试中与OpenAI的O1和DeepSeek的R1表现相当，引发业界对AI创新及核心竞争力的思考。

　　近期，一则震撼全球的AI新闻掀起了轩然大波。

　　斯坦福大学与华盛顿大学的科研团队联合发布了一项研究成果，他们仅花费不到50美元（折合人民币约364元）的云计算成本，便成功训练出一款名为S1的推理模型。在数学及编码能力测试中，这款S1模型的表现与业界巨头OpenAI的O1模型以及Deepseek的R1模型旗鼓相当，这一成果迅速吸引了全球范围内的广泛关注。

　　这是否标志着AI领域迎来了又一次里程碑式的突破？然而，事实并非如此简单。

　　据研究论文透露，S1模型的诞生并非从零到一的全新创造，而是基于阿里通义千问Qwen2.5-32B开源模型进行二次开发。科研人员在16块H100 GPU上，仅用了26分钟对模型进行了监督微调，最终孕育出了新模型S1-32B。此外，在推理能力的提升上，研究团队还巧妙地运用了蒸馏技术，从谷歌强大的AI推理模型Gemini 2.0中汲取了智慧。

　　一位知名大模型厂商的研发专家向21世纪经济报道透露，S1模型虽然在性能上表现不俗，但其核心在于复制并整合了前人的研究成果，而非实现了真正的技术创新。

　　尽管如此，S1模型的横空出世仍为头部大模型厂商敲响了警钟。面对这一挑战，人们不禁要问：当头部厂商投入巨资训练的模型，被他人以极低的成本复制并达到相似水平时，这些头部企业的核心竞争力究竟何在？

（文章来源：21世纪经济报道）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。