AI新突破?斯坦福团队低成本训练出S1推理模型引热议
AI导读:
斯坦福大学与华盛顿大学研究团队以不到50美元云计算费用训练出S1推理模型,在数学和编码能力测试中与OpenAI的O1和DeepSeek的R1表现相当,引发业界对AI创新及核心竞争力的思考。
近期,一则震撼全球的AI新闻掀起了轩然大波。
斯坦福大学与华盛顿大学的科研团队联合发布了一项研究成果,他们仅花费不到50美元(折合人民币约364元)的云计算成本,便成功训练出一款名为S1的推理模型。在数学及编码能力测试中,这款S1模型的表现与业界巨头OpenAI的O1模型以及DeepSeek的R1模型旗鼓相当,这一成果迅速吸引了全球范围内的广泛关注。
这是否标志着AI领域迎来了又一次里程碑式的突破?然而,事实并非如此简单。
据研究论文透露,S1模型的诞生并非从零到一的全新创造,而是基于阿里通义千问Qwen2.5-32B开源模型进行二次开发。科研人员在16块H100 GPU上,仅用了26分钟对模型进行了监督微调,最终孕育出了新模型S1-32B。此外,在推理能力的提升上,研究团队还巧妙地运用了蒸馏技术,从谷歌强大的AI推理模型Gemini 2.0中汲取了智慧。
一位知名大模型厂商的研发专家向21世纪经济报道透露,S1模型虽然在性能上表现不俗,但其核心在于复制并整合了前人的研究成果,而非实现了真正的技术创新。
尽管如此,S1模型的横空出世仍为头部大模型厂商敲响了警钟。面对这一挑战,人们不禁要问:当头部厂商投入巨资训练的模型,被他人以极低的成本复制并达到相似水平时,这些头部企业的核心竞争力究竟何在?
(文章来源:21世纪经济报道)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。