Deepseek发布深度推理模型,强化学习展现强大推理力
AI导读:
中信建投研报揭示,Deepseek公司发布的R1-Zero模型采用强化学习训练,取得卓越推理能力,与OpenAI模型相媲美。DeepSeek R1通过算法、框架和硬件优化协同降低算力需求,但未来算力需求仍将爆发式增长。
证券时报e公司讯,中信建投最新研报揭示,Deepseek公司近期发布了其深度推理能力模型——R1-Zero。该模型摒弃了传统方法,完全采用强化学习训练,这一创新之举有力地证明了大型语言模型仅凭强化学习同样能拥有卓越的推理能力。据悉,经过精心微调和强化学习的DeepSeek-R1,在性能测试中取得了与OpenAI的o1-1217模型相当甚至更为出色的表现。
值得注意的是,DeepSeek R1在训练和推理过程中对算力的需求相对较低,这得益于其算法、框架与硬件之间的深度优化协同。这一突破意味着,在追求高效人工智能模型的道路上,我们不再过分受制于高昂的算力成本。然而,报告也指出,尽管当前阶段DeepSeek R1展现出了较低的算力需求,但随着预训练技术向更广阔领域的拓展,尤其是在深度推理阶段,人工智能模型的未来算力需求仍将呈现出爆发式增长态势。因此,充足的算力资源对于推动人工智能模型性能的持续进步依然具有不可替代的作用。
(文章来源:证券时报网)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。