AI导读:

中信建投研报揭示,Deepseek公司发布的R1-Zero模型采用强化学习训练,取得卓越推理能力,与OpenAI模型相媲美。DeepSeek R1通过算法、框架和硬件优化协同降低算力需求,但未来算力需求仍将爆发式增长。

证券时报e公司讯,中信建投最新研报揭示,Deepseek公司近期发布了其深度推理能力模型——R1-Zero。该模型摒弃了传统方法,完全采用强化学习训练,这一创新之举有力地证明了大型语言模型仅凭强化学习同样能拥有卓越的推理能力。据悉,经过精心微调和强化学习的DeepSeek-R1,在性能测试中取得了与OpenAI的o1-1217模型相当甚至更为出色的表现。

值得注意的是,DeepSeek R1在训练和推理过程中对算力的需求相对较低,这得益于其算法、框架与硬件之间的深度优化协同。这一突破意味着,在追求高效人工智能模型的道路上,我们不再过分受制于高昂的算力成本。然而,报告也指出,尽管当前阶段DeepSeek R1展现出了较低的算力需求,但随着预训练技术向更广阔领域的拓展,尤其是在深度推理阶段,人工智能模型的未来算力需求仍将呈现出爆发式增长态势。因此,充足的算力资源对于推动人工智能模型性能的持续进步依然具有不可替代的作用。

(文章来源:证券时报网)