DeepSeek R1模型发布:算力投资担忧升温,中美大模型技术差距或缩小
AI导读:
华泰证券研报指出,DeepSeek发布的R1模型以低成本达到前沿模型效果,引发算力投资担忧。其创新方式有望降低AI大模型训练成本,中美在大模型技术上的差距有望缩小。
华泰证券最新研报指出,DeepSeek近期发布的R1模型及其相关应用,凭借显著降低的训练成本却达到了与当前前沿模型相媲美的效果,这一突破性进展迅速引发了市场对算力投资趋势的新一轮担忧与讨论。
华泰证券深入剖析认为,DeepSeek的核心创新之处在于其在预训练阶段巧妙地融入了强化学习机制。据分析,DeepSeek V3的训练成本仅为Llama3系列的7%,这一数据无疑为当前世代AI大模型的降本之路做出了重要贡献,预示着未来有望大幅度削减现有模型的训练和推理成本,进而推动AI技术的更广泛应用。此外,研报还提到,当前北美四大AI巨头正积极通过扩大GPU集群规模来探索下一代大模型的发展路径,然而,DeepSeek的这一创新方式能否在下一代模型的研发中继续发挥效用,仍有待市场的进一步观察与验证。
尤为值得关注的是,DeepSeek此次的成功实践,在Scaling Law(规模定律)逐渐放缓的大环境下,为中美两国在大模型技术领域的竞争态势带来了新的变数。华泰证券分析认为,中美两国在大模型技术上的差距有望借此机会缩小,为全球AI技术的未来发展增添了更多不确定性与可能性。
(文章来源:证券时报,版权归原作者所有)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。