AI导读:

DeepSeek开源模型通过算法优化降低算力需求,引发对AI产业发展路径的思考。算力仍是重要战略资源,但算法革新同样关键。政府需科学评估算力基础设施投入,加速建设智能算力公共服务设施。

近日,人工智能领域的大模型DeepSeek持续引发关注热潮。

自ChatGPT引领新一轮人工智能浪潮以来,大模型产业的快速发展对算力的需求急剧上升。科技巨头们纷纷投入巨额资金用于模型训练,各地智算中心的建设步伐加快,高性能芯片市场供不应求,全球人工智能产业一度陷入“堆算力”的竞赛之中。

然而,中国人工智能企业DeepSeek发布的开源模型,通过创新的算法优化,显著降低了算力需求,同时实现了与ChatGPT相当的性能水平。这一突破让人们意识到,算力并非推动技术进步的唯一驱动力,算法的革新同样至关重要。西方国家长期构建的算力霸权正面临被逐步打破的挑战,这也引发了业界对于未来人工智能产业发展路径的深刻思考:是否还需大规模投资算力?

对此,市政协委员、华东师范大学计算机科学与技术学院副院长贺樑指出,DeepSeek开源模型的推出,对于我国突破西方科技封锁、在人工智能领域实现自立自强具有重要意义。但这并不意味着算力的重要性有所降低。在训练新的高级模型和推动模型在全行业应用的过程中,强大的算力基础设施仍然是决定成败的关键因素之一。算力作为重要的战略资源,其需求将在很长一段时间内持续增长,而美国可能会通过各种手段限制算力供应,以影响我国的人工智能科研进展。

贺樑强调:“DeepSeek开源模型的问世,标志着通过算力限制中国人工智能发展的策略并未奏效。在算力受限的‘非公平竞争’环境下,中国不再盲目追随,而是提出了具有自主知识产权的原创技术,这一成果震撼了全球,并向全球开源。然而,算力仍然是不可或缺的战略资源,我们需要更加坚定地加强算力储备,以支持优秀的科研团队开展研究。更优的算力储备将为我们在研发下一代模型时赢得时间成本优势,因此,国产算力芯片的自主制造和生态建设必须刻不容缓地加快推进。”

相关论文数据显示,DeepSeek-V3的训练总成本约为557.6万美元。尽管其训练成本相比同类产品大幅降低,但DeepSeek母公司为了这次训练所投入的前期试错成本则无从得知。有报道指出,DeepSeek母公司幻方量化曾大量囤积GPU芯片,为DeepSeek的这次突破奠定了坚实的算力基础。

同时,虽然训练大模型所需的算力有所下降,但这并不意味着社会整体的算力需求会减少。一个高效实用的模型将推动千行万业的大规模应用,在不远的将来,大模型将融入人们生活的方方面面,模型的后训练和推理需求将远超预训练阶段的算力需求。

贺樑还提出,对于算力基础设施的投入回报,应持有长远和发展的眼光。政府需要科学评估未来的硬件情况和市场需求,更多地考虑如何为具有创造力的科研团队提供算力保障,降低创新成本,提高创新速度。即使这些设施可能面临折旧快、不直接盈利的问题,政府仍应坚定地加速建设智能算力功能性公共服务设施,以支撑人工智能产业的持续发展。

原文链接

(文章来源:上观新闻)