AI导读:

深度求索公司发布最新开源模型DeepSeek-R1,以较低成本达到GPT-o1性能,有望激发AI创新浪潮,推动全球AI技术进步。业界人士认为,该模型将降低开发利用门槛,提升企业盈利能力。

新华财经旧金山1月28日电(记者吴晓凌)近日,中国人工智能(AI)领域的佼佼者深度求索(DeepSeek)公司震撼发布其最新力作——开源模型DeepSeek-R1。该模型凭借较低的成本,成功逼近了美国开放人工智能研究中心(OpenAI)的GPT-o1性能,这一突破性成就不仅打破了全球AI产业长期以来的“堆算力”迷思,更在资本市场掀起了滔天巨浪。业界专家普遍预测,DeepSeek模型的问世,或将引领新一轮的创新风潮,推动全球AI技术迈向新的高峰。

算力不再是唯一标尺,“更大不再等于更聪明”

据深度求索公司官方网站详细介绍,DeepSeek-R1在后训练阶段大规模引入了强化学习技术,即便在标注数据稀缺的情况下,也能显著提升模型的推理能力。在数学、代码、自然语言推理等多个领域,其测评性能已与GPT-o1模型正式版不相伯仲。这一成就无疑是对传统AI发展路径的一次有力挑战。

国际知名投行摩根士丹利对此发表评论称:“更大(的模型)不再等于更聪明”。DeepSeek公司通过大幅提升数据质量并改进模型架构,开辟了一条不同于以往大模型的高效训练新路径。与国际知名大模型相比,DeepSeek的模型成本降低了约一个数量级,低成本优势显著。

高盛集团亦持相似观点,认为DeepSeek新模型的成本远低于现有模型,这将极大地降低开发利用大模型的门槛,使得互联网巨头面临来自初创公司的强劲竞争。

英国《金融时报》则发表评论文章指出,DeepSeek的挑战颠覆了AI产业的核心信念,即更强大的硬件是推动AI发展的关键。这一观点在业界引起了广泛共鸣。

创新浪潮涌动,AI未来可期

摩根士丹利进一步指出,DeepSeek的模型表明,前沿AI能力或许无需依赖大量计算资源即可实现。通过巧妙的工程设计和高效的训练方法,资源的高效利用可能比单纯的计算能力更为重要。这一观点有望激发一波创新浪潮,促使各家企业积极探索具有成本效益的AI开发和部署方法。

值得一提的是,DeepSeek的模型是开源共享的。近日,全球知名开源平台抱抱脸公司等多个团队已宣布成功复现了DeepSeek-R1的训练过程。美国“元”公司首席AI科学家杨立昆在社交媒体上发文称赞道:“DeepSeek-R1的面世,标志着开源模型正在超越闭源模型。”

英国《金融时报》的评论文章还指出,开源模型DeepSeek-R1对全球用户产生了巨大吸引力,将有力推动AI技术的开发和应用。对于大多数商业用户而言,拥有一款足够可靠且易用的模型,比拥有绝对领先的模型更为关键。文章以汽车为例形象地阐述道:“并非每个司机都需要一辆法拉利。像R1这样的模型在推理能力上的进步,可能会为与客户互动或处理工作任务的‘智能体’带来颠覆性变革。”若能以更低的成本拥有这些模型,企业的盈利能力将得到显著提升。

瑞士瑞银集团同样预测,若AI训练和推理成本显著降低,预计将有更多终端用户利用AI来改善业务或开发新用途。

(图片及文章来源:新华社,本文图片及内容版权归原作者所有,如有侵权请及时联系删除。)