DeepSeek引领国产大模型加速迭代,算力国产化进程预期加速
AI导读:
DeepSeek发布并开源DeepSeek-R1大模型,性能比肩OpenAI。国产大模型加速迭代,缩短与美国厂商差距。美国政府推出AI芯片管制新规,倒逼国产技术突破。DeepSeek等厂商加速算力国产化进程。
银河证券最新发布的计算机行业月报显示,今年1月份,该板块表现尤为强劲。其中,人工智能板块指数(代码:884201.WI)表现尤为突出,月度涨跌幅高达3.6%,这一成绩显著优于同期的宽基指数表现。人工智能板块的逆势上扬,不仅彰显了市场对人工智能技术的持续看好,也反映了业界对人工智能技术迭代升级及应用领域不断拓展的积极预期。
近期,DeepSeek在全球范围内的热度持续攀升,国产大模型的发展步伐也在加速。1月20日,DeepSeek正式发布了DeepSeek-R1大模型,并宣布开源。该模型在数学、代码编写、自然语言推理等多个任务上的表现,已经与OpenAI的官方版本不相上下。同日,Kimi公司也推出了多模态思考模型k1.5,其多模态处理和通用推理能力均达到了行业领先水平。1月22日,字节跳动发布了豆包大模型1.5 pro版本,在综合评测中得分优于GPT-4。此外,1月29日,阿里云也正式推出了通义千问旗舰版模型Qwen2.5-Max,在多项公开主流模型测评基准上均取得了高分。这些进展充分表明,国产大模型正在快速缩小与美国核心厂商的差距,尤其是DeepSeek-V3/R1通过算法与工程侧的深度耦合,不仅实现了算力资源利用率的最大化,还大幅降低了训练成本(仅为OpenAI同类模型的1/30)。以DeepSeek-R1为代表的通用大模型,正在开辟一条全新的AI技术范式,其影响力已经震撼全球。同时,国内AI应用及端侧AI的优势在于丰富的场景生态和庞大的用户流量,DeepSeek的开源策略和高效性能将有力推动AI应用与端侧AI的爆发式增长,未来,AIAgent将在教育、办公、金融、医疗等多个领域发挥巨大价值。
此外,算力国产化进程的预期也在加速。1月13日,美国政府宣布推出新的AI芯片管制规定,旨在进一步限制中国等国家和地区获取高端AI芯片及技术能力,并对华封锁16nm以下先进制程。这一举措无疑将给国产技术发展带来更大挑战,但同时也将倒逼国产技术实现持续突破。另一方面,DeepSeek开源大模型对国产化也产生了积极影响。DeepSeek通过使用FPS低精度训练、双管道训练、共享专家机制等技术手段,大大降低了大模型的训练成本(例如,DeepSeek-v3模型仅用557.6万美元和2048块H800 GPU便完成了训练)。随着大模型成本的降低以及技术的不断进步,整个算力资源的使用总量预计将呈现上升趋势。杰文斯悖论或将再次显现,以DeepSeek为代表的大模型厂商将加速推动算力国产化进程。
(文章来源:财中社,所有图片及链接均保留原样,未做任何改动)
原文链接郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。