AI导读:

DeepSeek公司开源其推理模型DeepSeek-R1,引发全球AI产业轰动,英伟达市值一周内蒸发5520亿美元。DeepSeek的冲击波持续发酵,引发硅谷、华尔街以及科技巨头们的广泛关注,AI界开始思考未来的发展方向。

2025年1月中旬,英伟达CEO黄仁勋的中国行备受瞩目,但其未曾料到,一家名为深度求索(DeepSeek)的中国公司,即将在不久后成为影响全球AI产业的“黑天鹅”。1月20日,DeepSeek悄然开源了其推理模型DeepSeek-R1,这一举动迅速在全球范围内引发轰动,英伟达市值一周内蒸发5520亿美元,硅谷巨头与华尔街均陷入恐慌。

DeepSeek的“闪电战”策略主要体现在性能、价格与开源三大方面。在性能上,DeepSeek-R1与OpenAI的ChatGPT o1并列,尤其在高难度领域及风格控制方面表现更佳。价格上,DeepSeek-R1以“白菜价”颠覆市场,其API端口缓存命中价格仅为o1的2%~3%,且移动应用和网页端免费。最引人注目的是其开源策略,彻底打破了大型语言模型被少数公司垄断的局面。

DeepSeek-R1的创新不仅在于性能与价格,更在于其技术路线的突破。DeepSeek团队摒弃了传统的监督微调(SFT)环节,完全依赖强化学习(RL)进行训练,这一突破为AI的自主学习范式提供了重要实践范例。同时,DeepSeek-V3在技术上也有所创新,使用了FP8、MLA(多头潜在注意力)和MoE(利用混合专家架构)三种技术,进一步降低了训练成本。

DeepSeek的出现引发了硅谷、华尔街以及科技巨头们的广泛关注。微软、AWS、英伟达等科技巨头纷纷接入DeepSeek-R1模型服务,展现出对DeepSeek技术的认可。同时,DeepSeek的出现也让人们开始重新审视开源的价值和风险,以及AI产业的竞争格局。

随着DeepSeek的冲击波持续发酵,AI界开始思考未来的发展方向。是继续坚持“大力出奇迹”的算力竞赛,还是探索更加“聪明”的技术路径?是保持巨头垄断的固化格局,还是推动AI技术的百花齐放?DeepSeek的出现让这些问题变得更加紧迫和现实。

DeepSeek的出现不仅改变了AI产业的竞争格局,更让人们开始思考AI技术的未来走向。随着训练成本的降低、技术的成熟以及开源的普及,大语言模型将愈发成为一种普通产品。未来,AI技术将更加平民化和普惠化,为人类社会带来更多的便利和价值。

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

(文章来源:每日经济新闻 修改后发布)