DeepSeek引爆全球AI圈，开源大模型引领技术降本与普惠AI

产业经讯 2025-01-28 08:14:48 来源：科创板日报作者：网络

AI导读：

DeepSeek最新发布的开源模型DeepSeek-R1引发全球震动，其性能比肩OpenAI GPT-4，并采用MIT许可协议支持免费商用。DeepSeek坚定选择开源路线，推动AI技术普及和应用。同时，其技术降本策略使AI产品价格大幅降低，成为“AI价格屠夫”。预计随着模型性价比的持续提升，国内AI应用将加速在各领域落地。

近日，Deepseek在一天内迅速登顶中美App Store免费榜，火爆程度导致服务器在两天内崩溃两次，甚至引起Meta的高度关注，开设四个作战室对其进行深入研究。DeepSeek犹如一颗“东方核弹”，在全球范围内引爆了AI圈。

DeepSeek此次引发全球震动的核心是其最新发布的开源模型DeepSeek-R1。据公司透露，该模型在数学、代码、自然语言推理等任务上的性能已比肩OpenAI GPT-4正式版，并采用了MIT许可协议，支持免费商用、任意修改和衍生开发。这一举措不仅展示了DeepSeek的技术实力，更为全球AI社区带来了一份宝贵的开源大礼。

DeepSeek的选择与国内众多大模型创业公司截然不同，它坚定地走上了开源路线，将代码、模型权重和训练日志全部公开。这一做法赢得了AI行业大佬们的广泛赞誉。A16Z创始人Marc Andreessen表示，DeepSeek-R1是他见过最令人惊叹、最让人印象深刻的突破之一，而且它还是开源的，可以说是一份给全球的大礼。英伟达高级研究科学家Jim Fan则认为，DeepSeek-R1可能是第一个展示了RL（强化学习）飞轮可发挥作用，且能带来持续增长的OSS（开源软件）项目。

随着DeepSeek-R1的发布，全球AI技术人员们掀起了“DeepSeek复现热潮”。UC伯克利博士生潘家怡和两位研究人员在游戏CountDown中成功复现了DeepSeek R1-Zero，并验证了通过RL，3B的基础语言模型也能够自我验证和搜索，且复现成本不到30美元。此外，全球最大开源平台HuggingFace团队也宣布复刻DeepSeek R1所有pipeline，复刻完成后将全部开源。

DeepSeek不仅以开源赢得了业界的尊重，更以“物美价廉”的大模型产品赢得了市场的青睐。最新发布的DeepSeek-R1在API服务定价上仅为每百万输入tokens 1元（缓存命中）/4元（缓存未命中），每百万输出tokens 16元，输出API价格仅为OpenAI GPT-4的3%。这一价格策略不仅降低了AI技术的使用门槛，更推动了AI技术的普及和应用。

DeepSeek的成功并非偶然，其背后离不开技术团队的持续创新和降本提效。DeepSeek-V3就曾以预训练成本之低引发业内高度关注，该模型参数量高达671B，但在预训练阶段仅使用2048块GPU训练了2个月，且只花费557.6万美元。与此同时，DeepSeek-V3的性能却足以比肩乃至超越其他前沿大模型。

DeepSeek的创始人梁文锋曾强调，DeepSeek的目标是实现AGI（通用人工智能），而不仅仅是短期的商业化。他相信，随着经济的发展，中国也应该成为技术创新的贡献者。DeepSeek的降价并非为了抢用户，而是基于成本下降和对普惠AI的追求。随着AI应用渗透率的提高和产业的不断发展，DeepSeek有望成为推动AI技术普及和应用的重要力量。

中信证券指出，DeepSeek模型相比GPT-4模型更小的参数量也意味着更低的推理成本。这一降低将是AI应用普及的前奏，正如4G提速降费给我国移动互联网产业带来的助力。预计随着模型性价比的持续提升，国内AI应用将依托丰富的生态和成熟的流量，加速在各领域落地。其中，Agent模式有望以更长的任务流程、更好的场景理解、更高的自主能力，成为所有互联网用户的数字助手，在企业管理、教育、办公、金融等领域展现应用价值。

值得一提的是，Meta生成AI小组和基础设施团队已开设四个作战室，学习DeepSeek的工作原理。这一举动不仅证明了DeepSeek的技术实力，更展示了其在全球AI领域的影响力。或许在不久的将来，DeepSeek将成为托举更多人的巨人，推动全球AI技术的持续发展和创新。

（文章来源：科创板日报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。