DeepSeek模型登顶应用商店下载榜,AI技术格局或将重塑
AI导读:
近日,通用人工智能模型AGI研发商DeepSeek受到广泛关注,其DeepSeek-R1模型性能比肩OpenAI o1正式版,且成本更低。该模型发布后引起了广泛热议,并成功登顶苹果应用商店下载榜,AI技术格局或将因此重塑。
近日,通用人工智能模型AGI研发领域的黑马——DeepSeek,凭借其卓越的技术实力,赢得了业界的广泛关注。1月26日,DeepSeek相关话题迅速攀升至东方财富热榜话题榜的第二名,彰显了其在市场上的极高热度。
在1月27日,DeepSeek应用更是势如破竹,成功登顶苹果中国地区与美国地区应用商店的免费App下载排行榜,甚至在美国地区下载榜上超越了备受瞩目的ChatGPT,这一成就无疑为其增添了更多的光彩与关注度。
据悉,DeepSeek在2025年1月推出了性能可媲美OpenAI o1正式版的DeepSeek-R1模型。该模型在后训练阶段大规模采用了强化学习技术,即便在仅有极少标注数据的情况下,也极大地提升了模型的推理能力。这一技术的突破,使得DeepSeek-R1模型在性能上实现了质的飞跃。
CNBC对此报道称:“一家鲜为人知的中国人工智能实验室,以更低的搭建成本,发布了性能超越美国顶尖人工智能模型的AI产品,这在整个硅谷引发了强烈的震动与恐慌。”这一评价,无疑是对DeepSeek技术实力的高度认可。
然而,就在1月26日,有消息传出DeepSeek出现短暂的服务中断,提示服务器繁忙。但幸运的是,经过紧急处理,当日16点时,DeepSeek大模型已恢复正常使用,确保了用户的顺畅体验。
公开资料显示,DeepSeek所属企业为杭州深度求索人工智能基础技术研究有限公司,该公司由梁文锋间接控股高达83.2945%。梁文锋,这位出生于广东、毕业于浙江大学的杰出人物,此前曾从事量化投资工作,如今正带领DeepSeek在AI领域不断前行。
DeepSeek-R1:低成本与高性能的完美融合
DeepSeek-R1模型的最大亮点在于其强大的性能与低廉的成本。据公开信息显示,该模型的性能可与OpenAI o1正式版相媲美,但其API服务的定价却极为亲民,每百万输入tokens仅需1元(缓存命中)/4元(缓存未命中),每百万输出tokens也仅为16元。这一收费标准,大约是OpenAI o1运行成本的三十分之一,极大地降低了用户的使用成本。
DeepSeek-AI团队的论文揭示了其技术的关键所在——DeepSeek-R1-Zero路线。这一创新的训练方法,直接将强化学习(RL)应用于基础模型,无需依赖传统的监督微调(SFT)和已标注数据,从而实现了推理能力的显著提升。
事实上,低成本、高性能一直是DeepSeek模型的核心理念。早在2024年12月,DeepSeek就推出了DeepSeek-V3模型,该模型在多项评测中超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上与GPT-4o以及Claude-3.5-Sonnet等世界顶尖闭源模型不相上下。更令人惊叹的是,DeepSeek-V3模型的开发成本仅为600万美元,且使用了性能受限的英伟达H800显卡,相比之下,Meta的Llama-3.1-405B训练成本高达6000万美元,使用的计算资源更是DeepSeek-V3的11倍。
在美国匿名职场社区teamblind上,已有Meta员工对DeepSeek的低成本和高效能表示担忧,认为其团队面临预算合理性的问题。这一言论,也从侧面反映了DeepSeek在市场上的巨大影响力。
市场反响热烈,AI技术格局或将重塑
DeepSeek-R1模型的发布,无疑在业界引起了轩然大波。有关业内人士指出,市场反响如此剧烈的原因在于,DeepSeek的实例证明了AI技术并不存在明显的“护城河”,模型技术的相互超越已成为常态。这一观点,无疑为AI技术的未来发展提供了新的思考方向。
微软首席执行官萨提亚·纳德拉(Satya Nadella)在达沃斯世界经济论坛上表示:“DeepSeek的新模型令人印象深刻,他们不仅有效地开发出了一个能够进行推理时计算的开源模型,而且计算效率极高。”这一评价,无疑是对DeepSeek技术实力的再次肯定。
经济学人也指出,目前美国训练一个大语言模型要花费数千万美元,而DeepSeek的支出却不到600万美元。这种廉价训练正随着模型设计的发展改变整个行业,可能导致更多针对特定用途的专业模型涌现,从而打破当前赢者通吃的市场格局。
此外,AMD也宣布将DeepSeek-V3模型集成至Instinct MI300X GPU上,并借助SGLang进行了性能优化。这一合作,无疑将加速尖端人工智能应用的发展,为AI技术的未来注入新的活力。
随着DeepSeek的热度持续高涨,国内资本市场也对其给予了高度关注。相关业内人士表示,人工智能有望在春节前后继续成为资本市场追逐的热点板块,而DeepSeek作为其中的佼佼者,无疑将成为市场关注的焦点。
(文章来源:上海证券报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。