DeepSeek现象:AI领域的革新与挑战
AI导读:
DeepSeek通过高效算法降低AI训练成本,引发全球AI界关注。文章探讨DeepSeek现象对AI领域的影响,包括算力图景变化、AI信任度挑战及美国AI巨头的战略焦虑等。
21世纪经济报道记者 孔海丽 北京报道
自2024年12月V3大模型的问世,至近期R1模型及多模态模型Janus-Pro的推出,DeepSeek在全球AI界乃至整个科技领域掀起了一股“DeepSeek现象”的风潮。知名播客主持人莱克斯·弗里德曼(Lex Fridman),以其多次采访马斯克等AI行业领袖的经验,用“DeepSeek时刻”来形容这一现象,并预言:“我认为5年后,它仍将在科技史上占据重要地位。”
DeepSeek之所以能够脱颖而出,原因之一在于其采用了更为高效的算法,将AI训练成本降低了近60%,同时实现了与同类模型相当甚至超越的性能。简而言之,当其他企业花费100元训练一个AI模型时,DeepSeek仅需40元。这种“省钱策略”直击行业痛点,使过去依赖高价芯片数量的竞争转变为芯片使用效率的比拼。
DeepSeek不仅为AI领域带来了新的技术路线,更重要的是,它在硅谷和华尔街主导的AI叙事中打开了一个新的缺口。
然而,在自豪与兴奋之余,我们仍需保持冷静。尽管DeepSeek等新兴AI企业在资金、技术、人才等方面取得了显著进展,但它们尚无法全面挑战OpenAI、Anthropic等巨头。就V3、R1模型而言,其算法优化虽降低了成本,但在处理复杂场景时,其表现仍不及通过高投入堆出的大模型。此外,短期内我们还难以撼动英伟达等硬件巨头在市场的地位。
在“DeepSeek现象”的推动下,未来的算力图景将呈现多元化发展。一方面,DeepSeek等低成本、高效率的产品可能引发AI应用的爆发式增长,这是所有从业人员梦寐以求的场景。另一方面,随着训练成本的降低,更多公司将涌入AI领域,消费者应用将呈指数级增加,从而催生AI生态链的全面繁荣,进而带动芯片需求的超预期增长。然而,这两方面恰好构成了算力命题的悖论。
业内人士指出,AI Agent应用要实现跳跃式增长乃至爆发,必须跨越三大门槛:场景渗透率大于15%、任务完成度大于80%、用户信任度大于60%。以信任度为例,此前Gartner的一项调查显示,64%的人不希望客户服务中使用人工智能。目前,AI Agent应用的技术能力仅能满足简单场景,如客服、日程管理等,而在复杂决策领域,如医疗咨询、法律建议等,仍存在难以填补的缺陷。因此,AI的信任度问题仍是制约其广泛应用的关键因素之一。
尽管业内预计要到2026年前后,AI信任度才会达到分水岭(大于60%),但“DeepSeek现象”是否会加速这一进程,目前尚无定论。有人预测,2025年将成为AI Agent应用的元年。而DeepSeek通过异构计算架构、CPU+FPGA+ASIC混合部署和动态负载均衡算法等创新,将单位算力产出提升了2倍多。这是否意味着它将打破算力垄断,引发算力过剩?
当前算力现状呈现出严重不均衡的特点。一是地区不均衡,北美尤其是美国占据了全球算力最大份额;二是供应不均衡,英伟达等少数企业在通用算力芯片市场占据主导地位;三是企业不均衡,微软、Meta、谷歌等巨头囤积了大量算力,其他企业难以匹敌。此外,算力供需还存在结构性错配的问题,如推理侧算力需求增速已超过训练侧,但算力仍主要布局于训练侧。
尽管有人认为DeepSeek通过架构革新绕开了英伟达的CUDA生态,但这其实是误读。多位专家研读DeepSeek的开源论文后表示,其底层架构仍然基于CUDA生态建构。因此,在短期内,其他区域及其厂商要打破巨头垄断、摆脱以英伟达为代表的算力依赖,仍是乐观主义的展望。
至于算力过剩的问题,短期内并不存在。整体上,算力仍处于供不应求的状态。《中国算力发展报告(2024)》显示,截至2023年底,全球算力规模同比增长40%,但以CPU为代表的芯片年性能提升不足15%,无法满足视频、图片等非结构化数据的处理需求。因此,“DeepSeek现象”实际上增加了而非减少了硬件需求。
尽管DeepSeek尚未突破硬件限制,其创新也基于现有技术基础,但它为何仍能引起美国AI巨头的焦虑甚至恐慌?从表层看,美国AI巨头感受到了危机,并非因为技术被超越,而是因为实现目标的技术路径发生了改变。DeepSeek证明了硅谷堆硬件堆数据的路线并非唯一选择,高效用好现有资源同样能取得成功。这引发了美国AI巨头的战略焦虑,因为它们长期主导的技术先发优势面临重估。
宏观趋势研究学者、经济学家David Woo表示,AI是推动美国经济“例外主义”论断形成的重要因素。如今,DeepSeek向这套AI叙事发起了挑战。全球科技和资本领域的热烈反应从侧面解释了科技巨头的焦虑和资本市场的紧张情绪。截至2月3日美股盘前,英伟达股价自1月24日以来已大幅下跌。当然,这可能与投资者的市场情绪波动有关。
DeepSeek创造的历史性价值在于其力行开源的策略和提供了除堆砌算力和数据之外的新技术路径。这两点已成为业内的共识。在现实层面,DeepSeek揭示了当创新进入深水区时,工程能力比学术突破更重要、成本控制比参数竞赛更致命、社会接受度比算法精度更关键的残酷真相。
如果跳出地缘政治的视角,仅着眼于行业本身,商业的本质在于赚钱的公司才能活下去。当资本泡沫退去时,我们或许会发现,技术强大固然重要,但应用和生存才是企业当下的现实挑战。DeepSeek通过提供高效低成本的技术创新赢得了宝贵的时间窗口,这是堆积美元也难以买到的优势。
(文章来源:21世纪经济报道)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。