DeepSeek引领AI新变革,算力价值面临重估
AI导读:
DeepSeek发布开源多模态人工智能模型Janus-Pro,引发AI界广泛关注。其低成本、高效率的模型开发方式,不仅降低了AI服务成本,还推动了算力价值的重估和软硬件体系的重构,为AI市场注入了新的变量。
21世纪经济报道记者倪雨晴深圳报道
2025年新春前夕,AI领域迎来振奋人心的开局。中国AI初创公司DeepSeek正引领一场新的AI变革,其影响力在除夕夜前夕达到高潮。1月28日凌晨,DeepSeek发布开源多模态人工智能模型Janus-Pro,并在GenEval和DPG-Bench基准测试中击败了DALL-E 3和Stable Diffusion,引发业界广泛关注。
一周前,DeepSeek刚发布了AI推理大模型R1,其高性能和低训练成本直接震撼了全球AI市场,一度登顶苹果免费APP排行榜首位。这一连串的动作,不仅在国内掀起波澜,也在大洋彼岸的华尔街和AI界引发了蝴蝶效应,股市率先感受到了这股AI风暴的冲击。
美东时间1月17日收盘,英伟达股价大跌16.86%,市值一夜之间蒸发5888.62亿美元(约合人民币4.27万亿元),创下美股历史上最大单日个股市值蒸发纪录。同时,博通、台积电、美光科技和AMD等芯片巨头也遭遇重创,市值大幅回落。面对股市的剧烈波动和DeepSeek的迅猛发展,英伟达向21世纪经济报道记者回应称,DeepSeek是一项卓越的人工智能进展,展示了如何运用广泛可用的模型和合规的算力创建新模型,GPU仍有大量需求。
值得注意的是,此次股价暴跌主要集中在AI算力板块,而互联网等软件大厂则微跌甚至有所上涨。这反映出AI要素三角——算法、算力、数据中,算力正面临价值重估的挑战。DeepSeek在算力制约下,通过算法进化和高质量数据,一定程度上冲击了芯片巨头们的算力壁垒。
DeepSeek的崛起,不仅体现在其效率和成本上的突破,更在于其引发的行业变革。其R1模型的训练成本远低于同类模型,API定价也极具竞争力。这一成功,不仅削弱了英伟达等AI芯片需求的预期,也引发了业界对算力巨额投资的质疑。DeepSeek戳破了大模型高成本的现状,算力的比重和角色正在发生变化。
然而,这并不意味着算力从此一文不值。长期来看,AI应用的爆发仍需要算力支持。当前,美股科技巨头们仍在算力军备竞赛中激烈角逐。美国最新公布的“星际之门”AI基础设施计划,由OpenAI、软银和甲骨文等公司合作开展,计划在未来4年内筹集5000亿美元用于建设超大规模数据中心。微软、Meta等科技巨头也纷纷加大在AI基础设施上的投入。
DeepSeek的创新不仅体现在算力利用上,更在于其系统工程的优化。公司采用了MoE架构模型、MLA多层注意力架构、FP8混合精度训练框架等多项先进技术,在各个环节上进行工程化的创新升级,让效率持续上升。这些技术的应用,使得DeepSeek能够在不使用大量最尖端芯片的情况下,提供高计算性能的大模型。
DeepSeek的崛起,标志着AI技术从“规模优先”转向“效率优先”的新阶段。其低成本、高效率的模型开发方式,不仅降低了AI服务的总体成本,加速了AI在各行各业的渗透,还推动了算力价值的重估和软硬件体系的重构。同时,DeepSeek的成功也引发了开源与闭源生态的竞争加剧,开源模式因其灵活性和创新性受到更多关注。
作为AI界的新星,DeepSeek正在掀起一场效率革命。其现象级的爆发,不仅为AI市场注入了新的变量,也为行业带来了更多的可能性和挑战。随着AI技术的不断发展和创新,行业格局将被重塑,全球的AI战略投入和人才争夺也将更加激烈。
(配图:DeepSeek公司logo及其发布的AI模型相关图片)
(文章来源:21世纪经济报道)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。