AI导读:

DeepSeek发布开源多模态人工智能模型Janus-Pro,引发AI界广泛关注。其低成本、高效率的模型开发方式,不仅降低了AI服务成本,还推动了算力价值的重估和软硬件体系的重构,为AI市场注入了新的变量。


21世纪经济报道记者倪雨晴深圳报道

2025年新春前夕,AI领域迎来振奋人心的开局。中国AI初创公司DeepSeek正引领一场新的AI变革,其影响力在除夕夜前夕达到高潮。1月28日凌晨,DeepSeek发布开源多模态人工智能模型Janus-Pro,并在GenEval和DPG-Bench基准测试中击败了DALL-E 3和Stable Diffusion,引发业界广泛关注。

一周前,DeepSeek刚发布了AI推理大模型R1,其高性能和低训练成本直接震撼了全球AI市场,一度登顶苹果免费APP排行榜首位。这一连串的动作,不仅在国内掀起波澜,也在大洋彼岸的华尔街和AI界引发了蝴蝶效应,股市率先感受到了这股AI风暴的冲击。

美东时间1月17日收盘,英伟达股价大跌16.86%,市值一夜之间蒸发5888.62亿美元(约合人民币4.27万亿元),创下美股历史上最大单日个股市值蒸发纪录。同时,博通、台积电、美光科技和AMD等芯片巨头也遭遇重创,市值大幅回落。面对股市的剧烈波动和DeepSeek的迅猛发展,英伟达向21世纪经济报道记者回应称,DeepSeek是一项卓越的人工智能进展,展示了如何运用广泛可用的模型和合规的算力创建新模型,GPU仍有大量需求。

值得注意的是,此次股价暴跌主要集中在AI算力板块,而互联网等软件大厂则微跌甚至有所上涨。这反映出AI要素三角——算法、算力、数据中,算力正面临价值重估的挑战。DeepSeek在算力制约下,通过算法进化和高质量数据,一定程度上冲击了芯片巨头们的算力壁垒。

DeepSeek的崛起,不仅体现在其效率和成本上的突破,更在于其引发的行业变革。其R1模型的训练成本远低于同类模型,API定价也极具竞争力。这一成功,不仅削弱了英伟达等AI芯片需求的预期,也引发了业界对算力巨额投资的质疑。DeepSeek戳破了大模型高成本的现状,算力的比重和角色正在发生变化。

然而,这并不意味着算力从此一文不值。长期来看,AI应用的爆发仍需要算力支持。当前,美股科技巨头们仍在算力军备竞赛中激烈角逐。美国最新公布的“星际之门”AI基础设施计划,由OpenAI、软银和甲骨文等公司合作开展,计划在未来4年内筹集5000亿美元用于建设超大规模数据中心。微软、Meta等科技巨头也纷纷加大在AI基础设施上的投入。

DeepSeek的创新不仅体现在算力利用上,更在于其系统工程的优化。公司采用了MoE架构模型、MLA多层注意力架构、FP8混合精度训练框架等多项先进技术,在各个环节上进行工程化的创新升级,让效率持续上升。这些技术的应用,使得DeepSeek能够在不使用大量最尖端芯片的情况下,提供高计算性能的大模型。

DeepSeek的崛起,标志着AI技术从“规模优先”转向“效率优先”的新阶段。其低成本、高效率的模型开发方式,不仅降低了AI服务的总体成本,加速了AI在各行各业的渗透,还推动了算力价值的重估和软硬件体系的重构。同时,DeepSeek的成功也引发了开源与闭源生态的竞争加剧,开源模式因其灵活性和创新性受到更多关注。

作为AI界的新星,DeepSeek正在掀起一场效率革命。其现象级的爆发,不仅为AI市场注入了新的变量,也为行业带来了更多的可能性和挑战。随着AI技术的不断发展和创新,行业格局将被重塑,全球的AI战略投入和人才争夺也将更加激烈。

(配图:DeepSeek公司logo及其发布的AI模型相关图片)

(文章来源:21世纪经济报道)