AI导读:

岁末年初,国内外主流大模型市场迎来新一轮降价潮,行业开始反思优化路径。DeepSeek等公司推出低成本高性能大模型,引发行业热议。效率成为关键词,同时创业公司面临降价冲击,需差异化发展以赢得市场份额。

岁末年初,国内外主流大模型市场迎来新一轮降价潮,这一变化促使行业开始深入反思:是否一味追求更大的算力集群和更多的数据量,才是大模型优化的唯一路径。业界普遍认为,在与互联网大厂的激烈价格比拼中,创业公司亟需探索一条差异化的发展道路。

效率,已成为当前大模型行业的关键词。近日,杭州深度求索人工智能基础技术研究有限公司(DeepSeek)推出的新一代大模型DeepSeek-V3,凭借其极低的训练成本引发了行业的广泛关注。据其发布的技术报告显示,从预训练、上下文长度外推到后训练,DeepSeek-V3的完整训练仅需2.788M H800 GPU小时。若以每GPU小时2美元的租金计算,其总训练成本仅为557万美元。然而,值得注意的是,这一成本并未包含与架构、算法或数据相关的先前研究及精简实验的成本。相比之下,美国人工智能公司Anthropic的CEO达里奥·阿莫迪曾透露,类似GPT-4o的模型训练成本高达约1亿美元,这意味着DeepSeek-V3的成本仅为GPT-4o的1/20。

在降低训练成本的同时,DeepSeek-V3仍保持了高性能。据其公告显示,DeepSeek-V3在多项评测中均表现出色,其性能与世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不相上下。这一成就的背后,是DeepSeek-V3从端到端进行的工程优化,包括模型架构、基础设施优化和数据优化等多个方面。

Gartner研究总监闫斌指出,大模型进入公众视野的时间尚短,仅两年多。在此期间,行业模型训练相对粗放,主要通过尽量多收集数据、建设更大的数据中心以获得更好的训练结果。这一过程被总结为“Scaling Law”。然而,DeepSeek-V3证明了通过更好的工程化能力,即使使用相对较少的算力资源和较小的模型,也能达到不错的训练效果。闫斌认为,目前行业在数据和算法方面仍有优化空间,低成本的训练和高效推理应用或将成为下一阶段大模型发展的方向之一。

此外,伯克利大学NovaSky团队也发布了Sky-T1-32B-Preview开源模型,在常见的推理和编码基准测试中与OpenAI的o1-preview平分秋色。据称,其训练成本不到450美元,展示了以经济高效的方式复制高水平推理能力的可能性。NovaSky团队能够实现如此低成本的模型训练,关键在于其使用了数据筛选机制,并选择了合适的基础模型进行训练。这一项目再次证明,高水平AI研发并不需要天价预算。

瑞银证券中国软件分析师张维璇表示,效率将是2025年大模型行业的关键词之一。她认为,除了少数公司有能力继续追求顶级大模型外,大多数公司未来将致力于降本增效。优化注意力机制、采用MOE架构、降低模型激活的参数量等已成为主流的降本方式。这将有助于降低AI门槛并推动技术的普及化。

伴随着训练成本的降低,DeepSeek-V3的API价格也进行了调整。目前,其价格为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。同时,DeepSeek还提供了45天的优惠价格体验期,在2025年2月8日之前,所有用户使用DeepSeek-V3 API的价格均有所下降。这一举措无疑将进一步吸引更多企业使用新的技术。

事实上,自2024年上半年以来,中国大模型市场就掀起了价格竞争的浪潮。DeepSeek率先宣布降价后,智谱AI、火山引擎、阿里云、百度、科大讯飞、腾讯云等国内主要大模型厂商迅速跟进。到2024年年底,除了DeepSeek-V3新版本的推出以及API价格调整外,国内其他大模型厂商也在纷纷降价。

然而,在价格竞争的同时,大模型创业公司也面临着巨大的挑战。MiniMax副总裁刘华表示,大模型的不断降价虽然有利于吸引更多企业使用新的技术,为大模型创业公司提供了更大的市场,但同时也构成了挑战。创业公司需要不断优化算法,快速降低模型的推理成本,才能赢得市场份额。他建议大模型创业公司可以聚焦在提供个性化服务上,比如提供情感类大模型的API接口。

经过一年多来的行业竞争,中国人工智能大模型的市场格局逐渐清晰。主要玩家从“百模大战”时代不断收敛至十来家。其中,MiniMax、智谱AI、百川智能、月之暗面、阶跃星辰、零一万物等6家行业“独角兽”企业估值均超10亿美元,被行业称为国内“大模型六小虎”。然而,这些“独角兽”也开始出现分化,已有企业出现“掉队”势头。这反映出大模型行业发展遇到了瓶颈。

从B端应用来看,Gartner的最新调研结果显示,截至2024年6月,仅有8%的中国企业将生成式人工智能部署在生产环境中。闫斌解释称,目前大模型在中国企业生产场景中的小规模落地已出现,但大规模企业落地仍然较为少见。他认为,大模型能力、数据、工程化、产品设计将是影响最终落地应用的关键因素。而在C端应用方面,虽然用户量排名靠前的应用如抖音的豆包、MiniMax的Talkie AI等已经拥有了一定的市场份额,但整体来看,国内大模型企业的C端产品仍存在“同质化”的问题。

与创业“独角兽”相比,“大厂”在C端应用推广上展示出了流量和资本方面的巨大优势。以字节为例,其2024年5月推出的AI对话助手“豆包”凭借投流买量后来居上,成为过去半年增长最快的移动应用。然而,随着“大厂”的下场,创业公司通过投流买量迅速扩大用户量的做法已不再划算。因此,创业公司需要更加聚焦于技术和产品的创新,以满足客户尚未被满足的需求。