AI导读:

2024年大模型领域关键词包括GPT-o1、Token价格战与落地应用。行业在Scaling Law上产生分歧,但GPT-o1的推出成为关键。同时,Token价格战降低了大模型使用成本,推动了更多应用落地。行业共识是,大模型在数据语料上遇到瓶颈,但中国AI应用渗透率有望加速。

  大模型领域在2024年的关键词涵盖了视频模型Sora、推理模型GPT-o1、Token价格战以及多样化的落地应用。

  枫清科技(Fabarta)创始人高雪峰观察到,2023年市场对大模型的落地关注度不高,主要聚焦于新版本和更大参数的推出。然而,2024年风向转变,企业开始意识到大模型的实际应用价值,更多客户愿意合作。

  行业在Scaling Law(尺度定律)上产生分歧,大规模预训练的成本高昂且投入产出比不确定,同时关于预训练“撞墙”、大模型放缓的讨论增多。OpenAI前首席科学家伊利亚·苏茨克维尔表示,简单增加数据和计算能力扩大模型规模的时代已结束。

  关于大模型是否放缓,行业意见不一。跬智信息(Kyligence)联合创始人兼CTO李扬认为,大模型能力放缓是不争的事实,但突破性进展可能仍在酝酿。金沙江创投主管合伙人朱啸虎也指出GPT-5的推出存在不确定性。然而,MiniMax副总裁刘华表示,2024年大模型仍在飞速发展,技术未见上限。

  行业共识是,大模型在数据语料上遇到瓶颈,互联网上的人类语料已接近耗尽。业界开始尝试使用合成数据应对这一挑战,但效果尚不确定。瑞银证券中国科技软件分析师张维璇认为,未来post-training阶段将成为新金矿。

  在速度放缓的争论中,GPT-o1的推出成为关键。该模型擅长处理复杂推理任务,尤其在STEM领域表现优异。有人认为这是迭代放缓的信号,也有人认为这标志着Scaling Law在大模型推理侧继续有效。

  高雪峰表示,GPT-o1验证了行业发展趋势,即在推理与概率预测技术体系上向更加综合和平衡的方向转移。月之暗面创始人杨植麟也提到,大模型范式将发生变化,从预测下一个词到强化学习,让AI具备思考能力。

  在具体应用上,大模型需要具备可解释性、推理能力,以及减少幻觉,叠加数据能力以解决生产力问题。国内众多厂商和机构也在年底发布数学推理模型,包括阿里通义、DeepSeek等。

  然而,360集团创始人周鸿祎指出,推理模型可能存在问题,如跨专业学科表现不一。他认为,通用AGI可能是伪命题,AI应走专业化道路。

  2024年被视为AI落地元年,但高雪峰认为这是行业精准场景与人工智能技术融合的元年。企业正在经历从以模型为中心向以数据为中心的转型,更多处理本地数据,结合模型能力赋能AI应用。

  刘华表示,大模型应用今年拓宽,从只会写文章的“文科生”变成能力全面的模型。在B端和C端,大模型催生了一些好产品,如音乐、视频模型用于广告制作,智能体在保险领域提供服务等。

  今年大模型落地背后有两个重要助推因素:Token价格战和“AI+”写入《政府工作报告》。价格战降低了大模型使用成本,带动了更多应用落地。而“AI+”写入报告则代表了各行业龙头企业要做AI转型,为AI应用提供了巨大机会。

  瑞银证券认为,中国AI长期发展潜力被低估,AI应用渗透率有望从明年起加速。中国国产大模型厂商性能已接近GPT-4水平,在垂直应用领域准确度不断加强。同时,中国有活跃的AI开源社区、开发者以及广泛的应用场景。

  张维璇观察到,中国前十大C端AI移动应用月活超过一亿,大模型的API日均调用量增长了8倍。她认为,接下来PaaS层软件厂商将受益,包括数据工具提供商、AI应用性能检测、安全服务提供商等。