AI导读:

随着大型模型进入规模化应用阶段,行业大型模型密集发布,强调特定场景应用的重要性。算力、数据成为壁垒,场景应用呼唤商业价值的实现,金融行业成为重要应用领域。

巨大技术投入的尽头,关键在于如何将这些投入转化为实际的商业价值。随着大型模型步入规模化应用的新阶段,近期,行业内涌现出一波大型模型的密集发布。2024年12月底,百川智能推出了全链路增强的金融大型模型Baichuan4-Finance,与此同时,中关村科金也发布了助大模型平台2.0,更早之前,奇富科技已宣布将大型模型引入小微金融场景。

相较于巨头们在通用大型模型领域的算力与技术竞争,针对特定场景的行业大型模型显然更加“接地气”。一位金融科技公司高管透露,2024年,许多云厂商主动寻求合作,因为他们在业务一线,拥有实际应用场景,能够直接构建大型模型产品并获取用户反馈。

中国工程院院士、清华大学计算机科学与技术系教授郑纬民近期表示,通用大型模型并不需要太多,全国有三四个就足够了。大型模型未来的发展方向在于如何更好地应用,并构建更加完善的软件生态。

技术投入难以持续高昂

算力、算法、数据是大型模型发展的三大核心要素。其中,算力和数据被普遍认为是当前企业间的主要壁垒。随着大型语言模型规模的不断扩大,参数甚至达到万亿级别,进行一次训练所需的资金、人力和稳定能源成本愈发高昂。

郑纬民指出,基础大型模型需要巨大的计算量,包括大规模的显卡、计算和存储需求,而针对具体场景的行业模型则不需要如此庞大的计算量。他举例一家知名大型模型创业公司,其产品逻辑在于通过更多的数据、更大的模型和更长的上下文窗口来提高输出效果。然而,更高的推理负载意味着需要更多的推理卡,这可能导致存储器超负荷,一旦使用流量激增,就可能引发宕机风险。该公司曾连续购买五次算力卡,但问题仍未得到解决。

据业内人士透露,大型模型的环节分为训练和推理,从训练开始,整个成本确实很大。尽管推理成本在2023年仍然较高,但随着技术的迭代,2024年的推理成本已经大幅降低。

数据问题则是另一大挑战。Epoch AI Research的研究预测显示,到2026年,现有的用于AI模型训练的高质量语言数据将耗尽。信息技术分析公司Gartner的研究报告也提到,到2030年,合成数据将成为AI模型的主要训练数据来源。

市场普遍认为,大型模型行业的发展已不再处于狂飙突进的状态,而是真正进入了精细化落地的阶段。

郑纬民认为,人工智能进入大型模型时代的两大特点是AI基础大型模型从单模态向多模态发展,以及大型模型加速行业智能化升级。在他看来,大型模型时代将有三类企业脱颖而出:研发大型模型的企业、推动大型模型应用落地的企业,以及支持大型模型计算系统的企业。

中关村科金总裁喻友平表示,市场真正需要的是能够回归商业本质的实用工具。行业大型模型必须提供端到端的解决方案,帮助企业解决实际问题,并具备全链条的服务能力。

场景应用呼唤商业价值的实现

2024年11月,央行、国家发展改革委等联合发布了《推动数字金融高质量发展行动方案》,既强调了“强化数字技术支撑能力”以助力金融业数字化转型,也突出了“运用数字技术提升重点领域金融服务质效”的重要性。这为金融机构在推动AI落地上提供了强大动力。

从领域来看,金融无疑是当前大型模型落地的一个重要领域。恒生研究院的市场调研数据显示,2024年前三季度,我国公开披露的大型模型项目中标总额达到20.75亿元,较2023年全年增长163%。其中,金融行业的大型模型中标项目数量为66个,项目金额达1亿元,占比4.9%。2024年1月至11月,金融行业的大型模型中标项目数量达到103个,项目金额增至2亿元。

虽然从绝对占比来看,金融行业在全行业中的比例并不算高。但由于金融相较于其他行业对技术和安全的标准更高,因此能够在金融领域应用的大型模型能力,往往具备向其他领域迁移的条件,即“向下兼容”。

前述金融科技公司高管透露,2023年制定目标时,公司管理层就明确提出了要找到大型模型在金融科技领域的最佳应用。

企业对于场景的价值已有深刻认识。奇富科技首席算法科学家费浩峻表示,如果技术对于大型模型的权重是40%,那么对于业务场景的理解和深耕则要达到60%。应用场景、数据飞轮、智能体是大型模型产品的三个必要条件。

在喻友平看来,“平台+应用+服务”的模式是企业大型模型落地的最佳路径。他指出,大型模型平台之间的差异主要体现在算力大小、模型的响应速度,以及以智能体为代表的应用构建能力。在智能体应用构建中,场景模板是最关键的因素之一。

对于场景价值和知识能力的理解,虽然方法论是通用的,但数据和行业场景并不通用。例如,保险销售和财富产品销售的外呼场景就不能通用,因为它们的流程不同。喻友平举例说,只要将某个行业的垂直场景数据和知识提取出来,并注入相关行业的大型模型中,一旦模型训练完成,就可以在另一个领域继续使用,从而实现标准化。这种能力迁移和标准化的可能性,为大型模型在不同行业中的应用提供了广阔的前景。

目前,大型模型在金融行业实际生产中的主要用途包括内部赋能以及客服、外呼、获客等业务环节。据喻友平透露,以智能营销场景的大型模型外呼为例,公司在某家装平台的活动营销转化率达到了3.5%,相比传统AI外呼大幅提升130%,与人工座席相比仅有17%的差距;在智能运营环节,大型模型在金融场景业务中可以实现综合线索留资率提升19.8%等。

如何从降本增效逐步升级到高效提升业务核心收益是当前的关键。费浩峻透露,目前已将AI能力和金融大型模型集成到新的信贷业务系统Focuspro2.0中,该系统既可以支持消费贷业务,也可以支持小微金融业务,能够较好地识别欺诈风险。

然而,也有业内人士透露,一些大型模型在金融业务中使用后,初期效果良好,但随着迭代次数增多,效果出现了不稳定。这要求深入一线与业务团队不断沟通,这些方面都是未来需要持续强化的领域。

(文章来源:中国经营报)