AI导读:

随着大模型进入规模化落地应用阶段,近期多个行业大模型密集发布。金融行业成为大模型落地的重要领域,但技术大投入和数据瓶颈仍需解决。行业大模型需提供端到端解决方案,场景应用呼唤商业价值。

巨大技术投入的最终目标依然是探索商业价值的最大化。随着大型语言模型步入规模化落地应用的崭新阶段,近期,行业内涌现出了一批大模型的密集发布。2024年12月底,百川智能推出了全链路领域增强的金融大模型Baichuan4-Finance,与此同时,中关村科金也推出了助大模型平台2.0,更早之前,奇富科技宣布已将大模型引入小微金融场景,进一步推动了技术的实际应用。

相较于巨头在通用大模型领域的算力与技术竞争,特定场景下的行业大模型显然更加贴近市场需求。一位金融科技公司高管在接受《中国经营报》记者采访时表示,2024年,众多云厂商主动寻求合作,因为他们在业务一线,拥有真实场景,能够直接构建大模型产品并获取用户反馈。

中国工程院院士、清华大学计算机科学与技术系教授郑纬民在接受记者采访时指出,通用大模型的数量并不需要过多,全国拥有三四个便足够。大模型未来的发展方向应更加注重实际应用,并构建更加完善的软件生态。

技术大投入面临可持续性挑战

算力、算法、数据是大型语言模型发展的三大核心要素。其中,算力和数据被认为是现阶段企业间的主要壁垒。随着大模型对落地效果的追求日益增强,算力和数据的高投入问题愈发凸显。

在算力方面,随着大语言模型规模的不断扩大,参数量甚至达到万亿级别,进行一次训练所需的资金、人力和稳定性能源成本急剧上升。郑纬民教授指出,基础大模型需要巨大的计算量,而具体场景下的行业模型则无需如此庞大的计算资源。

他举例一家知名大模型创业公司,其产品逻辑在于通过更多的数据、更大的模型和更长的上下文窗口来获得更好的输出效果。然而,更高的推理负载意味着需要更多的推理卡,这导致存储器超负荷,一旦使用流量激增,就可能引发宕机风险。据透露,该公司曾连续购买五次算力卡,但问题仍未得到解决。

这一成本显然让绝大多数机构难以承受。据业内了解,大模型的开发包括训练和推理两个阶段,从训练开始,整个成本确实非常巨大。尽管有机构人士透露,2023年推理成本仍然较高,但随着技术的迭代,2024年推理成本已大幅降低。

数据问题则是另一大制约因素。Epoch AI Research的研究预测显示,到2026年,现存的用于AI模型训练的高质量语言数据将枯竭。信息技术分析公司Gartner的研究报告也指出,到2030年,合成数据将成为AI模型的主要训练数据来源。

市场普遍认为,大模型行业的发展已告别狂热状态,正步入精细化落地的实质性阶段。

郑纬民教授认为,人工智能进入大模型时代的两大特点是AI基础大模型从单模态向多模态发展,以及大模型加速行业智能化升级。他预测,在大模型时代,三类企业将脱颖而出:研发大模型的企业、推动大模型应用落地的企业,以及支持大模型计算系统的企业。

其中,行业大模型公司属于第二类。

中关村科金总裁喻友平在接受记者采访时表示,市场真正需要的是能够回归商业本质的实用工具。行业大模型必须提供端到端的解决方案,帮助企业解决实际问题,并具备全链条的服务能力。

场景应用亟需实现商业价值

2024年11月,央行、国家发展改革委等联合发布了《推动数字金融高质量发展行动方案》,既强调了“强化数字技术支撑能力”以助力金融业数字化转型,也突出了“运用数字技术提升重点领域金融服务质效”。这为金融机构在推动AI落地上提供了强大动力。

从领域来看,金融无疑是当前大模型落地的重要领域之一。恒生研究院的市场调研数据显示,2024年前三季度,我国公开披露的大模型项目中标总额达到20.75亿元,较2023年全年增长163%。其中,金融行业的大模型中标项目数量为66个,项目金额达1亿元,占比4.9%。而2024年1月至11月,金融行业的大模型中标项目数量增至103个,项目金额也提升至2亿元。

虽然从绝对占比来看,金融行业在全行业中的占比并不算高。但由于金融相较于其他行业对技术和安全的标准更为严格,因此,能够在金融领域应用的大模型能力,往往具备向其他领域迁移的条件,即“向下兼容”。

前述金融科技公司高管透露,在制定2023年的OKR时,公司管理层明确指出要找到大模型在金融科技领域的最佳应用。

企业对于场景价值的认识已达成共识。奇富科技首席算法科学家费浩峻表示,如果技术在大模型中的权重是40%,那么对业务场景的理解和深耕则要达到60%。应用场景、数据飞轮、智能体是大模型产品的三个必要条件。

在喻友平看来,“平台+应用+服务”的模式是企业大模型落地的最佳路径。他指出,大模型平台之间的差异主要体现在算力大小、模型响应速度以及以智能体为代表的应用构建能力上。在智能体应用构建中,场景模板是最关键的因素之一。

如何理解这种场景价值?喻友平解释说,虽然方法论是通用的,但数据和行业场景并不通用。例如,保险销售和财富产品销售的外呼场景就不能通用,因为它们的流程不同。即使是营销外呼,也可以衍生出多种场景,每个行业的需求也各不相同。

在一定条件下,这种场景能力有望实现迁移,尤其是在营销获客方面。喻友平举例说,只要将某个行业的垂直场景数据和知识提取出来,并注入相关行业大模型中,一旦模型训练完成,就可以在另一个领域继续使用,从而实现标准化。这种能力迁移和标准化的可能性,为大模型在不同行业中的应用提供了广阔的空间。

目前,大模型在金融行业实际生产中的主要用途包括内部赋能以及客服、外呼、获客等业务环节。据喻友平透露,以智能营销场景的大模型外呼为例,公司在某家装平台的活动营销转化率达到了3.5%,相比传统AI外呼大幅提升130%,与人工座席相比仅有17%的差距。在智能运营环节,大模型在金融场景业务中可以实现综合线索留资率提升19.8%。

如何从降本增效逐步升级到高效提升业务核心收益成为关键。费浩峻透露,目前已将AI能力和金融大模型集成到新的信贷业务系统Focuspro2.0中,该系统既可以支持消费贷业务,也可以支持小微金融业务,能够较好地识别欺诈风险。

然而,也有业内人士透露,一些大模型在金融业务中使用后,初期效果尚可,但随着迭代次数增多,效果出现了不稳定。这就需要深入一线与业务团队不断沟通,这些方面都需要持续强化。

(文章来源:中国经营报)