AI导读:

随着大型模型进入规模化落地应用阶段,近期行业内涌现出一批密集发布的大模型,探索在金融领域等特定场景下的商业价值,同时面临算力、数据等壁垒。

巨大技术投入的尽头,仍是探索如何创造更多的商业价值。随着大型模型进入规模化落地应用的新阶段,近期,行业内涌现出了一批密集发布的大模型。2024年12月底,百川智能推出了全链路领域增强的金融大模型Baichuan4-Finance,与此同时,中关村科金也推出了助大模型平台2.0,更早之前,奇富科技已宣布将大模型引入小微金融场景。

相较于巨头们在通用大模型领域的算力与技术竞争,特定场景下的行业大模型显然更具“接地气”的特点。2024年,众多云厂商纷纷寻求与一线业务场景紧密结合,以期通过构建大模型产品并直接获取用户反馈来推动发展。中国工程院院士、清华大学计算机科学与技术系教授郑纬民指出,通用大模型的数量并不需要过多,全国有三四个便足够。大模型未来的发展方向在于如何更好地应用,并构建更加完善的软件生态。

算力、算法、数据是大型模型发展的关键三要素,其中,算力和数据被行业普遍视为现阶段企业间的主要壁垒。随着大型语言模型规模的不断扩大,参数甚至达到万亿级别,进行一次训练所需的资金、人力和稳定性能源成本愈发高昂。郑纬民教授表示,基础大模型需要巨大的计算量,包括大规模的显卡、计算和存储资源,而具体场景下的行业模型则无需如此庞大的计算量。

以某知名大模型创业公司为例,其产品逻辑在于通过更多的数据、更大的模型和更长的上下文窗口来提高输出效果。然而,更高的推理负载意味着需要更多的推理卡,这可能导致存储器超负荷,一旦流量激增,就可能带来宕机的风险。据透露,该公司曾连续购买五次算力卡,但并未解决这一问题。这一成本对于绝大多数机构而言显然是难以承受的。业内人士透露,大模型的训练和推理环节成本高昂,但随着技术的迭代,2024年推理的成本已显著降低。

数据问题则是另一大瓶颈。Epoch AI Research的研究预测显示,到2026年,现存的用于AI模型训练的高质量语言数据将耗尽。信息技术分析公司Gartner的研究报告也指出,到2030年,合成数据将成为AI模型的主要训练数据来源。市场普遍认为,大模型行业的发展已逐渐从狂飙状态进入精细化落地的阶段。

郑纬民认为,人工智能进入大模型时代的两大特点是AI基础大模型从单模态向多模态发展,以及大模型加速行业智能化升级。他预计,在大模型时代,三类企业将脱颖而出:研发大模型的企业、推动大模型应用落地的企业,以及支持大模型计算系统的企业。其中,行业大模型公司属于第二类。

中关村科金总裁喻友平表示,市场真正需要的是能够回归商业本质的实用工具。行业大模型必须提供端到端的解决方案,帮助企业解决实际问题,并具备全链条的服务能力。随着央行、国家发展改革委等联合印发《推动数字金融高质量发展行动方案》,金融机构在推动AI落地上也有了强烈的动力。

从领域来看,金融是当前大模型落地的一个重要领域。恒生研究院的市场调研数据显示,2024年前三季度,我国公开披露的大模型项目中标总额达到20.75亿元,较2023年全年增长163%。其中,金融行业的大模型中标项目数量为66个,项目金额达1亿元,占比4.9%。2024年1月至11月,金融行业的大模型中标项目数量增至103个,项目金额增至2亿元。虽然金融行业在全行业中的占比不算高,但由于其对技术和安全的标准较高,因此能够在金融领域应用的大模型能力,往往具备向其他领域迁移的条件。

金融科技公司高管透露,在2023年制定目标时,公司管理层已明确指出要找到大模型在金融科技领域的最佳应用。奇富科技首席算法科学家费浩峻也表示,如果技术在大模型中的权重是40%,那么对业务场景的理解和深耕则要达到60%。应用场景、数据飞轮、智能体是大模型产品的三个必要条件。喻友平认为,“平台+应用+服务”的模式是企业大模型落地的最佳路径。大模型平台之间的差异主要体现在算力大小、模型响应速度以及以智能体为代表的应用构建能力上。在智能体应用构建中,场景模板是最关键的因素之一。

对于场景价值和知识能力的理解,虽然方法论是通用的,但数据和行业场景并不通用。例如,保险销售和财富产品销售的外呼场景就不能通用,因为它们的流程不同。在一定条件下,这种场景能力有可能实现迁移,尤其是在营销获客方面。喻友平举例说,只要将某个行业的垂直场景数据和知识提取出来,并注入相关行业大模型中,一旦模型训练完成,就可以在另一个领域继续使用,从而实现标准化。这种能力迁移和标准化的可能性,为大模型在不同行业中的应用提供了广阔的前景。

目前,大模型在金融行业实际生产中的主要用途包括内部赋能以及客服、外呼、获客等业务环节。以智能营销场景的大模型外呼为例,中关村科金在某家装平台活动营销中的转化率达到了3.5%,相比传统AI外呼大幅提升130%,与人工座席相比仅有17%的差距。在智能运营环节,金融场景业务中可以实现综合线索留资率提升19.8%。如何从降本增效逐步升级到高效提升业务核心收益是关键。费浩峻透露,目前已将AI能力和金融大模型集成到新的信贷业务系统Focuspro2.0中,该系统既可以支持消费贷业务,也可以支持小微金融业务,能够较好地识别欺诈风险。

然而,也有业内人士透露,一些大模型在金融业务中刚开始使用时效果还不错,但随着迭代次数增多,效果出现了不稳定的情况。因此,需要深入一线与业务团队不断沟通,持续强化相关领域的发展。

(文章来源:中国经营报)