AI导读:

随着大模型进入规模化应用阶段,行业大模型密集发布,但技术投入难持续,算力、数据成瓶颈。金融领域成为大模型落地重要领域,场景应用呼唤商业价值,行业大模型需提供端到端解决方案。

巨大技术投入的背后,核心目标始终聚焦于如何最大化地创造商业价值。随着大型模型步入规模化应用的新阶段,近期,多个行业巨头纷纷推出了自家的大模型产品。2024年12月底,百川智能正式推出了全链路增强的金融大模型Baichuan4-Finance,与此同时,中关村科金也发布了助大模型平台2.0版本,更早之前,奇富科技更是宣布已将大模型技术引入小微金融的应用场景中。

相较于巨头们在通用大模型领域的激烈竞争,针对特定场景的行业大模型则显得更为“接地气”。一位金融科技公司的高管在接受《中国经营报》采访时透露,2024年,许多云厂商都主动寻求与他们合作,因为他们在业务一线,拥有实际的应用场景,能够直接构建大模型产品并获取用户反馈。

中国工程院院士、清华大学计算机科学与技术系教授郑纬民在近期的一次采访中表示,通用大模型的数量并不需要太多,他认为全国有三四个就足够了。他强调,大模型未来的发展方向应更多聚焦于如何更好地应用,并构建更为完善的软件生态。

技术投入的持续性问题凸显

算力、算法、数据是驱动大模型发展的关键三要素。其中,算力与数据被业界普遍视为当前企业间的主要竞争壁垒。随着大语言模型规模的不断扩大,其参数甚至达到了万亿级别,这导致每次训练所需的资金、人力以及稳定的能源供应都变得越来越昂贵。

郑纬民教授指出,基础大模型需要巨大的计算量,包括大规模的显卡支持,以及计算和存储资源。然而,针对具体场景的行业模型则不需要如此庞大的计算量。他以一家知名的大模型创业公司为例,该公司的产品逻辑是依赖更多的数据、更大的模型和更长的上下文窗口来产生更好的输出效果。但这也带来了更高的推理负载,需要更多的推理卡,从而可能导致存储器超负荷,一旦使用流量激增,就可能引发宕机风险。据透露,这家公司曾连续购买了五次算力卡,但问题仍未得到解决。

对于大多数机构而言,这样的成本显然是难以承受的。据业内人士透露,大模型的开发过程包括训练和推理两个阶段,如果从训练阶段开始算起,整个成本确实非常巨大。不过,随着技术的不断进步,2024年的推理成本已经大幅降低。

数据问题则是制约大模型发展的另一大瓶颈。Epoch AI Research的研究预测显示,到2026年,现有的高质量语言数据将无法满足AI模型训练的需求。而信息技术分析公司Gartner的研究报告也指出,到2030年,合成数据将成为AI模型的主要训练数据来源。

市场普遍认为,大模型行业的发展已经告别了野蛮生长的阶段,正逐步进入精细化落地的阶段。郑纬民教授认为,人工智能进入大模型时代的两大标志是AI基础大模型从单模态向多模态的发展,以及大模型加速行业智能化升级。他预测,在大模型时代,将有三类企业脱颖而出:研发大模型的企业、推动大模型应用落地的企业,以及支持大模型计算系统的企业。

中关村科金总裁喻友平在接受采访时表示,市场真正需要的是能够回归商业本质的实用工具。他强调,行业大模型必须提供端到端的解决方案,帮助企业解决实际问题,并具备全链条的服务能力。

场景应用呼唤商业价值的实现

2024年11月,央行、国家发展改革委等联合发布了《推动数字金融高质量发展行动方案》,既强调了“强化数字技术支撑能力”以助力金融业数字化转型,也突出了“运用数字技术提升重点领域金融服务质效”的目标。这为金融机构在推动AI落地方面提供了强大的动力。

从领域来看,金融无疑是当前大模型落地的重要领域之一。恒生研究院的市场调研数据显示,2024年前三季度,我国公开披露的大模型项目中标总额达到了20.75亿元,较2023年全年增长了163%。其中,金融行业的大模型中标项目数量为66个,项目金额达1亿元,占比4.9%。而到了2024年1月至11月,金融行业的大模型中标项目数量更是达到了103个,项目金额增至2亿元。

虽然从绝对占比来看,金融行业在全行业中的占比并不算高。但由于金融行业对于技术和安全的标准要求更高,因此能够在金融领域应用的大模型能力,往往也具备向其他领域迁移的条件,即“向下兼容”。

前述金融科技公司高管透露,在制定2023年的OKR时,公司管理层就明确提出了要找到大模型在金融科技领域的最佳应用。

企业对于场景价值的认识已经达成了相当的共识。奇富科技首席算法科学家费浩峻表示,如果技术在大模型中的权重是40%,那么对于业务场景的理解和深耕则要达到60%。他强调,应用场景、数据飞轮、智能体是大模型产品的三个必要条件。

喻友平认为,“平台+应用+服务”的模式是企业大模型落地的最佳路径。他指出,大模型平台之间的差异主要体现在算力大小、模型响应速度,以及以智能体为代表的应用构建能力上。在智能体应用构建中,场景模板是最关键的因素之一。

如何理解这种场景价值?喻友平解释说,虽然方法论是通用的,但数据和行业场景并不通用。例如,保险销售和财富产品销售的外呼场景就不能通用,因为它们的流程不同。即使是营销外呼,也可以衍生出多种场景,每个行业的需求也各不相同。

然而,在一定条件下,这种场景能力是有可能实现迁移的,尤其是在营销获客方面。喻友平举例说,只要将某个行业的垂直场景数据和知识提取出来,并注入到相关行业的大模型中,一旦模型训练完成,就可以在另一个领域继续使用,从而实现标准化。这种能力迁移和标准化的可能性,为大模型在不同行业中的应用提供了广阔的前景。

目前来看,大模型在金融行业实际生产中的主要用途包括内部赋能、客服、外呼、获客等业务环节。据喻友平透露,以智能营销场景的大模型外呼为例,公司在某家装平台的活动营销转化率达到了3.5%,相比传统AI外呼大幅提升了130%,与人工座席相比也仅有17%的差距。在智能运营环节,大模型在金融场景业务中可以实现综合线索留资率提升19.8%。

如何从降本增效逐步升级到高效提升业务核心收益,是当前面临的关键问题。费浩峻透露,目前他们已经将AI能力和金融大模型集成到新的信贷业务系统Focuspro2.0中,该系统既可以支持消费贷业务,也可以支持小微金融业务,并能够有效识别欺诈风险。

不过,也有业内人士透露,一些大模型在金融业务中的使用初期效果良好,但随着迭代次数增加,效果出现了不稳定的情况。这就需要深入一线与业务团队进行持续沟通,这也是需要不断加强的领域。

(文章来源:中国经营报)