行业大模型:算力与数据壁垒下的精细化落地
AI导读:
随着大模型进入规模化落地应用阶段,行业大模型密集发布。算力、算法、数据成为关键三要素,其中算力和数据壁垒尤为突出。市场共识在于,大模型行业已进入精细化落地进程,如何创造商业价值成为关键。
巨大技术投入的尽头仍是如何创造商业价值。随着大模型进入规模化落地应用阶段,近期,一波行业大模型密集扎堆发布。2024年12月底,百川智能推出全链路领域增强金融大模型Baichuan4-Finance,中关村科金同期推出助大模型平台2.0,更早前,奇富科技披露已将大模型引入小微金融场景。这些行业大模型相较于巨头在通用大模型领域的算力与技术厮杀,显得更为接地气。
一位金融科技公司高管透露,2024年有很多云厂商找到他们,因为他们在一线,有业务场景,可以直接构建大模型产品并得到用户反馈。中国工程院院士、清华大学计算机科学与技术系教授郑纬民也表示,通用大模型不需要太多,全国有三四个就够了,下一步发展关键在于如何有更好的应用,并构建更好的软件生态。
算力、算法、数据是大模型发展的关键三要素。其中,算力和数据被行业普遍认为是现阶段企业间的最大壁垒。随着大语言模型规模越来越大,参数高达万亿级别,动用一次训练所需的资金、人力和稳定性能源愈发昂贵。郑纬民指出,基础大模型需要极大的计算量,而具体场景上的行业模型则不需要这样的计算量。
他以一家知名大模型创业公司为例,该公司产品逻辑在于数据更多、模型更大、更长的上下文窗口,带来更好的输出效果。但更高的推理负载意味着更多的推理卡,使用流量一旦激增,就有可能带来宕机风险。据透露,该公司此前连续买了五次算力卡都没有解决这个问题。此外,数据问题也是一大瓶颈,Epoch AI Research研究预测,到2026年,现存的高质量语言数据将耗尽。
市场共识在于,大模型行业的发展已不再是狂飙状态,而是真正进入精细化落地的进程中。郑纬民认为,人工智能进入大模型时代的两大特点是AI基础大模型从单模态向多模态发展,以及大模型加速行业智能化升级。中关村科金总裁喻友平表示,市场真正需要的是能够回归商业本质的实用工具,行业大模型必须提供端到端的解决方案,帮助企业解决实际问题,并具备全链条的服务能力。
2024年11月,央行、国家发展改革委等联合印发《推动数字金融高质量发展行动方案》,既提到“强化数字技术支撑能力”以助力金融业数字化转型,也突出要“运用数字技术提升重点领域金融服务质效”。这也使金融机构在推动AI落地上有了强烈动力。恒生研究院市场调研数据显示,2024年前三季度,我国公开披露的大模型项目中标总额达到20.75亿元,金融行业的大模型中标项目数量为66个,项目金额达1亿元。
虽然金融行业在全行业占比不算高,但由于其对技术和安全的标准更高,因此能够在金融领域应用的大模型能力,往往具备向其他领域迁移的条件。企业侧对于场景的价值已有相当共识,奇富科技首席算法科学家费浩峻表示,如果技术对于大模型的权重是40%,对于业务场景的理解和深耕则要达到60%。喻友平认为,“平台+应用+服务”的模式是企业大模型落地的最佳路径,大模型平台之间的差异主要体现在算力大小、模型响应速度,以及以智能体为代表的应用构建能力。
这种场景能力在一定条件下有可能实现迁移,尤其是在营销获客方面。喻友平举例说,只要将某个行业的垂直场景数据和知识提取出来,并注入相关行业大模型中,一旦模型训练完成,就可以在另一个领域继续使用,从而实现标准化。目前,大模型在金融行业实际生产中的主要用途为内部赋能以及客服、外呼、获客等业务环节。以智能营销场景的大模型外呼为例,公司在某家装平台活动营销转化率达到了3.5%,对比传统AI外呼大幅提升130%。
如何从降本增效逐步升级到高效提升业务核心收益是关键。费浩峻透露,目前已经将AI能力和金融大模型集成到新的信贷业务系统Focuspro2.0当中,既可以支持消费贷业务,也可以支持小微金融的业务,做到较好识别欺诈风险。但也有业内人士透露,一些大模型在金融业务里使用后刚开始效果还不错,但随着迭代次数增多,效果出现了不稳定。
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。