大模型技术投入与商业价值创造

财经聚焦 2024-12-31 18:36:35 来源：中国经营报作者：网络

AI导读：

随着大模型进入规模化应用阶段，行业大模型密集发布，但技术投入难持续，算力、数据成瓶颈。金融领域成为大模型落地重要领域，场景应用呼唤商业价值，行业大模型需提供端到端解决方案。

巨大技术投入的背后，核心目标始终聚焦于如何最大化地创造商业价值。随着大型模型步入规模化应用的新阶段，近期，多个行业巨头纷纷推出了自家的大模型产品。2024年12月底，百川智能正式推出了全链路增强的金融大模型Baichuan4-Finance，与此同时，中关村科金也发布了助大模型平台2.0版本，更早之前，奇富科技更是宣布已将大模型技术引入小微金融的应用场景中。

相较于巨头们在通用大模型领域的激烈竞争，针对特定场景的行业大模型则显得更为“接地气”。一位金融科技公司的高管在接受《中国经营报》采访时透露，2024年，许多云厂商都主动寻求与他们合作，因为他们在业务一线，拥有实际的应用场景，能够直接构建大模型产品并获取用户反馈。

中国工程院院士、清华大学计算机科学与技术系教授郑纬民在近期的一次采访中表示，通用大模型的数量并不需要太多，他认为全国有三四个就足够了。他强调，大模型未来的发展方向应更多聚焦于如何更好地应用，并构建更为完善的软件生态。

技术投入的持续性问题凸显

算力、算法、数据是驱动大模型发展的关键三要素。其中，算力与数据被业界普遍视为当前企业间的主要竞争壁垒。随着大语言模型规模的不断扩大，其参数甚至达到了万亿级别，这导致每次训练所需的资金、人力以及稳定的能源供应都变得越来越昂贵。

郑纬民教授指出，基础大模型需要巨大的计算量，包括大规模的显卡支持，以及计算和存储资源。然而，针对具体场景的行业模型则不需要如此庞大的计算量。他以一家知名的大模型创业公司为例，该公司的产品逻辑是依赖更多的数据、更大的模型和更长的上下文窗口来产生更好的输出效果。但这也带来了更高的推理负载，需要更多的推理卡，从而可能导致存储器超负荷，一旦使用流量激增，就可能引发宕机风险。据透露，这家公司曾连续购买了五次算力卡，但问题仍未得到解决。

对于大多数机构而言，这样的成本显然是难以承受的。据业内人士透露，大模型的开发过程包括训练和推理两个阶段，如果从训练阶段开始算起，整个成本确实非常巨大。不过，随着技术的不断进步，2024年的推理成本已经大幅降低。

数据问题则是制约大模型发展的另一大瓶颈。Epoch AI Research的研究预测显示，到2026年，现有的高质量语言数据将无法满足AI模型训练的需求。而信息技术分析公司Gartner的研究报告也指出，到2030年，合成数据将成为AI模型的主要训练数据来源。

市场普遍认为，大模型行业的发展已经告别了野蛮生长的阶段，正逐步进入精细化落地的阶段。郑纬民教授认为，人工智能进入大模型时代的两大标志是AI基础大模型从单模态向多模态的发展，以及大模型加速行业智能化升级。他预测，在大模型时代，将有三类企业脱颖而出：研发大模型的企业、推动大模型应用落地的企业，以及支持大模型计算系统的企业。

中关村科金总裁喻友平在接受采访时表示，市场真正需要的是能够回归商业本质的实用工具。他强调，行业大模型必须提供端到端的解决方案，帮助企业解决实际问题，并具备全链条的服务能力。

场景应用呼唤商业价值的实现

2024年11月，央行、国家发展改革委等联合发布了《推动数字金融高质量发展行动方案》，既强调了“强化数字技术支撑能力”以助力金融业数字化转型，也突出了“运用数字技术提升重点领域金融服务质效”的目标。这为金融机构在推动AI落地方面提供了强大的动力。

从领域来看，金融无疑是当前大模型落地的重要领域之一。恒生研究院的市场调研数据显示，2024年前三季度，我国公开披露的大模型项目中标总额达到了20.75亿元，较2023年全年增长了163%。其中，金融行业的大模型中标项目数量为66个，项目金额达1亿元，占比4.9%。而到了2024年1月至11月，金融行业的大模型中标项目数量更是达到了103个，项目金额增至2亿元。

虽然从绝对占比来看，金融行业在全行业中的占比并不算高。但由于金融行业对于技术和安全的标准要求更高，因此能够在金融领域应用的大模型能力，往往也具备向其他领域迁移的条件，即“向下兼容”。

前述金融科技公司高管透露，在制定2023年的OKR时，公司管理层就明确提出了要找到大模型在金融科技领域的最佳应用。

企业对于场景价值的认识已经达成了相当的共识。奇富科技首席算法科学家费浩峻表示，如果技术在大模型中的权重是40%，那么对于业务场景的理解和深耕则要达到60%。他强调，应用场景、数据飞轮、智能体是大模型产品的三个必要条件。

喻友平认为，“平台+应用+服务”的模式是企业大模型落地的最佳路径。他指出，大模型平台之间的差异主要体现在算力大小、模型响应速度，以及以智能体为代表的应用构建能力上。在智能体应用构建中，场景模板是最关键的因素之一。

如何理解这种场景价值？喻友平解释说，虽然方法论是通用的，但数据和行业场景并不通用。例如，保险销售和财富产品销售的外呼场景就不能通用，因为它们的流程不同。即使是营销外呼，也可以衍生出多种场景，每个行业的需求也各不相同。

然而，在一定条件下，这种场景能力是有可能实现迁移的，尤其是在营销获客方面。喻友平举例说，只要将某个行业的垂直场景数据和知识提取出来，并注入到相关行业的大模型中，一旦模型训练完成，就可以在另一个领域继续使用，从而实现标准化。这种能力迁移和标准化的可能性，为大模型在不同行业中的应用提供了广阔的前景。

目前来看，大模型在金融行业实际生产中的主要用途包括内部赋能、客服、外呼、获客等业务环节。据喻友平透露，以智能营销场景的大模型外呼为例，公司在某家装平台的活动营销转化率达到了3.5%，相比传统AI外呼大幅提升了130%，与人工座席相比也仅有17%的差距。在智能运营环节，大模型在金融场景业务中可以实现综合线索留资率提升19.8%。

如何从降本增效逐步升级到高效提升业务核心收益，是当前面临的关键问题。费浩峻透露，目前他们已经将AI能力和金融大模型集成到新的信贷业务系统Focuspro2.0中，该系统既可以支持消费贷业务，也可以支持小微金融业务，并能够有效识别欺诈风险。

不过，也有业内人士透露，一些大模型在金融业务中的使用初期效果良好，但随着迭代次数增加，效果出现了不稳定的情况。这就需要深入一线与业务团队进行持续沟通，这也是需要不断加强的领域。

（文章来源：中国经营报）

郑重声明：以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息，本站对其观点、判断保持中立，不保证该内容（包括但不限于文字、数据及图表）全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议，据此操作，风险自担。股市有风险，投资需谨慎。如对该内容存在异议，或发现违法及不良信息，请发送邮件至yxiu_cn@foxmail.com，我们将安排核实处理。