从全球顶级银行的最新AI前沿应用与案例,找到银行业生成式AI布局的启示
· 来源:轻金融 作者:李静瑕
拥有大规模、高质量数据的金融行业,被认为是生成式AI应用落地最有前景的行业之一。
NVIDIA(英伟达)《2024年金融服务业AI现状与趋势》调研报告显示,各个企业已经看到了AI的成效。68%的金融服务专业人士表示,AI提高了他们的运营效率,44%的受访者表示AI帮助企业改善了客户体验。
更为关键的是,生成式AI彻底改变金融机构的同时,正在提升行业的获利能力。
随着生成式AI的爆发,全球大型金融机构已经进行了积极的实践,具体的布局效果如何?从中又可以得到怎样的启示?
01
生成式AI来袭,金融巨头如何迎战?
不同于以往的新技术革命,生成式AI改变的不是某一个方面,而是深刻影响了各个行业的“游戏规则”。
同样重要的问题是,生成式AI将会在哪些金融领域爆发?
答案是重塑整个数字金融行业,包括市场、渠道、产品开发、客户服务等所有的领域。未来,生成式AI将无所不在,在金融行业的应用前景也将贯穿前中后台各个环节,每一条业务线、每个职能岗位都能找到相应的应用场景。
从一个个案例中,可以看到金融业“游戏规则”在改变。
“我们预测2025 年第四季度的央行利率是多少?”当银行使用者对Contextual AI平台提出问题时,Contextual AI将根据实际文件提供简短的解释和准确的答案,包括引用信息源的特定章节。
汇丰银行计划使用Contextual AI,通过检索并综合相关的市场展望、财经新闻和运营文件来提供研究洞察和流程指导支持。Contextual AI RAG 2.0 平台采用了NVIDIA的技术和大语言模型,适合在知识密集型金融服务场景中构建企业 AI 应用程序,可为寻求优化运营并提供新的生成式 AI 产品的金融服务企业带来准确、可审计的AI。
而其它金融机构也在利用 Contextual AI 的预制应用程序,涉及财务分析、政策合规报告生成、财务建议查询解析等等。
对内服务,是金融机构更快速、有安全保证地落地生成式AI的领域,其中,分析、研发、办公等对内赋能的场景是AI较快落地的。
曾经限制员工使用ChatGPT的摩根大通,2024年向员工推出了一款名为LLM Suite的聊天机器人,用于帮助撰写邮件和报告、分析数据、生成创意等,已经向6万多名员工提供服务。摩根大通计划每年在人工智能能力方面投入10亿美元以上。此外,德国商业银行(Commerzbank)通过 Code Assist 强大安全和合规功能来提高开发人员的效率。花旗银行也专门成立生成式AI工作组,向集团4万余名程序员推广使用等。
在短期内看,生成式AI用于降低金融机构的成本是可以快速有效部署的。但是,AI带来的深层次变革,要创造价值金融机构必然会加速向营销运营、客户服务、风险控制等业务领域部署,核心直指“创造利润,促进增长”。
对此,花旗银行一项调研数据显示,93%的金融机构预计人工智能将在未来五年内提高利润,预计到2028年,人工智能可以将银行业利润提高9%,即1700亿美元。可以说生成式AI用于金融机构业务增长领域,有着巨大的空间。
一些着眼于用AI推进未来的业务增长的金融机构,已经开启了长远布局。2024年,纽约梅隆银行成为全球首家部署由 NVIDIA DGX SuperPOD 提供支持的AI超级计算机的银行,以加速对AI的采用进程, 当前支持的部分功能包括存款预测、支付自动化、预测性交易分析和日终现金余额等。
“我们技术战略的关键在于通过可扩展且值得信赖的平台和解决方案为客户提供支持。通过部署NVIDIA AI超级计算机,我们可以提高处理能力,加快处理速度,通过创新和推出支持AI的功能来帮助我们管理、移动并保护客户资产的安全。”纽约梅隆银行首席信息官Bridget Engle表示。
这家已经成立240年的全球性金融服务公司,管理客户资产近50万亿美元。在去年的一次全公司测试中,发现了600多个AI带来的机遇,并且已经有数十个项目在使用 NVIDIA NeMo、NVIDIA Triton推理服务器和NVIDIA Base Command等NVIDIA AI Enterprise软件进行开发,涵盖了推理服务、加速AI开发、自定义生成式AI端到端平台等技术。
此前,据汇丰银行香港高管介绍,汇丰银行正在探索100多个生成式AI用例,以简化其服务并增强面向客户的功能。汇丰计划部署的Contextual AI也是使用NVIDIA Triton推理服务器和开源的NVIDIA TensorRT-LLM 库来加速和优化大语言模型的推理性能。
02
加速计算、加速推理,助力AI应用大爆发
尽管全球生成式AI当前仍处于起步阶段,然而全球金融机构卯足马力的布局势头,似乎生成式AI应用的爆发已是临门一脚。
Omdia发布的数据预测,全球生成式AI市场将从2024年的146亿美元增长到2029年的728亿美元,将在五年内增长五倍。而金融机构对AI应用的落地实施的趋势转变,或将AI应用推到了大爆发的临界点。
在技术上,“加速计算”、“加速推理”助力AI应用大爆发,也是最值得关注的看点。
首先,算力是AI发展的三大核心之一,且可能成为AI未来发展的最大制约。因此,在算力的技术上,各家金融机构都在寻求突破。
2023年年初,全球投资市场低迷,而米兰投资银行却表现出了较好的发展趋势,其背后的原因之一就是采用了GPU驱动的系统。在市场持续下跌的时间段里,米兰投资银行下跌的交易日只有十几个。
投资银行所提供的服务涉及到大量证券和衍生产品组合的计算密集型交易,高性能计算支撑尤为重要。这方面,米兰投资银行为其基础设施增加了几十颗GPU,而一颗GPU的算力是CPU的100倍,同时在GPU上实现了实时风险管理。
GPU加速计算,也在推动新兴的空间金融的蓬勃发展。通过利用来自遥感器和航空图像将地理空间数据转化为AI洞察,可以助力金融机构实现从风险评估到理赔流程的全面提速。
位于旧金山湾区的CrowdAI公司用 NVIDIA GPU进行训练和推理,使用深度学习工具,通过自动分析航空图像和视频来检测在自然灾害中受损或毁坏的资产,加快保险理赔流程。
有机构评价称,后台的加速计算已同金库的现金一样,逐渐成为了银行的刚需,也为金融机构装上“跑车引擎”。
其次,大模型的加速推理技术,也是生成式AI应用的落地又一强大推动力。
随着大语言模型的兴起,大模型在智能客服、智能营销、智能催收、智能投资顾问和合规审计等关键领域展现出了巨大的潜力。然而,在某些特定场景下,大语言模型的推理能力也面临着加速的挑战。
借助生成式 AI ,某国内股份行实现了客服类场景百亿级大模型应用推理加速。
该银行信用卡客户复杂账务咨询助手,聚焦于处理长时间跨度的复杂账务查询,旨在通过大模型卓越的工具调用能力,为客户提供高效、精确的账务咨询服务。
通过NVIDIA全栈解决方案加速LLM应用,其中使用TensorRT- LLM加速LLM推理、通过Triton 来加速模型Serving,在NVIDIA GPU上进行部署,模型的推理效率大幅提升,如平均输出速度提升两倍,输出耗时缩短近50%,吞吐量提高近3倍。此外,在系统链路上,直接将大模型工具调用的结果以固定模板的方式返回,复杂账务咨询助手从一开始的整个流程耗时9~10秒,到如今的2~3秒,实现了极大的效率提升。
推理加速的实现,不仅大幅缩短了客户等待时间,更是显著提升了服务的及时性和满意度。
第三,生成式 AI 广泛应用于银行反欺诈领域。
成立于2012年的欧洲新型银行Bunq,被称为“自由银行”,其通过应用程序在线处理用户的各种金融需求,而用户无需去线下网点。目前,Bunq拥有1200多万客户和价值80亿欧元的存款,是欧盟最大的新型银行之一。
网上银行的金融服务,一直面临金融欺诈和洗钱的威胁。传统的人工设定规则建立,算法标记可以交易的模式会消耗大量的人力且无法扩大覆盖规模。Bunq使用生成式AI来帮助检测欺诈和洗钱行为。
Bunq使用NVIDIA GPU,将其数据处理工作流的速度提高了5倍以上。还使用由 GPU 提供加速的开源 NVIDIA RAPIDS数据科学库套件,将其欺诈检测模型的训练速度较之前的方法提高了近100倍。
为了提升客户的金融服务效率和使用体验,Bunq还打造了面向Bunq客户的AI个人助手Finn。为了进一步提高 Finn 的准确性,该银行正在探索 NVIDIA NeMo Retriever 这个正处于早期体验阶段的生成式 AI 微服务集合。NeMo Retriever 作为 NVIDIA NIM 推理微服务的组成部分,以经过优化的容器提供模型,可与 NVIDIA AI Enterprise 一起使用。Bunq 正在深入可以加速企业的生成式AI应用开发与部署,努力挖掘 AI 在其各项业务中的潜力,以实现“让AI遍布银行”。
总部位于伦敦的NayaOne公司,提供了一个 AI 沙盒,允许客户在商业化部署之前安全地测试和验证 AI 应用程序。NayaOne的AI沙盒使用了NVIDIA NIM微服务,借助 NVIDIA 加速计算,其欺诈检测模型在处理大型数据集时,处理速度提升最多达10倍,基础设施成本最多降低了40%。这个数字沙盒还使用了开源的NVIDIA RAPIDS数据科学和AI库,用来加速资金流动应用中的欺诈检测和预防功能。
在诸多金融机构落地的案例中,可以看到生成式AI不但能够切实降低金融机构布局生成式AI的成本,提升效率,也成为了在面客、风控、核心业务等AI应用落地的加速器。
03
AI重塑金融服务,未来走向何方
当一家国际金融机构的数千名研发人员,其40%的工作由AI驱动,其工作效率有巨大的提高;当一家国际支付公司,结合一系列先进算法,实时检测全球客户交易,几毫秒内针即可对欺诈做出决策,提升风险防控能力与效率;在当一家保险公司通过自动分析航空图像和视频来检测在自然灾害中受损或毁坏的资产,大大加快保险理赔流程,其客户体验得到提升……
一个个案例背后,值得深刻思考的是,生成式AI究竟如何重塑未来的金融服务?
首先是对内赋能,生成式AI或在金融机构技术开发领域带来带来颠覆性变革。低代码、无代码的AI辅助助手,已经给技术开发带来了更高的效率;其次是客户体验提升,金融机构将AI应用到风控、运营、营销还是流程的优化,都是“以客户为中心”提升客户体验的不断进化;最后,在AI应用快速落地到金融机构的每个业务、每个任务当中时,金融机构的组织架构也要更敏捷、更开放。
要抓住未来生成式AI重塑金融服务的机遇,就要抓住AI的最前沿趋势。AI智能体被认为是AI进入到的新发展阶段。
信用评估是银行信贷的核心环节,传统通过有经验的专家来完成批准贷款中的风险评估,评估过程时间会长,也会有专家个体差异的结果。当前通过基于大语言模型LLM的智能体,能够预测客户在未来两年内经历财务困境的概率,帮助借款人做出最佳的信贷决策。
该智能体应用使用 Qwen-Agent框架、Qwen2-72B-Instruct模型、ReAct规划算法、接入一个代码执行器工具构建。银行可以给智能体上传包含在过去90天是否逾期、年龄、收入、贷款数量、信用额度、过去两年逾期行为等数据,然后再进一步输入“请一步步处理数据集、训练模型判断一个客户在接下来的2年内是否会严重拖欠,不要遗漏字段和步骤,并在对话中展示相关可视化图表。”最后可以成功训练出一个能预测指定客户在未来两年内是否会严重拖欠贷款的模型,并且对于执行过程中发生的错误,能够迭代处理解决。
智能体模式也用于银行的资金交易业务中。撮合交易智能体是一个给银行业务部门使用的公对公的聊天机器人,它可以和其他金融机构交流、讲价提供的金融业务,用于较为复杂的资金交易业务。撮合交易智能体调用策略查询工具来查询金融产品的初始报价,调用询价工具来和客户讲价、查询金融产品可提供的价格,还有确认交易工具和取消交易工具。该智能体还可以与金融产品数据库和价格数据库结合,进行自动化产品查询和价格查询。如果接入交易系统,还可以进行自动化交易。
量化投资是金融行业中的又一关键场景。在量化领域,投研人员会根据量价数据(交易量、交易价)或其他数据(财报、研报等,主要是文本类数据)进行因子挖掘。因子挖掘智能体是一个使用三个LLM组成的循环来自动挖掘因子的应用,使用Langchain框架、Llama3-70B-Instruct模型、自定义的3个LLM循环计算的执行逻辑、接入一个辅助代码生成的工具构建。在量化投资中,借助基于LLM的AI智能体,可以自动化地完成单因子开发回测全流程,其中包括:挖掘与开发、单因子回测、单因子优化。
NVIDIA为金融行业提供了基于NVIDIA TensorRT-LLM 和 NVIDIA NIM的应用构建方案。AI智能体中的核心组件LLM在NVIDIA TensorRT-LLM框架下可以获得极致加速,通过使用NIM微服务可以构建更加安全可信的AI智能体,通过简单的调用就可以将 NIM 中的各种模块构建成企业所需的AI智能体应用服务,大大缩短应用流程构建的过程。
AI智能体只是金融业生成式AI应用的一个新阶段,除此外还有聊天机器人、文章总结、客服助手等多种应用场景,这些场景都是基于LLM,都可以使用TensorRT-LLM加速模型推理部分,用Triton推理服务器加速模型serving 部分,用NIM 简化应用构建的流程。基于NVIDIA上述构建方案通过对模型本身的加速和基于模型应用构建过程的加速,可以更快更好的实现生成式AI以及相关线上服务。
对于金融机构而言,要享受到生成式AI带来的成果,一方面需要加大科技投入与人才储备,而基础设施建设与迭代是硬支出。在AI应用落地的场景选择上,有的金融机构选择“快进快出”,即快速落地先享受AI带来的红利,如果出现走不通的情况就快速撤出,建立技术落地的“容错机制”。当然也有金融机构选择成熟的AI技术,从战略到落地都经过精细化测试。无论选择哪种路线,金融机构的前期投入是必不可少的。
更重要的是,面对生成式AI的快速发展,金融机构需要更前瞻性、全局性的思维去构建AI发展的生态体系,也需要全球视角,捕捉AI应用的最新前沿应用与案例。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有