大模型破局之战:赛点走到“产业应用”

大模型破局之战:赛点走到“产业应用”
2023年08月01日 13:03 周观新金融

谁将领跑大模型金融产业应用?

文 | 周公子

自2022年底以来,ChatGPT引发了人工智能新一轮创新热潮,各大企业更是争先拿出各自的大模型产品,尤其在中国市场的竞争,已经进入白热化阶段。由中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合相关研究机构编写的《中国人工智能大模型地图研究报告》更是显示,中国已发布的AI大模型已有79个。

但近日,这场没有硝烟的战争,风向仿佛发生了一些微妙的变化。首先是ChatGPT的月度流量首次出现下降——2023年6月份,ChatGPT网站在全球的桌面和移动端流量比5月减少9.7%,独立访客减少5.7%。

摆在各行各业面前的一个问题是,除了聊天对话之外,还能解决什么问题、带来什么样的商业效益?毕竟,每一次对话背后都是大量的运营成本、计算资源的消耗。没有哪家企业能够长久扛下这种成本损耗。

正如中国市场上,消费互联网向产业互联网的发展一样,C端免费的个人应用终将走向B端的收费服务,也就是产业应用,才能在人口红利消失、各行各业降本增效的当下,真正创造价值。

赛事行至中场,这一场AI大模型之战的赛点已然清晰:技术之外,大模型做好垂直产业应用才是王道。

基于这样的洞见和对技术演进的判断,马上消费CTO蒋宁表示,近期马上消费将正式发布自主大模型,聚焦“自主动态强化学习能力的大模型(AIGC+RLHF)、多种模型组合式的AI系统、多模态音视频实时人机结合”三项核心关键能力,致力解决金融行业大模型在落地过程中的安全可控和隐私保护、基础设施能力建设等方面的关键问题。

Part 1

赛点:抢跑还是深挖?

近日,由知名数据公司IDC发布的首份AI大模型评估报告出炉,名为《AI大模型技术能力评估报告》,对百度、阿里、智谱等14家国内主流企业的大模型平台进行评比。

值得注意的一点,IDC这份《AI大模型技术能力评估报告》和其他不同的是,评估维度除了常见的“产品”、“服务”之外,还将“行业覆盖”这一点作为关键的评估维度。

但周观认为,该报告虽然详实而权威,但作为一个面向通用平台的能力评估,对于各个垂直产业选用AI大模型的参考价值并不大,至少对于金融、金融科技行业来说是如此。

其中的关键点在于,“行业覆盖”仅仅只是解决了有没有的问题,而不能解决“好不好用”的问题。

当然,该报告也正视了这一点,其指出,大模型的最终目的还是要落地于产业实践。再看阿里、百度等企业在行业上的评分优势,仍只是在于其过往积累的产业领域,例如阿里评分较高的在于电商、百度在于能源。

纵观全行业来看,金融由于其行业的特殊性和独特性,尤其对于风险和安全的可控性,目前仍未有哪家企业能够有底气拿出相应的杀手级应用。

至今仍被口口相传的是,年初彭博推出的金融行业大语言模型BloombergGPT,涉及500亿参数,这背后依赖于彭博社广泛的金融领域数据优势构建了3630亿个标签的特有数据集(363 billion token dataset)

蒋宁也认为,金融行业天然有着数据密集型、技术密集型的属性,一直在探索数据资产化,挖掘数据价值,同时又面临着如银行线下网点的价值传递效率问题、用户体验问题,需要机构持续创新。

也就是说,对于金融行业来说,大模型的关键不在于跑得快,而在于挖得深。无论跑得多快,终究还是得回归行业本质,解决行业关键问题。

Part 2

难点:金融的特殊性与独特性

蒋宁分析认为,除了数据、技术问题之外,目前金融行业大模型应用主要面临四个关键挑战。

第一,关键任务和动态适应性。

关键任务往往关系到生命或重大资产,比如自动驾驶、银行存款,人工智能要做到100%的准确,并不容易。生成式人工智能大模型与工业界的判别式模型相结合的化学反应,目前尚无明显效果。同时,与AlphaGo的封闭系统不同,大模型要想做到越来越聪明,就要想办法在开放的体系里让群体力量贡献给模型,让尽量多的用户参与反馈,形成生态,对于金融行业来说,要想做到这一点还需要跨越巨大的行业鸿沟。

第二,个性化要求和隐私保护。

摒弃千篇一律的教条式服务,做到千人千面,大模型在为用户提供个性化体验的同时,又能确保用户隐私,这也是一个需要解决的问题。

第三,群体智能与安全可控。

一方面,也就是前面提到的有效数据集问题,中文网络世界的可用数据和有效数据,相比之下非常有限;另一方面,行业领域的数据往往是封闭的,存在巨大的“数据孤岛”,难以打破共享。蒋宁认为,如何设计一个跨行业、组织的数据共享、权益共享且安全可控的机制,同样面临巨大挑战。

第四,基础设施能力。

以ChatGPT为例,按照国盛证券的报告《ChatGPT需要多少算力》估算结果来看,GPT-3 训练一次的成本约为 140 万美元;再以 ChatGPT 在 1 月的独立访客平均数 1300 万来计算,每天光计算所耗费的电费就在 5 万美元左右,这不是所有企业都能够承受得起的硬性成本支出。

不仅如此,GPU、网络、机房等基础环境要针对大模型训练、推理等方面的需求做出相应的改造,才能发挥最大的效能。例如最近国内就有云厂商相继推出向量数据库、高性能计算集群等产品,适应企业大模型训练、推理的计算需求。

总结来看,垂直产业大模型的落地和应用,存在高成本、缺数据、缺算力、难以实现安全可控等诸多关键问题。和金融类似的,还有医疗、健康等行业,关乎钱袋子、资产安全,更关乎生命健康,也因此,这类垂直行业的容错率往往更低、对于技术落地的精度和安全性要求也更高。

Part 3

破局:应用为王,产业至上

针对这些行业痛点和难点,蒋宁认为,马上消费应该有自己的打法。

蒋宁指出,对于垂直产业来说,私有专属模型是较好选择,要聚焦“经济”、“安全”和“可控”的大模型一体化解决方案,强化大模型私域数据的领域微调、精调训练能力,并和外部企业形成生态互助,解决数据归档、脱敏、分层、评判价值等问题。

而作为金融科技的探索者和践行者,马上消费在金融大模型的落地应用上通过持续的技术积累,已经具备这样的优势和特点:安全可控、个性化决策和体验、持续学习。蒋宁透露,目前马上消费已经研发了实时人机决策模型、多模态大模型、数据智能模型等,并在内部正式上线测试。

这背后,马上消费希望帮助解决金融行业的三个通用问题:

首先,个性化的服务和极致用户体验。金融业务有高价值、低频的特点,很难提供个性化的体验。传统的做法是分层打标签,提供不同的产品,但标签是动态变化的,因此如何自动化地决策为客户提供自动化的体验,就需要产品与众不同。

其次,高效的价值传递效率。虽然金融是技术密集型、数据密集型行业,但目前线下网点还是为数不少,因为人工智能尚不能做到不出错,很多工作还要高度依赖人工操作。

最后,合规安全的决策智能,这与鲁棒性相关。所谓鲁棒性,是指在特性参数和系统内,维持某些性能的特性,例如金融行业尤为看重的合规、安全问题。

基于这三方面考虑,以及上万台的服务器,近千张的GPU卡,40PB的文字、声音、图片、视频等形式的数据,马上消费金融力求实现算力、算法、数据以及场景的闭环,并由此打造“三纵三横”的AI战略。

马上消费金融的“三纵三横”战略

所谓三纵,是指实时人机决策、多模态大模型、数据智能。例如,要解决工业界的鲁棒性问题,让人接手人工智能解决不了的1%的问题。而马上消费过去多年的实践,已经积累了海量的语言、文字、图片等素材,并围绕其进行了大量的训练,形成了一套完整的多模态的资产。解决数据智能的问题,背后离不开马上金融早已经构建起来的2000+个模型,可以为2亿多用户提供自动化的营销、风控等服务。

三横即是指持续学习、模型控制、组合式AI:确保让模型越用越聪明,同时更稳定、更安全可控。而不局限于单一模型,通过多种模型的组合应用,可以更高效解决问题。

据了解,目前马上消费的人工智能技术主要应用在三大场景:一是金融智能对话,实现实时人机协作、持续学习、可信安全合规;二是金融数字人,通过大模型+组合式AI多模态能力,实现有温度的数字人;三是金融服务的AI核心引擎,通过大模型的大脑与心理学的有机结合,实现有情感的人机互动体验。

蒋宁将这些实践和成果总结为一句话:“垂直领域的判别式模型与生成式模型等多种模型组合,构筑一个开放的持续学习、具备鲁棒性、合规安全的体系,才是大模型的真正落地,而不是一个模型靠几千亿参数去落地,我们将为之而努力。”

以应用为王。不久的将来,或许大模型垂直产业落地应用难的问题,终将破局。

—THE END—

原创文章,未经授权,请勿转载。

联系周公子请加微信号:zhougongzihenshuai

投资有风险,入市须谨慎,以上观点分享不构成投资建议。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部