专访「招商银行」总行人工智能实验室负责人李金龙:隐私计算价值被认可,但行业还处于"春秋战国"阶段

专访「招商银行」总行人工智能实验室负责人李金龙:隐私计算价值被认可,但行业还处于"春秋战国"阶段
2021年11月01日 19:13 36氪

编者按:

2021年11月1日是一个值得被记住的时点。

继9月1日《数据安全法》实施之后,《个人信息保护法》于今日正式施行。至此,《网络安全法》、《数据安全法》和《个人信息保护法》三部基础性法律分别从网络安全、数据安全和个人信息安全的角度为国内的相关数据治理规定了安全准则。

这些动向意味着,数据安全已经成为这个时代最值得关注的重要议题之一。

而在法律法规的指导之下,隐私计算,作为一种意在让数据价值以安全、合规的方式流通的技术解决方案,正在成为多个行业都在探索的新方向。

36氪自2019年起关注隐私计算领域,在过去两年的时间里,我们看到行业从理念科普期进入到初步商业化阶段。在这个时间点上,36氪也做了一些一手调研,期望为包括产业人士在内的读者提供应用落地的信息参考。以下是本系列的第一篇:

提及最近一年To B创投最为火热的赛道,隐私计算一定位列前沿。

据36氪了解,今年至少有近10家隐私计算初创企业宣布完成新一轮融资,另有一些公司也正开启下一轮融资。而在参与角色方面,自2018年左右第一批初创专精型公司出现之外,当下不少金融、云计算、安全、互联网等背景的成熟公司也纷纷现身入场,希望成为行业中的一员。

市场火热的背后是需求驱动。在行业中,2020年被称作隐私计算元年。彼时由于政策上合规避险的要求,以及业务端持续发挥大数据价值的诉求,业内诞生了一批隐私计算公司,希望通过技术手段让数据“可用不可见”。而今年更是一个相当特殊的时期——当《数据安全法》和《个人信息保护法》接连落定,更多企业和个人也将目光投向了隐私计算,期待了解、使用这一新技术的落地情况。

这些变化的背后意味着,作为对产品使用最有话语权的人——隐私计算的客户,对此类产品的接受程度和使用程度在眼下成为相当值得关注的话题。

也正在此时,《个人信息保护法》实施之际,我们接触到招商银行总行人工智能实验室负责人李金龙,希望通过对他的采访了解以招商银行为代表的客户对隐私计算的观察。

总结来看,招商银行对隐私计算的关注已超过一年。在整体进度上,李金龙介绍,当前隐私计算类产品,尤其是联邦学习的价值目前已得到招商银行的认可,其内部也在不断推进相关项目的落地。在今年,招商银行内部在打磨产品方面进行了多种尝试,希望降低隐私计算类产品的使用门槛。

李金龙觉得,如果产品使用的门槛太高,仅只有特别专业的技术人员才能使用的话,那么这件事的范围注定做不大。所以招商银行的目标是通过优化产品的方式,希望让数据跨主体的价值流通和企业内部数据的使用方式一样便捷。

另外在生态合作方面,当前招商银行也在不断和业内头部隐私计算公司进行合作,合作的方向不仅限于产品和技术,同样也出于对数据生态补充、价值合规互换的考虑。

在甲乙双方的协作之外,不可忽视的是当下隐私计算的行业生态还并不成熟,这具体体现在各个厂商之间协作程度的推进,以及各个场景下监管细则的完善等层面。对此,他希望能出现一个全国性的行业组织或平台,将各种技术规范、数据使用细则统一,同时也能让各个参与方在此平台上加强沟通和交流。

在此基础之上,"大家互相协作,一起往前走,就能更好地提升数据的风险防范能力。也能提升业务上的运行效率。"李金龙认为。

以下是对话部分(经36氪不改变原意的编辑):

36氪:首先还是很好奇,招商银行大概是在什么时候关注到隐私计算的?当时的契机是什么?

李金龙:我们看到的比较早,真的安排人员来做这件事儿的话,大概是在2019年。当时国内微众银行提到了联邦学习,大家都在深圳,也有所交流。后续我们就开始实践隐私计算和联邦学习。

36氪:招商银行当时具体做了什么实践?现在这些实践的状况是?

李金龙:2019年的后半年和2020年,我们陆续就做了一些案例,像现在是2021年下半年,我们也都陆续有案例上线。在具体场景上,我们做这件事的首要目的还是为了防范风险,包括信用风险,交易风险的反欺诈等等。

36氪:2019年隐私计算的理念应该还相对前沿,我们当时在内部推动类似项目是否会遇到一些阻碍?

李金龙:我们是看效果的。隐私计算一方面是保护隐私,另一方面是保护企业的数据资产。在这两个命题下进行数据价值的流转需要新的技术方式,所以我们会采用联邦学习这种技术,让它的作用反映在业务上。招行一直以来都非常重视数据的应用。我们的业务方也具备尝试先进技术的一贯思维,推进这件事在招行内部不会有太大阻力。

36氪:和去年相比,招商银行今年在推动隐私计算类产品时取得了哪些进展?

李金龙:招行今年更多地在平台化、批量化以及降低门槛上做了工作。我们有一个观念是说,如果门槛太高,仅仅只有特别专业的技术人员才能通过命令行或者复杂加解密方式才能使用的话,那么这件事的范围做不大。我们一定要降低门槛,让数据跨主体的使用和企业内部的数据使用方式一样。

36氪:为了达到这个目标,我们具体做了哪些工作?

李金龙:在效果上,我们希望通过底层技术的封装,让实际操作的人员看不到明细数据的前提下,能够方便使用数据建模分析。在具体操作上,我们和中科大一起合作了一个联邦平台,促进行内应用。

36氪:产品进展之外,招行现在和业内厂商之间的合作集中在哪些方面?

李金龙:现在的现状是,我们必须开放合作。因为很多外部数据会和一些厂商建立比较确定的联系,不少公司都有自身具备差异化的数据源。我们为了进行差异化数据的补充,也会和不同公司打交道,使用它们各自的平台。

36氪:现在我们比较看重哪个类型的数据源?

李金龙:就差异性来说,我们比较看重运营商还有互联网企业的数据。招商银行也有自己的APP,像结算这种金融类的我们自己比较充足。招商银行自己的体量也很大,对于我们已有的数据维度,样本量还是很足的,所以要多做差异化数据的补充。这些差异化的数据能够和我们自己的数据做一个补充,进行纵向联邦学习。

36氪:除了数据源的情况,在和厂商的合作方面,招商银行还会重点考虑什么?

李金龙:主要是运行速度和可靠性。

联邦学习经过加密、解密,建模速度很慢,比一般的明文本地建模要慢5~10倍。但如果有厂商在这个范畴内能快一些,我们会觉得使用起来比较好。现在行业里也有一些公司在做这件事,有软件加速和硬件加速各种研究。软件加速的比较多,硬件加速像星云Clustar会提供。另外,厂商自己得到了哪些认可也很重要,如果得到相关机构的认证,我们也会比较看重,因为这样也代表厂商在数据安全保护方面有了认可度的保障。

36氪:具体而言,我们现在对运行的速度有理想预期吗?

李金龙:因为这个过程要经过一系列加密,所以5倍左右的延迟也是需要的,这个范围左右就可以接受。也可以通过GPU或者更具针对性的硬件设备去解决加速问题,比如刚提的也有FPGA算力加速卡。

36氪:谈到各家方案的差异化,我们对现在隐私计算产品的互联互通怎么看?

李金龙:如果互联互通当然更好。从我们的角度,当然是希望能以招商为中心实现互联互通,但目前可能还做不到。现在互联互通还在路上,这也是这个行业还不太成熟的特征之一。

我觉得理想的互联互通应该解决几个层面的问题。首先是数据方面,隐私计算里的数据不是明文传输,密文转化后的数据规范目前挑战还比较大。第二是建模方面,建模过程中各家的梯度怎么定义,能不能互相应用起来也是问题。第三是在线运行的时候,多方安全计算的层面也不能很好地互通。另外还有一些基础技术路线的互通问题。

36氪:基础技术路线的选择也是一个问题。比较好奇我们现在对具体技术路线的选型有所倾向吗?

李金龙:我们应该还没有太确定的技术路线,我自己觉得行业里也还没有形成一致的观点。我们一直很务实地以服务客户和创造自己的业务价值为目标,所以我们的重点还是看谁家能提供的东西,真实地对当前的业务有价值,对客户的风险管理效果有提升,目前来讲我们各种方案都可以接受。

36氪:等于说我们现在对各种产品还是在尝试过程中。

李金龙:是的。这个行业的发展,我们招行也是参与者之一,但可能还是需要有一些行业性的组织出来,推进整个生态往前走。

36氪:这个生态需要达成的效果包括什么?

李金龙:比如刚提到技术层面的互联互通,另外在数据的生态上,如果能有平台性质的组织出来,让大家更有序和有效率地进行数据共享也会比较好。厂商之间现在还处于各自为战的状态,可能各自有工具,各自背后有一些数据,然后来看看可以怎么用。所以现在我们更重点地还是打造招商银行本集团内部企业之间的联邦学习,这种相对来讲可操作性强一点。其他方面的话,我们也是在随着行业发展,积极关注和引入一些走在前面的公司产品和数据。

36氪:从更大的层面,现在有观点认为,虽然《数据安全法》和《个人信息保护法》已经落地,但各行业内部更细致的监管规则还不清晰,这也影响了这件事的推进速度。

李金龙:我也学习了这些法律,确实一些细则还需要再探讨和研究。比如联邦学习如何遵守个人信息保护法对客户知情权的定义,像不同主体间的数据建模,客户怎么做到具体的知情,怎么定义这个过程,可能还需要更严谨地去讨论。

但是从大面上讲,有了《数据安全法》和《个人信息保护法》,大家对隐私计算的兴趣还是提升很多,因为数据互联互通的价值是看得见的。所以从我们的角度,像一些技术与合规之间如何契合的细则,短期需要研究,长期应该是利好。招商银行一直比较重视联邦学习,我们也正在抓紧研究怎么更好地、更具体地来执行这些法律要求。

36氪:整体来看,您觉得如今隐私计算在金融场景中的落地处于什么阶段?

李金龙:我觉得还处于春秋战国的阶段。

就像刚刚提到的,不管是从工具层还是执行、应用层面,行业里还没达到比较广泛统一的状态。如果是一个成熟的体系,应该需要一个白皮书或者具体的行动指南,这些都需要大家一起逐步摸索。其实我觉得最本质的是现在还缺乏一个强有力的,类似联盟一样的组织出现。

这个组织可能需要是一个全国性的组织,来把整个技术、规范都统一起来,这样大家才能更好地对话、探讨和推进各类问题。组织至少可以把主要的参与者都拉到一个平台上对话,让大家互相协作一起往前走,可能就能更好地提升数据的风险防范能力,也能提升业务上的运行效率。

有了这个基础,像我们这种金融机构,其他有需求的企业,还有隐私计算的厂商,大家都可以早一点从中获益,行业也能从春秋战国时期过渡到一个更成熟的状态。这是我们现在对这个行业的希望。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部