人工智能大会“论道”:旧互联网打法难以为继,开采数据富矿亟待新办法

人工智能大会“论道”:旧互联网打法难以为继,开采数据富矿亟待新办法
2021年10月14日 21:04 证券时报网

互联网行业曾是中国经济的一处“狂野西部”,但随着政策环境的变化,该行业正亟需重新审视其过去的商业逻辑和使用数据这一重要资源的方法。10月13日,由中国人工智能学会、星云Clustar联合举办的“2021年中国人工智能大会(CCAI 2021)”在成都举办,会上来自产、学、研届的专家学者坐而论道,共同探求在新环境里挖掘数据“富矿”的可行性路径。

滥用数据时代已成过去式

互联网科技兴起以来,越来越多物理世界的信息正在源源不断地数字化,数据资源已被公认为可以带来经济价值的“富矿”,但大数据时代在发展的过程中也开始面临新的问题和挑战。

“时代已经变了,和过去互联网打法盛行的时候不一样了。”恒生电子研究院院长、原上海交易所总工程师白硕指出,所谓互联网打法就是通过一些免费开放的应用聚集行为数据,然后将这些数据通过在自身体系内部消化或者广告等方式进行错位应用,通俗的话说也就是“羊毛出在猪身上,狗来买单”。

但他认为,这种打法在新时代将不再适用。“现在是一个权力意识觉醒的时代。”白硕表示,随着《数据安全法》《个人信息保护法》的陆续出台实施,种种动向表明数据产业正逐渐进入新时代,数据生态也将发生翻天覆地的变化。

进入新时代后,如何在合规前提下进行数据的多方合作成为一项新的挑战。清华大学国强教授、智能产业研究院首席研究员、大数据智能实验室主任聂再清表示,数据越来越多源异构,包括文字、音频、图片等不同模态,“只有把各个模态之间的信息应用好了,才能真正让我们做到AI在现实应用中很安全”。

一方面,要做好多模态应用,知识图谱和训练成本都非常高。聂再清指出,这可能导致只有大企业才有能力在数字世界生活得更好,而很多中小企业则没有足够的资金进行数据应用,因此需要探索如何利用人工智能实现低成本、高质量的知识图谱和训练数据。

另一方面,当前数据都是企业的私有财产,受到隐私和私有属性两大问题的限制,因此如何在合规前提下,做好数据隐私安全保护的同时,建立起多方协作机制值得研究。“因为如果没有把私有数据利用好,越来越多数据变成私有数据,公有数据反而会越变越少,加重数据孤岛。”他表示。

落实到具体行业时,政策环境变化带来的挑战也不尽相同。例如金融行业,国家金融与发展实验室副主任、上海金融与发展实验室主任、研究员曾刚指出,现阶段大部分金融机构尚未具备数字化风控能力。“现在新的监管规定下,征信管理体系正在进一步完善,且要求银行等金融机构自身要具备数字化风控的核心能力,因此原来与外部机构的合作模式可能要有打破。”他表示,“新的合作伙伴是什么?要去探讨,但是这块空间是很大的。”

求解数据合作难题进行时

大数据的核心价值在于连接与共享。"好的模型离不开高质量的数据。"星云Clustar CTO张骏雪表示,人工智能早期在视觉、语言处理这样容易获取高质量数据的行业落地较快,而在金融、制造、医疗领域的应用会因高质量数据获取难度大受到一些阻碍。

科大讯飞西南研究院院长杨芳勋认为,数据所有者是有意愿把数据贡献出来,进一步流通产生价值的,但要建立在技术、策略、管理支撑下的合法、合规前提之下。

因此,如何建立起一个同时实现数据主体、数据控制者和数据使用者三者利益平衡,处理好隐私保护、数据安全和数据价值挖掘三者关系的共享机制,成为会上一项重要议题。

“在合理保护个人隐私的同时,恢复数据产业的发展,现在已经成为国际上的一个趋势。”国务院发展研究中心金融研究所副所长陈道富表示,“建立以征信体系为核心的信息共享,搭建地方政府主导的以政务数据为主的数据共享,探索企业市场化方式的数据流通,以隐私保护计算技术实现数据的合规、安全流通,将成为我国数据共享方式的重要思路。”

香港科技大学智能网络系统实验室主任、副教授、星云Clustar创始人陈凯也认为,隐私计算技术可以帮助人工智能为代表的应用领域,合理引入更多受隐私、安全因素限制的数据,促进人工智能模型向精准化、效率化发展;推动不同机构的数据融合,催生出新的应用场景,让过去的不可能成为可能。

“数据要素分为可用数据和不可用数据,不可用数据的边界由《数据安全法》《个人信息保护法》界定,而可用不可见的数据受法律、商业权益、个人隐私多重因素制约。”CAAI名誉副理事长杨强表示,联邦学习具备数据不出库、性能效率大幅改善的技术优势,以赋能金融行业数字化转型为例,大多数金融机构往往受限于隐私保护、安全、合规的要求,不能轻易进行多方数据流通,通过联邦学习技术实现联合建模、扩充模型空间,可以构建更加精准化、智能化的金融服务体系。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部