复旦大学肖仰华教授:从知识图谱到认知智能

复旦大学肖仰华教授:从知识图谱到认知智能
2021年09月01日 12:00 AI报道

当下,数据量激增,大数据与人工智能技术交叉融合态势日趋增强,使得从数据到知识的转换过程及应用也在发生多重「智变」。为探寻如何利用这些「智变」驱动应用,8月27日,百分点科技与机器之心联合举办了「数据智能技术实践论坛」,邀请业界专家、学者探讨如何运用大数据、人工智能技术对数据进行体系化、智能化的治理,形成智能化的数据资产,驱动各领域的应用。

复旦大学肖仰华教授分享了《从知识图谱到认知智能》,结合复旦大学相关课题组在基于知识图谱的认知智能化研究与落地实践,系统地介绍了知识图谱与认知智能之间的关系,梳理了新一代知识工程技术给认知智能带来的全新机遇,并介绍了基于认知智能的行业智能化落地案例与关键技术。

肖仰华教授表示,人类社会已经进入智能化时代,各类智能化应用需求大量涌现,这些需求对于机器认知水平提出了全新要求。实现机器认知智能的关键技术之一是知识图谱技术,但随着应用的深化,知识图谱的落地过程单靠其所代表的知识智能本身这套技术体系和范式已经难以解决很多问题。因此,未来破题的关键在于要突破以知识图谱为代表的知识智能的边界,向认知智能这样的智能新形态发展。

以下为肖仰华教授演讲内容:

知识图谱的机遇与挑战

知识图谱作为一种大规模语义网络,是大数据时代知识表示的重要方式之一,同时,作为一种技术体系,它已经用于指代整个大数据时代知识工程一系列代表性的进展。

知识图谱之所以受到如此多的关注,是因为人们普遍认为知识图谱是实现机器认知智能的基础。

机器认知智能是指机器能够具备人对于世界的认知能力。具体而言,是机器具备人类所特有的一些高阶认知能力,比如语言认知、思维认知、文化认知,其中分水岭是语言认知,因为人类发展出语言,能够开展抽象思维,这是人和动物一个非常大的差别。

知识图谱也在一系列的应用当中获得了验证,比如在文本搜索、商品推荐、智能人机交互问答、可解释决策等诸多方面发挥着巨大的作用。

但近年来,技术生态发生变化,知识图谱技术受到了其他技术的冲击,例如深度学习在自然语言处理领域一个非常重要的成果——大规模预训练语言模型,让我们开始重新思考图谱的价值和意义。

大规模预训练语言模型实质上可以视作一类新型的、连续型、统计驱动的知识库。像这种预训练模型构造合适的问题,它就可以返回相应的答案。可以说,以预训练语言模型为代表,机器已经获得了一种隐性知识的表达能力。

所以,需要把人类视角下狭义的知识概念拓展到机器视角下更为广义的知识。

狭义的知识是一种Justified true belief,是人类关于这个世界被证实为真的一些信念。而更广义的知识,实际上就体现在包括预训练语言模型在内的各类统计模型当中,特别是深度模型中那些能够有效解决问题的、蕴含在数据中的、输入输出数据之间的模式,比如Pattern、非线性映射关系,这些都可以视为一类更广义的隐性的知识。

可以说,未来几年我们将会见证机器利用隐性知识解决问题的蓬勃发展。

知识图谱面临的另一大挑战是其本身的成本与效用矛盾越来越突出。

随着图谱的应用越来越深化,我们可以清晰地感受到了图谱应用落地过程中的一些痛点,尤其是成本问题。

有报道称,手工构建一条三元组可能需2到6美金,但如果选择自动化的方式,要花15美分左右,因此如果构建一个千万规模的知识图谱,其高额的成本是可想而知的。

此外,为了体现知识图谱的特色,我们往往会用很多稀缺的数据来支撑图谱建设,这些数据本身也是有成本的。

还有一个非常大的问题就是图谱的运维成本,知识图谱的运用绝不是一次性投入建设就可以的,后续需要非常巨大的运维代价,只有持续的运维,才有可能持续有效地发挥图谱的价值。

在面临成本问题的同时,人们对于知识图谱的效用也产生了质疑。

比如很多知识图谱的应用是属于一种锦上添花,不是雪中送炭,可有可无。知识图谱应该要跟很多应用场景结合,但很多时候在场景不明的情况下,就已经在建设知识图谱了。还有就是知识图谱技术是不定型的,实际仍在发展中。

因此可以说,随着图谱应用的深化,它的成本和效用的矛盾愈加突出。

但随着应用的深化,知识图谱的落地过程单靠其所代表的知识智能本身这套技术体系和范式已经难以解决很多问题:一是数据获取和治理困难;二是在知识层面,小样本、低资源情况下知识的表示和获取代价仍然非常大;此外,获取知识之后,在应用、服务能力方面也存在很多挑战。

因此,未来破题的关键在于要突破以知识图谱为代表的知识智能的边界,向认知智能这样的智能新形态发展。

突破边界

向认知智能新形态发展

人们常常思考的一个终极问题就是“人类”这个智能的本质是什么?为什么我们认为人类比动物更加智能?必须清晰地回答这个问题,才能够体现人类的优越性。

智能有很多定义,其中一个非常重要的定义是知识的发现和应用能力,它可以从根本上解释何以为智能。

那么什么是知识?

柏拉图时代给出了一个非常重要的定义:Justified True Belief,就是被证实为真的信念。世界上有很多信念,有错误信念,有正确信念,可证实并且被证实为真的信念就是知识。

知识也可以从数据、信息和知识三者之间的关系角度重新阐述。例如,“39”是一个数据,但它一旦被置于特定的上下文就产生其他的意义,比如“体温39℃”就是一个信息,而且很多信息之间建立起有意义的关联就得到了知识,比如“体温达到39℃了,就推断可能发烧了”,这两个事实发生的关联就是一条知识。

而认知智能是指机器具备人类从现实世界发现知识、应用知识的一种能力,体现为人类所具备的一些理解、解释、规划、推理、演绎、归纳等高阶认知能力。可以说,认知智能的实现仍然是以获取知识为根本目的的,而认知只是获取知识的一种手段。

认知智能是以知识的发现和应用为核心内容的智能形式。

以前认知世界的主体是人类,人类从现实世界获取知识,然后应用知识。而现在获取知识的主体将要变成机器,在主体发生迁移的过程当中,我们必须把知识的概念加以拓展,从人类视角狭义的知识拓展到机器视角更为广义的知识,而机器视角的知识更多的是一种隐性的暗知识。

谈到认知智能,必须要去谈感知智能。基本上可以认为,感知智能实现了人类的一些智能,尤其是在五官的感知和身体的运用能力上。而认知智能是指帮助机器构建类人水平的心灵能力,在这个实现过程中,认知和感知是紧密相联系的,感知智能向认知智能提供信号,同时,认知智能对感知智能也有着巨大、重要的牵引作用。

人类的感知很大程度上受到认知能力的影响,认识到这一点,对于实现机器认知能力或者感知能力是非常关键的。

比如上图中“鸭兔错觉”,人们之所以被引导认为它是鸭或者兔,根本上是因为我们的大脑中有关于鸭和兔的一些视觉的认知,这种先验的认知结果诱导我们做出这样的判断。

事实上,这种认知的牵引还时常让我们在感知层面发生错误,比如播放一段语音:“It was found that the *eel was on the axle”,虽然把w的发音去掉,但几乎所有被测试者都会认为自己听到了w这个发音。因为我们事先理解了这句话的含义,知道句子中有weel这个单词,所以认为自己听到了w这个发音,因此说感知是受到认知牵引。这意味着感知智能的最后一公里,其实是需要认知智能来补充的

因此,我认为,认知智能的实现需要人工智能的三大思想流派形成合力

例如,提问“3×4=?”,由于我们无数次强化了3×4和12之间的统计关联,因此很快就能给出答案“12”。

深度神经网络本质上就是在强化这种统计关联,所以说人类的快思考是联结主义助力实现的。

但如果提问“345×1234=?”,我们很难立即给出答案,这个时候就可以借用数学运算规则,把这个符号书写下来,然后得到结果。而此处慢思考的过程,是一个典型的符号加工、运算的过程,是靠符号主义来完成的。

此外,人工智能还有一个非常重要的流派是进化主义。以强化学习为代表,通过反馈和交互的方式训练智能体,对于实现机器在物理世界流畅的交互能力,以及实现类人水平的社会认知能力是非常关键的。

三大思想流派中,进化主义是实现通用人工智能的基本框架。

任何智能都需要靠进化才能得到,人类的智能就是靠漫长的进化得来的,但要让机器在短短几年、几十年内具备人类水平,就需要一些先验知识的引导。

某种程度上,人类积累了几千年的知识能够帮助机器加速未来的进化过程,但由于在认知方面能力有限,机器没办法从人类的逻辑世界或者先验知识寻求合理的反馈。因此,这将会是未来5到10年人工智能吸引众多研究兴趣的方向。

认知智能的技术内涵

认知智能是在数据、算力、模型发展背景下,数据智能、知识智能集成融合创新的产物,其核心能力是“理解”与“解释”。

具体体现在三个方面:一是机器能够理解数据、理解语言进而理解现实世界的能力;二是机器能够解释数据、解释过程进而解释现象的能力;三是具备推理、规划等一系列人类所独有的认知能力,“理解”与“解释”是后深度学习时代人工智能的核心使命之一。

在人类发展过程中有两个非常重要的里程碑:第一个阶段是从猿人进化到智人,这一过程中语言理解的出现至关重要,语言理解是人类形成抽象概念理解去做推理的一个前提;第二个阶段是从智人到文明人,从原始人类到文明人类,很重要的不同之处在于文明人本质上是一个社会人,而社会人是要有交互的,是能够彼此理解的,这就涉及元认知、高阶认知。

希望未来机器能够具备以下这些认知能力,达到人类的水平。

多模态理解能力,把抽象的符号概念和多模态的数据加以关联,构建大规模的知识图谱,让抽象的符号概念能够落地到这些具象的多模态数据,夯实整个机器智能的体验基础,让机器能够有人类水平的体验能力。

常识理解能力,人工智能系统经常由于机器常识的缺乏,给出错误的判断,常识理解有可能成为人工智能发展的第一性问题,常识知识缺失、常识理解有限难以支撑人工智能应用的需求。

因果理解能力,人类非常倾向于利用因果关系去认识整个世界,从统计相关到事理因果是机器感知智能向认知智能发展的重要内容之一,因果分析是深化大数据洞察与理解的重要方式之一。

语言理解能力,语言理解就是让机器理解人类的自然语言,从浅层到深层,理解一段文本背后谈到的实体、关系、概念、场景、主题,甚至内涵等。

归纳和演绎能力,归纳和演绎是人工智能领域研究较少的,但却是人类认知的重要形式。归纳是从具体到抽象,演绎是从抽象到具体。大规模概念图谱是实现机器归纳与演绎的基础。

类比与隐喻能力,类比是人类认知中最丰富和活跃的地位方式,也是人类智能的核心。隐喻能力本质上也是一种类比,隐喻关系的建立体现了人类认知的水平。

元认知能力,人类社会日益复杂,专家已经难以梳理元认知体系,机器辅助人类建立知识体系日益必要,实现人机结合的元认知获取方法。

高阶认知能力,由于缺乏高阶认知能力,当前很多交互类应用不能高效理解指令完成任务,因此人机协作需要机器具备高阶认知能力,实现主动协作。

自省认知能力,实现自省认知的关键是评价与评估,不能判断问题的合理性、不能做出一些善意的抗辩和提醒,是机器自省认知能力缺失的表现,实际应用中需要机器具备自省认知能力。

价值认知能力,机器智能崛起之后,由于机器价值认知能力的缺失,无法正确判断美与丑、是与非、对与错、善与恶等,会带来很多的社会问题,因此迫切需要机器具备一定的价值认知能力。

面向(工业)领域

的认知智能

黑格尔说:“实践不仅具有普遍的资格,而且具有绝对现实的资格。”接下来将结合特定领域,尤其是工业领域知识图谱的落地应用谈一谈认知智能。

工业是一类典型的复杂巨系统,它是一种人造系统,体现的是人类的意志,是人类对世界的认知。

首先,由于工业系统的复杂已经超出了任何专家、个人能够理解的范畴,所以亟需让机器具备工业认知能力;其次,整个人类社会是人类对世界认知的结果,现在工业的模拟器、数字孪生,其实是工业知识积累的一种非常重要的集中呈现。

工业智能化的实现是知识图谱技术的重大历史使命。

在工业领域,涉及人、机、物、料、环等各个方面知识,工业认知智能是机器推理决策的基础,其本质就是把工业的相关知识和推理能力赋予机器,实现甚至超越人类水平的智能工作。

目前,工业认知智能主要面临三个层面的问题:一是数据层面,数据来源多样、形态复杂、治理困难;二是知识层面,很多知识是隐性知识,难以外化表达,知识体系庞大,受众小、难获取;三是智能方面,很多工业应用场景很繁杂,涉及到各个方面,同时工业设备的运维、推理链条长,相关要素多,人机交互要求高。

因此,数据驱动与知识引领相融合是解决工业认知的基本路径。

近几年,互联网的成功受益于数据的驱动,但互联网上的数据特点是简单同质的行为重复出现,这种范式迁移到特定的垂直领域,就必须要跟特定领域的知识深度融合。因为垂直领域有各种各样的知识,比如在工业领域,有代数、几何、机械、制造、结构等。

为了更好地将这些知识跟数据驱动模型融合,在输入数据方面,可以利用先验知识来模拟数据,做数据增强;在模型的优先选择方面,可以利用先验知识进行筛选;在模型构造方面,可以利用知识来构造一些正则项;在最后模型的评估方面,可以利用一些知识构造一些规则做后验的一些检查。

目前,认知智能解决问题的一般框架日益成熟。

首先以知识图谱为代表表达业务知识,基于这些知识来增强各个领域语料所训练的大规模预训练语言模型,在训练过程当中,还可以把各种各样多模态的数据融合进去;再利用预训练语言模型和知识图谱作为一个基本框架支撑下游任务,如文本的标注、抽取、分类、搜索、推荐、问答等;最后再继续强化学习,进行多步决策的优化。

前文提到认知智能需要三大思想流派合力,这一架构便是典型的符号主义、联结主义、进化主义三者融合的架构。知识图谱体现了符号主义,语言模型体现了联结主义,强化学习体现了进化主义。

此外,认知智能的系统技术架构也越来越成熟,知识获取手段越来越多,包括抽取、生成、众包、萃取等;知识表示中也有很多新的趋势,其中大规模知识网络可能成为重要的趋势;在认知引擎方面,机器逐渐具备理解能力、推理能力、元认知能力,以此来支撑多种应用。

最后值得一提的是,在认知智能的实践过程中,一定要注重人机知识的边界。

人类和机器擅长做的事情是不一样的:人类擅长处理元知识,机器擅长处理事实知识;人类擅长做决策,机器擅长做静态关联;人类擅长模糊的知识,机器擅长明确的知识;人类是异常的,机器是常规的;人类是开放性的,机器是封闭性的;人类擅长做融合的知识,机器只擅长做单一的;人类擅长做价值相关的,而机器只能做价值无关的。

因此,人机协作是关键,机器的隐性知识将是人类知识体系的显著补充,机器的认知能力将显著拓展人类的认知能力。

认知智能不断发展进步,或许有一天机器也能够像人类一样发出一种反思:“我思故我在”,这里的“我”指的是“机器”。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部