人工智能20年,只能绘画和下棋?丨亮见07期

人工智能20年,只能绘画和下棋?丨亮见07期
2022年08月26日 14:32 刘兴亮

丨划重点

  • 人工智能的初衷是希望能让机器像人类一样,代替人类完成任务,广义的人工智能约等于计算机科学。
  • Google旗下的AlphaFold这类人工智能产品在科学领域的应用,未来30-50年,有望变革生命科学。
  • 算法、算力、数据的不断发展和完善,为人工智能的发展打下了坚实的基础。
  • 技术从不成熟到成熟,一方面是技术本身迭代,另一方面也需要有社会性的力量,来帮助它成长起来。
  • 人工智能是把人从无聊的、重复的,疲倦的,不安全的事情当中解放出来,人不需要和机器比效率。

丨概述

人工智能,作为计算机科学的分支,一度成为科技互联网创业的风口,但从幕后走向公众视野,却与几场棋局和科学研究有关。

20世纪90年代,IBM曾推出Deep Blue人工智能项目,并于1996 年与国际象棋世界冠军加里·卡斯帕罗夫,展开首场对垒,结局是Deep Blue告负,次年性能大幅提升后卷土重来,首次战胜人类。

另一场经典,则是2016年谷歌AlphaGo与李世石的对战,AlphaGo以4-1的绝对优势,赢下比赛。

人机博弈之外,AI在科学方面的应用研究也不断突破,日前DeepMind官宣,AlphaFold可以预测出2亿多个蛋白质结构,几乎覆盖了整个「蛋白质宇宙」。

作为AlphaGo和AlphaFold的创始团队负责人,DeepMind CEO哈萨比斯曾表示,「我们将开始看到诺奖级别的科学挑战被一个接一个地击倒。」

问题在于,除了下棋和晦涩的科学研究,人工智能还有哪些价值?日常生活中,人工智能又有什么样的应用?

8月24日晚间,亮见07期,邀请到了商汤科技创新工程院院长,集团副总裁沈徽,对话亮见主理人刘兴亮,讲述人工智能的技术演进、场景应用等话题,以下是直播精华版内容:

01

广义的理解:计算机科学约等于人工智能

刘兴亮: 沈老师能否先科普一下人工智能的含义,包括是谁提出人工智能的概念?

沈徽:人工智能是Artificial intelligence直接翻译而来,1956年达特茅斯会议上麦卡锡首先提出,该会议确定了人工智能的目标是「实现能够像人类一样利用知识去解决问题的机器」,它的初衷是希望能让机器像人类一样,代替人类完成任务。

让一个机器具有一定的思考能力,就叫做智能,但这样一件事情的发生,其实是早于1956年,1956年更像是一个里程碑。

1956年达特茅斯会议参与学者,被誉为「AI之父」,图源:网络

比如1950年所提出的图灵测试,人与一个黑盒子进行对话,看我们是否有办法判定黑盒子后面到底是一台机器还是一个人。

此外,1949年学界就已经提出机器翻译的概念。比方从英文翻译到中文或者从中文翻译到法文,机器翻译的概念,它是归属于我们现在的自然语言理解,也属于比较大的人工智能领域之一。

其实「Artificial intelligence」分开看这两个词,Artificial的意思是人工的、人造的。「intelligence」实际上是智能。智能不光是人具备,生物界很多的动物它们都具有一定的智能,但从某种程度上来看它们的智能所涵盖的范畴,跟人类不是完全相同的。

如果从一个相对更广泛的含义上去理解,我觉得人工智能就是人能够去制作出具有一定思考能力或者决策能力、感知和判断能力的机器或者产品。从这个角度去思考,计算机科学与人工智能很大程度上两者可以约等。

举个最简单的例子:数据库系统。数据库系统主要做两件事,记忆和检索,以及在记忆和检索的基础上做出查询,统计和推导。

如果我们把数据库系统当成一个黑盒子,它是不是具有一定的智能?坦率来讲,具备一定的智能。因为记忆本身就是智能的一种属性,在记忆的基础上做分析和推导,也是智能的一种属性。所以从这个角度来看,我觉得大量的计算机科学领域相关的,包括数学领域相关的一些内容,都成为人工智能的基础甚至某种智能形态。

人们对于人工智能可能更多的是从「它与人的相似程度」的角度去思考,就会把范畴变得更加狭窄一点。

日常生活中人们会困惑:人工智能技术到底是怎么样的?我个人理解是人工智能的构建方法有两个比较大的流派。一派是基于符号逻辑的规则体系构建,另外一派是基于数据统计模型的模型构建。

人的思考过程或者人的智能过程中基本上有两类方法,一类叫演绎,一类叫总结或者归纳。演绎是「我」有一套不证自明的公理,在这个公理之上,我能构建出很强大的一套逻辑系统。这套逻辑系统在人工智能中的一个例子,就是专家系统。

专家系统就是针对一个特定的领域,列出大量的规则以及规则间的推导关系,人们将遇到的该领域的问题放到专家系统,就会得出一个结论,而且结论所能够涵盖知识库是相对比较精准的,也可以说,专家系统是基于符号逻辑的。

但深度学习和阿尔法狗更多的是基于统计模型。在统计模型之下,「我」有大量的数据,数据间蕴含着一些关系,即人利用机器学习的办法或者模拟人的神经网络去习得这种关系,或者叫模型。

人的大脑里有一套神经网络,用机器去模拟这套神经网络,大量的数据经过神经网络以后,不断的反推神经网络结构,这个神经网络系统就是最后的产品,当你抛出一个问题,它就会给你一个答案,并且它具有泛化能力比较强的特点,即使问题可能不完全是在它之前涉及的样例范围中,可能稍有偏差,得到问题后它仍然能够得出一个相对满意的结果,缺陷则是很难达到100%的满意度。

在近15年到20年的时间内,基于我们的深度学习或者深度神经网络这类统计模型,取得了非常大的进步。一方面得益于半导体技术以及计算机体系结构不断的迭代,算力得到极大的增强。另一方面是从上个世纪90年代末期开始,互联网帮助我们将世界很大程度进行数字化,我们得到大量的数据以后,数据本身变成AI的燃料,变成人工智能的燃料,去推动人工智能技术的发展。

最后一方面,在人工智能的理论化和工程化,人类也取得了很大的突破,最早可能是从语音识别开始以及搜索引擎上的内容排序,之后慢慢就到自然语言理解,甚至一些深度的内容理解。过去计算机视觉在面对不确定环境的情况下,决策最后往往是人工决定,现在智能方面,很大程度上已经能够用计算机自主得出比较精准的结果,这也是为什么最近几年,人工智能话题在进入公众的视野后也变得特别火。

02

人工智能未来30年-50年,有望变革生命科学

刘兴亮:人工智能如何突破科学课题,实际应用层面,它的意义有哪些表现?

沈徽:人工智能的历史至少与计算机的历史一样长,甚至更长。在上百年的历史过程中,是在不断的开花结果,只不过有的效果可能看得比较清楚,有的可能是一个潜在长期的过程。

我们知道医学虽然历史很长,但现代医学其实很短的。真正有理论支撑、有实验支撑的医学可能只有两三百年,其中真正有效的、能为普罗大众带来好处的药物品种相对比较少,但是这个问题会随着蛋白质测序的发展而得到改变。

每个人都有自己的遗传基因DNA,蛋白质是从DNA当中产生出来的,DNA只能决定蛋白质的组成成分是什么,不能决定构成什么样的形状。

蛋白质的形态实际上是粒子之间的相互作用力,但因为蛋白质是非常大的分子,是由几千个几万个甚至更大的粒子构成,当你去预测它的结构形态,可以想想它的搜索空间是极大的。

Google下属的Deepmind部门研制出了AlphaFold系统,用来预测蛋白质的折叠方式。

AlphaFold系统实际上是用一种深度学习的方法能够比较精准的去预测蛋白质的结果,这与我们又有什么关系?

Alpha Fold预测蛋白质模拟图,图源:新智元

很多的疾病,尤其是一些比较个性化的疾病,由于身体里面的某些蛋白质缺失或者蛋白质改变导致,近几十年出现了靶向药的概念,尤其是针对癌症治疗靶向药的患者,可能基因里出现问题,这类问题的修复,其实是针对它产生的蛋白质去做修复,就能够防止某一类疾病的发生。但是靶向药的开发投入巨大,耗时耗力。

所以说,所以AlphaFold系统所代表的技术,将来可能以非常高效的手段发现并帮助人类解决问题。

也许若干年之后,我们探索发现到最后研制生产和使用靶向药的速度会更快,成本更低,可能我们可以针对任何一个单独的人,用极低的成本和快速的研发,就对他的特定疾病进行靶向药的针对治疗,从而更快的恢复健康。尽管这是一个畅想,我觉得可能会慢慢实现,也许是30年,也许是50年之后,所以人工智能的实际意义肯定是巨大的。

03

工业红线是AI可用与否的关键

刘兴亮:如果让您来当裁判,评估人工智能的发展水平,满分一百分,您觉得目前能得多少分?

沈徽:其实我们谈论更多的是人工智能技术的发展水平是不是已经超越了一个「工业红线」,当一个技术,它在工业红线之下的时,不太可用,会出现大大小小的问题,但它超越红线之后就变得可用或者人是可以在相当程度上依赖它的。

所以评估的标准,要看人工智能在它相关的一些应用领域上是不是已经越过了工业红线,以及在多大程度上越过?对这个回答我是相当乐观的。

拿计算机视觉来说,这是AI很重要的一个领域。我们的AI技术很早就在物体识别和人的识别上超过人类,人眼的错误率大概在6%左右,机器的错误率则远远低于这个数字。

再比方AI创作,去画一个风格画,或者是做一个特效,现在AI很大程度上不一定以假乱真,但基本上已经是非常接近一个实际的人去作画,所以AI技术已经超过工业红线,甚至远远超过专家的水准,但我们不能下结论说AI已经超过人,它离人的智慧还是差得很远。

AI作画成品图,图源:量子位

到底差在什么地方?

首先,我觉得物体识别它超过了人类,仅限于非常细分的、垂直,定义好的场景,但是如果想要把能力泛化到任何一个领域去,这样的一个泛化能力是相对缺乏的。

换句话说,可能我的某一个特定的算法它做识别类任务特别好,但是其他类型的任务,是否还能够做准确的分类?需要打个问号,如果是AI没有见过的,可能得到的结果并不好。

其次,我觉得需要解决技术的资源消耗,或者说成本问题。如何能够让一个针对特定领域的AI技术,很快、很容易的应用,就涉及到投资回报率的问题,只有当投资回报率足够好时,它才有可能会大量应用。

如果拿人脑举例,我们人脑的功耗是大约20瓦,当你仔细思认真思考问题时,大概功耗是20瓦。今天一块GPU卡很轻易就能达到250瓦,这样的一块GPU卡,功耗远超人脑,如果需要1000块的卡,才能解决某个特定问题,并且做的比人类好,那么投入产出比就是不理想的。

再者,AI它作为一个技术,本身很难体现出使用价值,它必须要跟实际的场景做结合,进行赋能,必须要与实际的问题做结合。这时它的价值、使用价值,才会体现出来,而且把AI技术跟实际问题结合的前提,是开发人员必须了解实际的问题。

比方说新能源汽车电池,有很多重要的质量检测环节,如果检测不严格是有安全风险的。过去产线上可能有100道工序,就有100个检测的环节,如果不到电池厂去观察生产流水线,去与技术员交流,不了解电池的电化学、热化学理,很难设计出符合应用场景的AI算法,去解决问题。

所以AI的技术应用,它不是单门靠计算机科学家、人工智能研究员、算法工程师就能完成的,它是需要跟行业的专家交流来进行技术结合。彼此越了解,它产生的效果就会更大。

04

算法、算力和数据是人工智能发展的关键

刘兴亮: 人工智能技术它的关键到底是什么?

沈徽:人工智能,特别是近20年,基于深度学习的人工智能技术,我觉得有三个非常重要的因素:算力、算法、数据,以及我个人的看法:应用落地。因为我认为应用落地或者是对用户需求的满足,实际上是为三要素做一个方向的指引,用需求去引导供给。人工智能的技术爆发或者成熟度的提升,是与三要素不断的被满足或者不断的取得突破,有非常紧密的联系。

先从算力说起,算力的增长,我觉得是一个很客观的因素。算力与摩尔定律有关,具体到半导体上,芯片产业每隔18个月,它的性能提升一倍,价格下降一半。这其实是非常可怕的规律,因为它是一个幂指数的上升,而不是一个线性的增长。

第二个是数据,我觉得数据很重要的原因有几个推手。第一个推手是互联网应用产生大量的资讯、数据,不断将其结构化、网络化,变得容易获取,能够共享聚合。另外一只推手是世界范围内所谓的数字化转型。

数字化转型其实就是把企业内部以及企业之间经营的相关的内容能够以一个数据的方式呈现出来,记录下来,进行分析。这些内容都为深度学习提供了大量的燃料,这些燃料能够去帮助深度学习技术去产生更好的模型,帮助人类解决问题。如果没有互联网以及数字化转型的浪潮,他们在过去15-20年做的铺垫,就会变成巧妇难为无米之炊,AI的发展也正是是受益于此。

第三个算法,其实算法的背后就是人以及人在思考上的突破。一方面体现在高校、研究院的众多科研人员对于深度学习本身的认知,包括神经网络、深度学习网络的认知,也包括实践上的认知和数学上的认知。此外还有大量的应用在落地之后,是对研究方向以及研究课题提出反馈或者提出引导。而这些引导会吸引大量的工程技术人员去尝试此类方向。其实这就形成了一个很好的循环,从高校研究所到企业到政府再到用户,这样一个闭环。

所以我觉得算法、算力、数据三个要素在过去的一段时间里,是不断完善的,同时也为人工智能的发展提供很重要的基础。

刘兴亮: 目前人工智能在哪一些行业已经开始应用,效果怎么样?为什么消费者对人工智能的感知不明显?

沈徽:坦率的说,人工智能的应用已经是在广泛落地。举几个例子,其实人工智能最初的落地。可能是在商业用户领域。比如去商场停车,以前都有岗亭检票,依据票上的起始时间最后计算停车费用。如今再去商场的停车场,它会有机器识别车牌号,当你准备离开时它会语音播报你的停车时间和停车费用,之后你再去扫码付费,在这个过程中,有相当多的AI技术。

第一个AI技术是出入停车场识别同一辆车,通过追踪你的轨迹,包括最后的停车位置。另一个是扫码支付过程中的识别,甚至现在有扫脸的方式进行自动支付,只不过在此过程当中,可能大家没有那么深切的感受到是AI技术在发挥作用。

另外一个例子比如所用到的腾讯会议的美颜功能,就涉及到大量的计算机视觉技术。如果AI错误地识别人脸上一个位置,可能我的鼻子就会「消失」,应该找到正确的地方去皱纹、皮肤增亮。这些都是对人整体的各个五官,各个部分的一个识别,在识别的基础上去做相应的AI技术应用。

为什么消费者对AI的感受不是很明显,我觉得历史发展本就需要时间,一个新技术都是从不成熟到成熟的。

当它还不成熟时,却又跨越了工业红线,就会比较容易在B端落地,原因是:

第一,B端的需求和环境是比较明确的,比方说停车场,它其实不是在任意一个位置去识别你的车牌,它是在出入口识别,会有高光的灯打在车牌的位置让它环境变得相对可控。

第二是使用场景相对单一,是收费停车场,去完成一个车牌识别收费的动作。车牌识别其实在我们生活当中可以发生在很多地方,商厦只一个特定的场景。

第三是技术的使用者。B端的技术的使用者往往是有一定的技术能力的,受过训练的,使用产品是工作的一部分,他就更容易去接受一个相对来说需要去有一定学习曲线的新东西。

但是,我觉得一个新技术,要让普罗大众受益,一定要走到C端,去关注消费者以及消费者的使用安全,任何一个真正有有潜力或者是有影响力的技术,它最后一定会以消费者、用户作为它的终点,那么我相信AI的技术也会越来越多的走到消费者身边,走到千家万户之中。

05

人工智能发展,除了自身迭代,也要公众扶持

刘兴亮:前段时间国内的某新能源汽车,车主在使用辅助驾驶时引发车祸,这类责任应该怎样算?

沈徽:人工智能技术的落地,一方面是需要技术或者产品提供方进行不断的迭代,不断的提升,但另一方面,不管从社会的宣传层面,还是从用户的引导层面,要对人工智能技术目前在特定的产品上面要有相对比较清晰的界定和沟通,我觉得非常重要。

技术它从不成熟到成熟之间,一方面是有技术本身迭代,这是应该完成的事情。另一方面如何去创造一个相对来说比较合适的社会环境,让技术从小孩的状态成长为大人,这一段旅程中是需要有社会性的力量,来帮助它成长起来。

我们知道AI是个好东西,它一定能够帮我们带来很多的好处,未来也会改变我们的生活,但在这个过程当中,如何能够让它在盘旋式上升的过程中,能够有较快的速度体现在发展方面又不会过多的跨越边界,造成伤害,以及包括宣传、教育引导用户不断的提升对AI的认知,都是必要的。

如果莫斯科国际象棋比赛在赛前对所有参赛棋手进行赛前教育,表明机械臂有可能会错误识别你的手,情况或许会变得非常不一样。有类似的引导可能悲剧就不会发生。

莫斯科国际象棋大赛,一男孩被机器人夹断手指,图源:Baza

回到电动车辅助驾驶造成车祸这件事中,如果我们把这件事故一分为二,一方面是在厂商要对产品的质量、产品的可靠性上需要做一个清晰的描述,甚至基于一个规则从产品安全设计层面对用户进行有效的指导。

另一方面从使用者的角度来说,对于一个新东西,要有一个学习的态度,要了解新的规则习惯,这样才能更好地使用新技术,让人和机器有更好地配合。

刘兴亮: 人工智能可能还会带来哪些问题和负面效果,应该如何去应对这些问题的出现?

沈徽:任何一个新事物出现它一定有两面性,我们更多的是关注如何避免一些可能产生的负面情况。

AI是由算法、算力和数据共同支持,可能首先会想到数据的安全性、用户的隐私问题,特别是深度学习,这样的AI技术其实是需要用大量的数据来做燃料,去产生深度学习的模型。

在此之外,就是数据的公平性。因为深度学习实际是基于数据统计的归纳系统。从某种程度上来说什么样的数据,它就会总结出什么样的规律。根据总结出的规律,推导结论。所以在我们深度学习的模型过程中,数据的公平性非常重要,这样才能最大程度上减少小意外情况的发生。

举个例子,假设我有一个模型用来识别天鹅,我认为世界上的天鹅都是白的,因为我收集了9999只天鹅都是白天鹅,不管天鹅放进模型后是坐着、躺着还是飞着,都能识别出来。某一天,出现一只黑天鹅,模型可能无法识别,就不会把它算作天鹅,因为AI模型从来没有见过黑天鹅,而事实证明当我们发现第一只黑天鹅时,可能就会有第10只、第100只、第1000只黑天鹅,因为在某些地方的天鹅都是黑的品种,这就是公平性的问题,如果我制作一个识别天鹅的模型,它只能识别白天鹅那对黑天鹅是不公平的,所以我觉得这就是数据的安全,隐私以及数据的公平性。

再者是深度学习的可解释性和鲁棒性,深度学习拥有很强的能力,特别是在大量数据,算力的加持之下,但是它有一个问题:它是个黑盒子。对于结果,很大程度无法解释清楚产生的原因,即便是同一个问题,同一批数据以不同的方式注入进去,可能最后形成两个模型。两个模型可能效果和性能都会非常类似,但就是不一样的两种模型,但训练出来的模型,很大程度上它是一个黑盒。

所以在技术理论的研究方面还需要不断的去推进,一方面,我们能够知道它的优点、缺点、弱点、强点。另一方面也可以帮助我们去迭代出更好的模型。

未来我们只需要做两件事,第一,使这样的模型无限的接近100%的精准度,第二,在我们设计产品时,不是100%精准的模型,当它们组合到一起,我们通过产品设计使得它的整体的准确性和安全性,能够比单个的模型更高。

第三个是AI的「普世化」。Google曾提出过「AI霸权」的概念,我们需要去改变或者避免这样的状况出现,而要使AI技术,变成人人可用。这样,AI技术才能够真正的蓬勃的发展,可以不断的落地应用。

如果它被控制在少数的寡头手里,第一就是对于技术迭代本身是不利的,第二,对于整个的经济、整个的社会,会是一个非常危险的事情。所以AI的普世化非常重要。

而且普罗大众对于AI的认知是软性的,它可能不体现在具体的物质层面,它是一种意识。当汽车刚出现时,人们会对汽车的安全性会有顾虑,认为马车是可靠的,直到现在街上随处可见汽车,这是观念的转变,也当然有技术的提升。对于AI技术还是AI产品,我觉得普罗大众要对它有更深入的了解。知道它能干什么,知道他现在不能干什么,知道他未来会怎么样,不断的去更新自己的认知,不仅是对AI技术落地、AI产品化本身技术发展有好处,而且对于用户本身也是有好处的,这是一个相互的过程。

06

人可以追求更了不起的事情,不用和机器比效率

刘兴亮: 今天看到一句非常扎心的话,「你之所以还有工作是因为取代你的机器人还不够便宜」,怎么看这句话?

沈徽:100年前好像有也有类似的话,50年前也有类似的话。

我觉得人类要有自信,人是有灵性的动物,我们的追求或者我们的能力是没有止境的。AI技术给我们带来了什么,它是把我们从那些无聊的、重复的,疲倦的,不安全的事情当中解放出来。

我们会去追求一些更了不起的事情,比方说探测火星,探测地壳等等,比方说用演绎的办法去想出一个更了不起的数学和物理模型去解释一个另外一个宇宙问题,又或者是创造一个新的艺术形态,甚至是一个新的艺术内容,引起大众更大的共鸣,引起更深刻的思考。包括推动我们的哲学、我们的思想、文化,去往更高的一个层次。

这样一个社会,它会变的更有包容性,更能够容纳聪明人一起去完成更了不起的事情,我觉得这是人类社会发展要去面对的问题。

我们一直在解决,也一直取得不断进展,社会的演进、人类思想的演进,包括技术的演进,其实都一直往这条上升的方向行走。我们不应该去和一辆汽车比谁跑得快,去和一头牛比谁耕的地好,这些事情本就应该它们去完成,以前之所以它们不做这些事情,是因为我们人作为有灵性的动物,还没有创造出一种合适的方法,让它们完成这件事情。当我把牛训化成家牛,它就可以耕地。当我挖出石油,对机械有足够的理解,我就能造出汽车。

那AI也是一样的,当我们对深度学习,对形式逻辑、对符号逻辑系统有很好的理解,我们就能够去让它帮助我们更好地记忆,更好地感知、更好地分析,更好地决策,我们就可以去解决更有意思的问题,我希望人类能够从这些无聊的不得已的事情当中脱离出来,去追求更有意义的事情。

所以我对整个人类的前途,我是非常的乐观和充满希望的,我们应该珍惜属于人类本身的灵性。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部