Emtech China峰会在京召开顶尖大脑聚焦 这一趟值了!

Emtech China峰会在京召开顶尖大脑聚焦 这一趟值了!
2018年03月15日 16:12 一朝三笑

1月28日,《麻省理工科技评论》与DeepTech深科技主办的新兴科技峰会EmTech China于北京国贸大酒店正式召开。

《麻省理工科技评论》的EmTech 系列峰会已经在全球举办超过19年。来自世界各地的18位顶尖科学家、21 名科技公司领袖、35 位青年科技先锋出席了本次千人级大会EmTech China ,并在现场分享他们对于新兴科技的深刻见解。

延续《麻省理工科技评论》系列峰会的既往传统,2018年的EmTech China同样将目光聚焦在新兴科技上,这一次,人工智能、区块链、量子计算、可持续能源、生物医疗、自动驾驶成为本次大会的热门关键词。

而在这场科技大牛的盛会上,主办方邀请到了来自谷歌、亚马逊、高通、NVIDIA、微软、IBM、D-Wave、麻省理工学院、宾夕法尼亚大学、斯坦福大学、阿里巴巴、腾讯、科大讯飞、宜信公司、商汤科技、远景能源、平安科技、Hyperledger、Flagship Pioneering等机构。

我们也得到了他们对于科技趋势的独到见解。在28日这一场中主要议题以人工智能为主,共包括“实验室里的AI诞生记”、“云端上的AI风暴”、“芯片让AI重生?”、“企业级AI的高阶打法”、“AI对战星际争霸胜算几何?”五大板块。

让我们一起去看看他们都说了什么?

“实验室里的AI诞生记”

《深度学习:从炼金术走向化学》——MIT计算机科学与人工智能实验室教授Tomaso Poggio

在Tomaso Poggio的演讲中,他表示,深度学习有点像我们这个时代的炼金术,但是需要从炼金术转化为真正的化学。这样我们才能知道,深度学习在未来到底可以实现什么。

他举了一个将计算机视觉和机器学习进行整合的例子,机器识别行人和信号灯,从与原本的每秒出现10个错误变成每30英里只出现一个错误。究其背后成功的动因,是机器学习的算法,第一是深度学习,第二是强化学习。

深度学习可以帮助我们解决10%的难题,剩下的90%呢?Tomaso Poggio给出的答案是可能也需要来自神经科学以及认知科学的研究,更好地了解人的思维和大脑。这也是MIT大脑、心智和机器中心(CBMM)在研究的问题,大脑中智能的产生,是科学现在需要解决的元问题。

CBMM想通过以下三条路径解决这个问题。

一:计算机科学+机器学习

二:神经科学

三:认知科学

过去几年中,技术发展和理论发展、包括深度神经网络领域的发展很显著。要了解深度神经网络的运作原理,需要回答背后的三个基本问题:

  1. 1.逼近理论:深层网络什么情况下会比浅层网络更有效?

  2. 2.最优化:应该如何设计经验风险函数?

  3. 3.学习理论:为什么深度学习不会产生过拟合?

这三个问题是机器学习的奠基石。它们的答案很复杂,要解决这种问题,需要一开始就思考深度学习的一些技术理论,以及它的局限性。

在演讲的最后,Tomaso Poggio表示,现在是应用人工智能的黄金时代,因为深度学习及其工程应用,终于帮助我们将传统的人工智能科学理论应用于了工程实际,而且能够为我们进行赋能。假如我们可以超越深度学习的理论,可以更好的去了解人类智能的话,我们也可以更加深刻地了解我们人类到底是什么。

《人工智能的中国式文艺复兴》——香港中文大学信息工程系教授汤晓鸥

汤晓鸥教授的这段演讲中,以他对目前中国电影的看法开题,简单阐述了原创的重要性,在科技领域,原创一直是大家推崇也不断追求的方面。在谷歌的AlphaGo推出后,不少的公司开始着手让机器去打扑克牌,这反映的是当前的一种现实情况,跟着大公司的步伐走,这好像成为了一种心照不宣的打法,因此,“创新”反而显得尤为宝贵。

汤晓鸥表示,在AlphaGo之前他们就做了一件事情,2014年,其团队从事人脸识别,在全球第一次让机器的人脸识别能力超过了人的眼睛,像AlphaGo一样,在某一个人类定义的单项任务上,机器超越了人类。然而在真正应用、从实验室走向大规模的产业化的时候,发现从实验室走出需要不断提升。

2014年,他们用20万人脸来对机器进行了训练做到了98.5%的准确率,而人是97.5%;2015年用30万人脸进行训练,达到了99.55%的准确率;2016年,用6000万人脸训练可以达到了百万分之一的误识率;2017年,用20亿人脸训练可以达到一亿分之一的误识率,而这样的误识率才可以真正地应用到各行各业,包括监控、金融、安防、手机等行业。

除了人脸识别之外,汤晓鸥还介绍了视频分析中的行为检测,比如,里约奥运会的跳水比赛直播,可以用计算机视觉分析方法将视频里的内容重点检测出来,跳过没有意义的部分,直接看一些真正的跳水的镜头。除此之外,还有基于内容的视频搜索,从电影种把各式各样的片段搜索出来;或是基于自然语言进行场景搜索,通过用自然语言描述响应的场景,可以自动搜索出相关的内容。总结起来,就是我们在教机器,教会他们下棋、识别人脸等等。

汤晓鸥表示,实际上所有的任务,都是我们人安排给机器做的,机器是按照我们的指令在做事情,不存在机器控制人类这样的事情,AI的真正目的是帮助人类,帮助我们提高生产效率。

他还给年轻人留下两句话:

第一句,电影一定要自己亲自去看。

第二句,AI这个词在中国拼音翻译过来就是“爱”,所以谈恋爱也要自己亲自去谈,否则你就不止“前任3”了,很有可能“前任4”、“前任5”了。

《AI崛起在于利用非结构化数据》——自然语言处理顶级专家,宾夕法尼亚计算机与大学教授Dan Roth

当我们连接wifi的时候,或者当你在下载的时候,会出现一个提示框询问你是否接受用户协议。这是一份很长的文本,那么你要接受吗?要认同吗?可能你会回答,对,我要接受,哪怕这个时候,可能你还没有读完这份长长的文本。但是这个文本中会涉及很多问题,比如,它会如何利用我的个人信息?不会侵害我的隐私?我们需要了解这些知识,这个文本能不能让用户清楚了解这些相关的保密内容呢?我们现在还没有一种稳定的方法可以去了解整个文本的内容,这就是我们现在遇到的问题。这个问题不仅是一个科学上的问题。这些文本关乎我们个人信息的安全性,这是每个人都要面对的问题。

因此,这就引出了Dan Roth所说的大多数的数据都是非结构性的。而建立一个系统,进行分析、学习,弄懂它背后的意义,这就成为一个重要的任务。

对于计算机而言,弄懂语意理解是十分困难的,因为在他们的背后有两层意思,包括语言层和底层意义层,语言层具有模糊性,可能会产生歧义,我们需要了解它的背景推测它的意义除此之外,语言层还有多样性,想要表达的每一点,都可以通过不同的方式表达出来。

其中,Dan Roth举了一个例子,三篇文本中,都提到了芝加哥,但可能提到芝加哥的乐队、足球队等都可以表达出芝加哥的意思。

传统的编程能力暂时没办法帮助我们解决语言的模糊性问题。所以就要利用最新的机器学习去减少文本中的模糊性,去连接语言中的逻辑,去解读背景知识,去识别不同的词汇之间,以最终消解这种模糊性。

机器学习是解决语言中模糊性和多样性一个必要的工具,在过去几年我们也看到了这个领域的发展。我们有不同分类方法来解决文本分类问题,他们依据不同的规则,使用不同的方法。比如我们会通过打上一个标签对文本进行标记,在标记的过程中对文件进行分类。比如可以通过病例来判断一个患者是否可以复诊,这是一种宏观的分类方法。

人工智能能够帮助我们进行分类,在过去的几年它也取得了长足的发展。这其中不仅有机器学习发展的功劳,还有其他的技术,包括计算能力的发展和储存成本的下降,都促进了机器学习领域的发展,还有新的分类方法的诞生。

大家如果关注这个领域,就会发现现在机器学习分类还不是非常的有效。如果把这些方法比喻成一个魔盒的话,需要了解这个魔盒中需要什么样的工具和内容。

我们不仅需要找到方法,更应该了解推理的方法,包括了解原因、假设结果和测试方法。因为推理应该是分类之上的逻辑,让同样的类别在一起进行集成。我们要清楚,一个点是否能推到下一个点,这样才能更好的解决问题、回答问题和进行优化。

自然语言处理现在有很多应用。比如,一个律所需要获得所有人的名字,这些人名都包含在邮件中,有不同的分析邮件的方法,我们该如何确定这些人的名单呢?我们还没有真正完全解决这些问题,还有许多其他挑战,包括推理、适应性训练,因为现在的模型大多不具有普适性。因此,最大的挑战是——监督。

那什么是监督?就是神经网络的监督。我们赋予神经网络一个任务,去模拟它,然后收集数据,设置一个模型。但现在我们发现我们的数据不够,没有办法去训练所有的模型,我们也不太清楚,什么是全部的任务。那这种方法就无法升级和进行普适性的应用,它更大程度上是只是一种偶然性的训练。

财经自媒体联盟

新浪首页 语音播报 相关新闻 返回顶部