Emtech China峰会在京召开顶尖大脑聚焦这一趟值了！_

1月28日，《麻省理工科技评论》与DeepTech深科技主办的新兴科技峰会EmTech China于北京国贸大酒店正式召开。

《麻省理工科技评论》的EmTech 系列峰会已经在全球举办超过19年。来自世界各地的18位顶尖科学家、21 名科技公司领袖、35 位青年科技先锋出席了本次千人级大会EmTech China ，并在现场分享他们对于新兴科技的深刻见解。

延续《麻省理工科技评论》系列峰会的既往传统，2018年的EmTech China同样将目光聚焦在新兴科技上，这一次，人工智能、区块链、量子计算、可持续能源、生物医疗、自动驾驶成为本次大会的热门关键词。

而在这场科技大牛的盛会上，主办方邀请到了来自谷歌、亚马逊、高通、NVIDIA、微软、IBM、D-Wave、麻省理工学院、宾夕法尼亚大学、斯坦福大学、阿里巴巴、腾讯、科大讯飞、宜信公司、商汤科技、远景能源、平安科技、Hyperledger、Flagship Pioneering等机构。

我们也得到了他们对于科技趋势的独到见解。在28日这一场中主要议题以人工智能为主，共包括“实验室里的AI诞生记”、“云端上的AI风暴”、“芯片让AI重生？”、“企业级AI的高阶打法”、“AI对战星际争霸胜算几何？”五大板块。

让我们一起去看看他们都说了什么？

“实验室里的AI诞生记”

《深度学习：从炼金术走向化学》——MIT计算机科学与人工智能实验室教授Tomaso Poggio

在Tomaso Poggio的演讲中，他表示，深度学习有点像我们这个时代的炼金术，但是需要从炼金术转化为真正的化学。这样我们才能知道，深度学习在未来到底可以实现什么。

他举了一个将计算机视觉和机器学习进行整合的例子，机器识别行人和信号灯，从与原本的每秒出现10个错误变成每30英里只出现一个错误。究其背后成功的动因，是机器学习的算法，第一是深度学习，第二是强化学习。

深度学习可以帮助我们解决10%的难题，剩下的90%呢？Tomaso Poggio给出的答案是可能也需要来自神经科学以及认知科学的研究，更好地了解人的思维和大脑。这也是MIT大脑、心智和机器中心（CBMM）在研究的问题，大脑中智能的产生，是科学现在需要解决的元问题。

CBMM想通过以下三条路径解决这个问题。

一：计算机科学+机器学习

二：神经科学

三：认知科学

过去几年中，技术发展和理论发展、包括深度神经网络领域的发展很显著。要了解深度神经网络的运作原理，需要回答背后的三个基本问题：

1.逼近理论：深层网络什么情况下会比浅层网络更有效？
2.最优化：应该如何设计经验风险函数？
3.学习理论：为什么深度学习不会产生过拟合？

这三个问题是机器学习的奠基石。它们的答案很复杂，要解决这种问题，需要一开始就思考深度学习的一些技术理论，以及它的局限性。

在演讲的最后，Tomaso Poggio表示，现在是应用人工智能的黄金时代，因为深度学习及其工程应用，终于帮助我们将传统的人工智能科学理论应用于了工程实际，而且能够为我们进行赋能。假如我们可以超越深度学习的理论，可以更好的去了解人类智能的话，我们也可以更加深刻地了解我们人类到底是什么。

《人工智能的中国式文艺复兴》——香港中文大学信息工程系教授汤晓鸥

汤晓鸥教授的这段演讲中，以他对目前中国电影的看法开题，简单阐述了原创的重要性，在科技领域，原创一直是大家推崇也不断追求的方面。在谷歌的AlphaGo推出后，不少的公司开始着手让机器去打扑克牌，这反映的是当前的一种现实情况，跟着大公司的步伐走，这好像成为了一种心照不宣的打法，因此，“创新”反而显得尤为宝贵。

汤晓鸥表示，在AlphaGo之前他们就做了一件事情，2014年，其团队从事人脸识别，在全球第一次让机器的人脸识别能力超过了人的眼睛，像AlphaGo一样，在某一个人类定义的单项任务上，机器超越了人类。然而在真正应用、从实验室走向大规模的产业化的时候，发现从实验室走出需要不断提升。

2014年，他们用20万人脸来对机器进行了训练做到了98.5%的准确率，而人是97.5%；2015年用30万人脸进行训练，达到了99.55%的准确率；2016年，用6000万人脸训练可以达到了百万分之一的误识率；2017年，用20亿人脸训练可以达到一亿分之一的误识率，而这样的误识率才可以真正地应用到各行各业，包括监控、金融、安防、手机等行业。

除了人脸识别之外，汤晓鸥还介绍了视频分析中的行为检测，比如，里约奥运会的跳水比赛直播，可以用计算机视觉分析方法将视频里的内容重点检测出来，跳过没有意义的部分，直接看一些真正的跳水的镜头。除此之外，还有基于内容的视频搜索，从电影种把各式各样的片段搜索出来；或是基于自然语言进行场景搜索，通过用自然语言描述响应的场景，可以自动搜索出相关的内容。总结起来，就是我们在教机器，教会他们下棋、识别人脸等等。

汤晓鸥表示，实际上所有的任务，都是我们人安排给机器做的，机器是按照我们的指令在做事情，不存在机器控制人类这样的事情，AI的真正目的是帮助人类，帮助我们提高生产效率。

他还给年轻人留下两句话：

第一句，电影一定要自己亲自去看。

第二句，AI这个词在中国拼音翻译过来就是“爱”，所以谈恋爱也要自己亲自去谈，否则你就不止“前任3”了，很有可能“前任4”、“前任5”了。

《AI崛起在于利用非结构化数据》——自然语言处理顶级专家，宾夕法尼亚计算机与大学教授Dan Roth

当我们连接wifi的时候，或者当你在下载的时候，会出现一个提示框询问你是否接受用户协议。这是一份很长的文本，那么你要接受吗？要认同吗？可能你会回答，对，我要接受，哪怕这个时候，可能你还没有读完这份长长的文本。但是这个文本中会涉及很多问题，比如，它会如何利用我的个人信息？不会侵害我的隐私？我们需要了解这些知识，这个文本能不能让用户清楚了解这些相关的保密内容呢？我们现在还没有一种稳定的方法可以去了解整个文本的内容，这就是我们现在遇到的问题。这个问题不仅是一个科学上的问题。这些文本关乎我们个人信息的安全性，这是每个人都要面对的问题。

因此，这就引出了Dan Roth所说的大多数的数据都是非结构性的。而建立一个系统，进行分析、学习，弄懂它背后的意义，这就成为一个重要的任务。

对于计算机而言，弄懂语意理解是十分困难的，因为在他们的背后有两层意思，包括语言层和底层意义层，语言层具有模糊性，可能会产生歧义，我们需要了解它的背景推测它的意义除此之外，语言层还有多样性，想要表达的每一点，都可以通过不同的方式表达出来。

其中，Dan Roth举了一个例子，三篇文本中，都提到了芝加哥，但可能提到芝加哥的乐队、足球队等都可以表达出芝加哥的意思。

传统的编程能力暂时没办法帮助我们解决语言的模糊性问题。所以就要利用最新的机器学习去减少文本中的模糊性，去连接语言中的逻辑，去解读背景知识，去识别不同的词汇之间，以最终消解这种模糊性。

机器学习是解决语言中模糊性和多样性一个必要的工具，在过去几年我们也看到了这个领域的发展。我们有不同分类方法来解决文本分类问题，他们依据不同的规则，使用不同的方法。比如我们会通过打上一个标签对文本进行标记，在标记的过程中对文件进行分类。比如可以通过病例来判断一个患者是否可以复诊，这是一种宏观的分类方法。

人工智能能够帮助我们进行分类，在过去的几年它也取得了长足的发展。这其中不仅有机器学习发展的功劳，还有其他的技术，包括计算能力的发展和储存成本的下降，都促进了机器学习领域的发展，还有新的分类方法的诞生。

大家如果关注这个领域，就会发现现在机器学习分类还不是非常的有效。如果把这些方法比喻成一个魔盒的话，需要了解这个魔盒中需要什么样的工具和内容。

我们不仅需要找到方法，更应该了解推理的方法，包括了解原因、假设结果和测试方法。因为推理应该是分类之上的逻辑，让同样的类别在一起进行集成。我们要清楚，一个点是否能推到下一个点，这样才能更好的解决问题、回答问题和进行优化。

自然语言处理现在有很多应用。比如，一个律所需要获得所有人的名字，这些人名都包含在邮件中，有不同的分析邮件的方法，我们该如何确定这些人的名单呢？我们还没有真正完全解决这些问题，还有许多其他挑战，包括推理、适应性训练，因为现在的模型大多不具有普适性。因此，最大的挑战是——监督。

那什么是监督？就是神经网络的监督。我们赋予神经网络一个任务，去模拟它，然后收集数据，设置一个模型。但现在我们发现我们的数据不够，没有办法去训练所有的模型，我们也不太清楚，什么是全部的任务。那这种方法就无法升级和进行普适性的应用，它更大程度上是只是一种偶然性的训练。