中国工程院院士谭建荣:大数据的应用将对人工智能等其他技术有很大推动

中国工程院院士谭建荣:大数据的应用将对人工智能等其他技术有很大推动
2020年08月03日 17:36 环球网

7月29日,永不落幕的数博会2020系列活动之“数博对话:赋能实体经济,推动产业创新——大数据与实体经济融合发展”活动在贵州铜仁举行,中国工程院院士谭建荣通过网络连线,在题为《大数据思维与新基建发展:关键技术与发展趋势》的演讲中说,大数据的应用将对人工智能等其他技术有很大推动。

中国工程院院士谭建荣,来自浙江大学,最近主要从事数据建模等方面的研究。

新基建跟大数据有什么关系呢?

谭建荣说,新基建跟老基建不一样,老基建投入主要是土木工程、基本建设、高速公路等等,新基建也包括这些,但主要还是互联网、大数据、人工智能、5G这些基本工程。

大数据和互联网到底是什么关系呢?

谭建荣说,大数据是从哪里来的呢?前面的领导说,贵州、铜仁的大数据搞得非常好。“大数据”实际上不是个新词,40年前有个叫阿尔文○托夫勒的人,美国华盛顿大学教授,在40年前写了本书叫《第三次浪潮》,把人类整个发展历史分为三个阶段,第一阶段的浪潮是农业阶段,大概在一万年前开始;第二阶段是工业阶段,是从14世纪末开始;而现在正处于第三阶段,就是信息发展阶段。40年前,阿尔文○托夫勒就预见到,互联网是一个的舞台,唱戏的主角是大数据,大数据奏响第三次浪潮的华彩乐章。

谭建荣说,从1980年托夫勒提出大数据概念以来, 2006年,提出了人脑模仿机制的深度学习的概念。人工智能其实在60年前就诞生了,但是相当长时期人工智能发展缓慢。最近人工智能,比如阿尔法狗(下围棋的机器人),就是利用了深度学习的概念。2008年维克托·迈尔—舍恩伯格等最早洞见大数据时代发展趋势,出版了《大数据时代》。2008年Nature出版了大数据专刊,分析了大数据对科学的影响和意义,探讨了大数据研究与应用的方向。2011年,Science推出《数据处理》专刊,从互联网技术、超级计算、环境科学、生物医药等方面介绍了海量数据所带来的技术挑战。2013年,DeepMind将深度学习和强化学习两者精髓合二为一,提出了深度增强学习。2016年人工智能与大数据结合,有了阿尔法狗深度学习的概念。

关于大数据的作用,谭建荣说,大数据给社会各行各业带来了深远的影响,推动了社会的巨大进步。首先大数据推动了科学技术的创新,包括分布式存储与计算、数据挖掘与分析、商业智能。其次大数据推动研究方法的改变,包括科学研究第四范式(数据密集型科学)、大数据协同创新、抽样调研变为网络海量行为分析。大数据提供了第四种范式,就是用数据来寻找科学路径,通过数据挖掘、数据优化、数据应用来找到科学的路径。这次新冠病毒防疫过程中,大数据的方法起了很大的作用。在杭州,阿里巴巴、支付宝率先提出了健康码,利用大数据来判断你是不是个危险的病人,你是不是来自危险的地区、危险的区域,健康码迅速推向了全国,现在全国各地健康码是我们重要的一个推断依据。而大数据最重要的革命性的变革,是推动了思维方式的变革,这非常重要,我们由过去的业务驱动转向现在的数据驱动,用大数据的方法来决策,而不是领导拍脑袋来决策,利用数据来支撑我们的决策。从经济上看,数据就是最宝贵的资源,也有人说数据资源的价值超过实用的价值,所以数据驱动的决策使得我们整个思维方式起了深刻的变化。

什么是大数据思维?

谭建荣说,第一,大数据资源是重要战略资源。大数据能够提供丰富的战略资源,数据就代表了资源,大数据代表了资源的丰富,大数据思维就表明我们哪些是优势、哪些不足,能够找出自己的短板,能够找到前进的动力。

第二,大数据是各类客观规律反映。数据反映的规律是客观规律。我们现在要用市场进行资源配置,市场如何反映出来,就要通过数据。市场的变化、工程技术的发展、人民生活的改善都要通过数据来反映。我们现在的目标是要实现小康社会,满足人民不断实现美好生活的追求。人民美好生活怎么样反映出来,就通过大数据反映。现在各地领导对GDP增长、税收增长、财政收入增长非常关注,但是我们更加要关注人民美好生活的增长,因为所有的努力、所有的GDP、所有的财政收入、所有的税收,最后集中反映在人民生活的改善、人民对美好生活的追求。

第三,大数据是创新转型主要依据。现在实体经济需要转型升级,我们需要提供更多的创新产品、创新技术、创新实体。很多企业也很困惑,改革开放以来,我们国家也得到了长足发展,为人民生活提供了大量产品。但是最近几年,由于国内外环境的变化,我们制造企业、实体企业相当一部分处于比较困难的阶段,很多企业渴望转型升级,但转向哪里、升向何方?我们就从大数据里找方向,大数据来寻找市场机遇、寻找创新依据。

有人问,数据前面为什么要加“大”字?很多人都回答不出来。“小数据”是不是可以?有时候也可以,有确定关系的“小数据”就可以。为什么要“大数据”呢?主要是在数据里面,尤其在统计学里面有个“大数据”。随着统计样本趋向于无穷大,样本的均值就等于平均数。所以大数据强调的是关联关系。我们前面说人工智能自1956年提出以后相当长时间发展缓慢,为什么这几年发展很快呢,可以说是大数据挽救了人工智能。过去专家系统强调的是因果关系,这是比较困难的,体现在计算机的统计上。过去三十年以前,我学习人工智能用的语言,需要用几千、几万句才能编好一个程序,这非常困难。现在的大数据在新的关联中找出必然的关系,从整体的观念、大局的观念来看问题,来把握问题的症结,这是大局观。大数据强调了数据协同、数据匹配,要求协同观。数据挖掘、数据聚合,最后要聚焦到某几个结论上,这就要求我们聚集观。大局观、协同观、聚集观的三个思维方式,成了大数据思维的主要特点。

大数据跟新基建有什么关系?

谭建荣说,目前,由于国内外的经济环境发生了深刻变化,特别是今年以来新冠病毒疫情的发生,目前中国控制得比较好,可以说基本控制住了,尽管北京新发地、新疆、大连还有偶发的病例,我们还要严防死守,但整体上国内大部分地区人民的活动已经摆脱了新冠疫情的困扰,我们的国家采取了正确的防护,但国际疫情环境还在恶化和蔓延。浙江主要是外向型经济,今年上半年GDP总增长是0.5%,这是非常不容易的,先是新冠病毒影响,后来又是外向型经济影响,所以浙江现在大的环境需求和生产、投资、消费、出口都受到了影响,我们现在需要复工复产,现在对餐饮、旅游、电影、教育、教育培训等都受到了一定程度的冲击,民营企业、小微企业等等都非常的困难。

谭建荣说,现在搞新基建,我认为在我们国家这样的背景下是非常必要也非常重要的。新基建的主要内容包括5G新一代通信技术、高速铁路、城市轨道、新能源等等,这几个领域以技术创新为驱动,以信息网络为基础,达到融合创新。在新基建的七大领域中,最基础的是5G和新一代通讯技术,能万物互联、赋能未来。5G将成为2020年和今后一段时间我们推广的重点。看通讯技术的发展,跟科学技术的整个发展是同步的,在八十年代主要是语音通话。移动电话是美国摩托罗拉发明的,当时传到中国叫大哥大,在深圳推出。传到内地以后,高校、机关、事业单位的人还不敢用,因为当时有些领导对大哥大有些看法,当时三句话:头理阿飞头、脚穿喇叭裤、手拿大哥大,就认为这些人是不三不四的,观念的变化也非常重要,现在每个人都用手机,已经习以为常了。

2010年乔布斯发明了智能手机,当时支持的网络实际就是4G。到了2020年,我们要构建智慧城市、智慧工厂,要建立大数据为支撑的智能社会,这就需要5G的支持。5G最受益的技术就是大数据,5G将对大数据产生颠覆性的变化,5G以后数据量急剧上升,会产生质的飞跃。5G通过用户直联设备,数据量上升非常明显。5G增强移动宽带、大规模物联网、超高可靠低时延通信,这三方面都会使数据量急遽增加,这将对大数据提供了更加广阔的资源,也对大数据提出了更高的要求。

数据中心的建设将是新基建的一个重要内容,数据中心通过全球网络基础设施上传递、加速、展示、计算、储存。大数据中心不仅仅是传统的数据中心及其承载的分布式海量数据储存和处理的能力,更重要的是运用大数据的思想和技术。我们每天产生的数据估计会以10倍数增长,估计会从10GB/天到4TB/天,这就需要挖掘、分类大数据。产业链很杂,包括服务器、路由器、交换机、光模块、电源、网络、机房等等。

谭建荣还说,大数据的应用将对人工智能等其他技术都有很大的推动。可以运用到工业上,智能IP网络与工业互联,工业互联与精益设计,我的团队结合工业互联、智能制造,把大数据技术用到产品实际设计中做了很多工作,包括高档数控机床数字化设计的关键技术、电梯产品大批量定制与数字化智能化设计技术等等,为提高企业转型升级提供了科学的基础。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部