中科院潘毅:人工智能赋能生物医药,解锁未来更多可能性

中科院潘毅:人工智能赋能生物医药,解锁未来更多可能性
2021年09月26日 21:04 智慧芽数据

#智慧芽创新赋能大会洞察#9月16日,备受关注的“智慧芽2021创新赋能大会”在上海举办。大会邀请了超过40位行业重磅嘉宾就20多个热门议题发表演讲讨论,这些思考中国科技创新的干货内容,今起整理成文,与大家共享。

在“智慧芽2021创新赋能大会”论坛上,中科院深理工计算机科学与控制工程学院、美国医学与生物工程院院士潘毅深入分析了人工智能及大数据等技术在生物医学领域应用所面临的挑战,并提出了应对挑战时需要提升的关键核心技术等。

以下为潘毅演讲全文(文章根据演讲整理,有删减)

随着人工智能技术的不断发展,大数据越来越多地被应用于医疗实践中,如临床决策、慢病干预、规范用药、监控预警等场景。值得注意的是,在控制应对新冠疫情时,不仅生物医学起到了至关重要的作用,人工智能和大数据技术发挥的助益同样不可忽视。

大数据平台通过搜集分析手机信令数据、居民出行记录等信息,可以对传染病时空传播过程进行城市级别的高分辨率模拟与预测,以及进行本地家庭、社区人群中传播效能、传播规律和驱动因素的研究等。同时,AI提高了生物医学行业的数据挖掘能力,助力研究新型冠状病毒2019-nCoV动物宿主朔源、和分子遗传变异规律,以及加速新冠疫苗研发等。可以说,生物医学已经进入了大数据时代。

生物医学发展面临的大数据挑战

虽然人工智能应用于生物医学领域已逐渐成为行业前沿探索的方向,并且取得了许多突破性成果,但当医疗数据的数量级升至“海量”时,所面临的挑战也将出现几何倍数的增长

首先,在生物医学实践中,目前已存有海量的临床、遗传和行为学数据,并且这些数据每日还在持续新增。现今医疗大数据所涉及的资料规模,已经巨大到无法通过目前主流的软件工具,在合理时间内达到撷取、管理、处理,并整理成为帮助决策的资讯。因此,虽然上述数据蕴藏着巨大的应用价值,但如何高速有效地处理医疗大数据,成为了人工智能领域计算机科学家必须克服的挑战。

其次,医疗大数据与其他领域的数据相比,还有几点会对数据获取、处理产生阻碍的特征。如在医疗实践中产生的数据的模态种类繁多,包括但不限于纯数据、信号、图像、文字、动画、语音、视频等。此外,患者就诊、疾病的病程以及疾病的检查具有时序性,处理时必须注意先后顺序。而上述数据还可能存在因人工记录、数据偏差、人为原因或未确诊所导致的数据残缺或不确定性表述,以及在海量就诊数据中产生的冗余甚至相互矛盾的信息等。因此,在使用这些数据前,计算机科学家必须运用人工智能技术对其进行筛选和标准化处理

最后,人工智能在生物医学领域的应用还将面临硬件与软件的双重考验。硬件上,人工智能时代是拼硬件的时代,存储与处理海量数据都需要极大的算力支撑;而软件则反映在计算机科学家身上,由于生物医学的准入门槛较高,他们不仅要对人工智能和大数据等领域的技能熟练掌握运用,还必须对医疗大数据所涉及的生物医学专业知识有着准确深刻的理解

简而言之,人工智能和大数据虽然已经开始应用于人类生命研究和健康管理的多个阶段,但若想进一步挖掘其潜藏的价值,还需跨越众多挑战。

第三代AI系统助力生物医学大数据研究

第一代AI系统是知识驱动,即用机器来描述人类的知识,但人的知识是有限的,基于现有的知识可能无法有效地发现细微的逻辑、未知的规律等。而第二代AI系统则是数据驱动,可以利用深度学习找到数据背后的函数关系,然而容易受到网络结构复杂程度的影响,出现欠拟合或过拟合现象。因此,将上述两代AI系统进行有机结合,形成了第三代AI系统,在知识上拥有逻辑推理能力,可以举一反三,同时在数据上拥有归纳能力,可以举十反一。

在应对上文所述的挑战时,第三代AI系统将凭借其技术优势,从知识嵌入、多模态数据融合以及结果解释等关键技术上进行突破。

所谓“知识嵌入”是指通过数据增强、损失项正则化、知识图谱等方式将先验知识注入人工智能,让机器以类似人脑的方式学习,减少必须的训练数据量以提升准确率。以下图为例,当没有先验知识注入时,人工智能无法准确识别人形,但当注入”天是蓝色、云是白色、人脸是黄色、树是绿色“等基本的先验知识后,识别准确率有了显著提升。

而“多模态数据融合”是指将各类形式的数据信息,在融合处理后进行综合分析。以自闭症检测为例,将行为学、分析遗传学、影像学等生物医学大数据进行分析处理,得到相关的人工智能基础算法和共性技术。而后将行为学维度的自闭症监测、基因领域的疾病关联分析以及MRI影像领域的人工智能分析的结果进行有机结合,最终形成一套多模态融合分析技术和院外到院内的逐级筛查策略。

第三项“结果解释”技术则是指人工智能在生物医学领域,不仅要能判断是非对错,还要找到背后的原因和逻辑。以蛋白质相关的研究为例,未来通过人工智能,不仅可以知道什么条件可能决定哪种蛋白质结构,也能知道什么条件会决定不可能的蛋白质结构,以及蛋白质结构是由哪个氨基酸的变化所引起的等信息,由此减少生物实验的次数,提升研究效率。

人工智能、大数据等技术将对生物医学发展产生巨大影响,已逐渐成为行业共识。目前这些技术所引发的医疗突破,仅仅只是开始。未来,我们可以期待,在更多前沿技术的助力下,实现疾病预测、精准医疗等创想。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部