前段时间,“全球顶尖生物学家颜宁落户深圳参与创建深圳医学科学院”的消息再度将大众的目光移焦在 “基础科学”领域。当前的数字化时代,算力、AI等信息技术正不断发展,以算力为代表的数字根基和以AI为代表的智能根基在不断加强,基础科学也在融入算力和智能的同时得到不断进化。
日前,记者从华为全联接大会2022上获悉,科学计算因引入了AI等技术,正在向科学智能的新阶段迈进。而一直以来,专注计算和AI软硬件根技术的华为,此次基于鲲鹏和昇腾AI两大算力体系,推出了科学智能基础软硬件平台,并倡议成立科学智能创新联合体,携手产学研伙伴,共建科学智能新生态。
什么是科学智能?AI在基础科学领域发挥了哪些作用?又为什么要建设数智生态?下面就一起来聊聊。
0为缓解3大挑战引入AI
01
为缓解3大挑战引入AI
科学计算进入科学智能新阶段
首先,科普一下科学计算。
据了解,当前人工智能技术趋势正朝着通用大模型方向发展,大模型具备更强泛化能力,可覆盖多业务场景,发展大模型也成为产学研各界共识。而科学计算是继大模型之后,AI发展的另一重要方向。
在此之前,借助高性能计算,科学计算对基础科学研究和国计民生行业产生了重大推动作用。但是,科学计算依然面临着维数灾难,计算尺度受限,理论突破与工程方法创新缓慢3大挑战;所以,现在越来越多的科学家正在将AI技术引入到科学计算,科学计算也从传统的HPC进入到科学智能的新阶段。
由此来看,科学智能可以同时覆盖HPC与AI两大技术领域,包含了3大计算场景。
第一个场景是AI赋能机理计算 ,它是将AI计算嵌入到机理计算中,实现AI对机理计算的加速。
第二个场景是数据驱动的AI计算,它不依赖于数学机理,通过大量的数据输入,获得AI模型,通过AI计算获得结果。
第三个场景则是机理计算与AI计算相结合,它提升了科学计算的准确率和计算效率。
目前,科学计算已经进入科学智能新阶段,其创新技术已经在气象、新材料研发、生物信息等领域中得到应用。
02
为科学研究提供“AI范式”
昇思MindSpore助力基础科学研究
然而,因为原有单一的、烟囱似的软硬件平台已经无法满足科学智能时代的应用创新需求。华为便基于鲲鹏和昇腾AI两大算力体系,充分融合HPC和AI两大技术领域的既有优势,通过创新的计算架构,打造了围绕科学智能原生的多样性算力软硬件平台,为科学基础研究提供了“AI范式”。
本次华为全联接大会上,华为宣布昇腾AI基础软硬件全面升级。华为聚焦智能根基创新,围绕“极致性能、极简易用”持续夯实昇腾AI基础软硬件平台。CANN 6.0开放底层开发体系,算子自定义开发效率倍级提升。在大模型能力持续增强的基础上,昇思MindSpore 2.0升级为AI融合框架,原生支持科学智能。
今年7月,华为与北京昌平实验室、北京大学生物医学前沿创新中心和化学与分子工程学院、深圳湾实验室高毅勤教授课题组一同,在昇腾 AI 强大算力支持下,成功在全场景 AI 框架昇思 MindSpore 上推出了全流程蛋白质结构预测工具 MEGA-Protein。
该工具提供了高精度高性能蛋白质结构和功能预测,突破了在“孤儿序列”、高异变序列和人造蛋白等 MSA 匮乏场景下无法做出准确预测的限制。这是该团队在昇腾 AI 基础软硬件平台上实现的蛋白质结构预测从训练到推理全流程打通,且效率相比AlphaFold2提升 2 至 3 倍后,取得的又一次成功。
北京大学李兆基讲席教授谢晓亮表示,创新自研的AI MSA引擎和基于昇思 MindSpore的蛋白质结构预测程序的开源,标志着我国在全球蛋白质结构预测领域名列前茅。目前,该工具的相关代码和模型参数已在昇思 MindSpore 社区开源,算法和相关的论文都已向业界公布。
在两年前,昇思MindSpore正式开源,社区便向业界推出了业界首个全场景AI框架MindSpore1.0;去年,又推出原生支持大模型开发的MindSpore1.5,目前已经发布了20多个基于昇思的大模型。
开源两年多来,昇思MindSpore 生态已全面发展,目前已经有超过8000多名社区贡献者,服务于140多所高校、科研机构和5500多家企业。在过去的一年多里,基于昇思框架发表的顶级会议论文数量位列中国第一,全球领先。
在此之前,华为还联合鹏城实验室,基于昇思MindSpore 打造鹏程.神农平台,加速下一代抗生素的探索和研发。
事实上,除了升级昇腾AI基础软硬件平台,过去一年多,在大模型开发方面,华为也和业界伙伴积极探索,共同助力基础科学研究,并开创出了一条大模型产业化的新模式:即围绕某个领域的大模型,建立产学研用的产业联合体,让科研创新更了解行业场景,同时促进产业伙伴直接基于大模型孵化行业应用。
两个月前,华为围绕业界首个工业级流体仿真大模型“东方.御风”,成立了智能流体力学产业联合体。
未来,华为还计划和伙伴一起在电磁智能、智慧育种、AI 生物制药等领域成立产业联合体,助力相关领域的大模型创新和产业化发展。
03
科学智能也要产业化落地
需共建数智生态,华为倡议成立科学智能创新联合体
科学智能也要实现产业化落地。不仅如此,它还需要突破科研理论,创新工程方法,并构建产业生态,聚焦产业价值场景,打通科研创新、应用示范到产业推广的通道。
而任何技术和产业的发展都离不开生态的支撑。华为倡议成立科学智能创新联合体,希望聚集政策、科研和产业的优质资源,以科学智能,携手产学研伙伴,拓展科学边界,加速科研创新到产业落地进程,加强交叉学科建设和人才培养,共建繁荣生态,构筑中国科学智能领先格局。
当前,华为与伙伴共打造了六大技术生态,包括鲲鹏、昇腾两个基础生态;面向智能终端的鸿蒙与 HMS 生态;以及面向智能驾驶的MDC生态和面向云服务的华为云生态。
其中,作为数字世界的根基,鲲鹏产业生态稳步发展,硬件伙伴出货占比已达95%以上;欧拉当前累计装机量达245万套,快速跨越生态拐点,预计今年底在中国服务器操作系统领域新增市场份额将达25%,有望成为中国新增市场份额第一;通过使能极简开发、极致性能,鲲鹏在国计民生行业的技术生态满足度从19年的9%逐年稳步提升,到今年年底预计达70%以上,已发展4200多家伙伴,发布12000多个鲲鹏认证解决方案,在政府、金融、交通、电力等行业规模应用。
作为智能世界的根基,昇腾AI产业快速发展,AI能力全面提升。基于昇腾AI基础软硬件平台,昇腾训练、推理解决方案全新升级,训练、推理场景中的易用性和性能全面提升。训练场景中典型模型开发周期小于0.5人周、性能领先业界20%,推理方案支持一站式全流程工具化,开发效率翻倍,模型部署后可自动增量训练,持续迭代,业务不中断,精度不断提升。目前,昇腾AI已发展20多个硬件伙伴,1000多个软件伙伴,并联合推出1600多个解决方案,昇腾开发者数量突破100万。
人才是生态发展的基础。在人才培养方面,华为和教育部紧密合作,启动“智能基座”产教融合协同育人基地项目,让鲲鹏、昇腾走进高校,实践产教融合的新模式。从 2020 年 9 月项目正式启动以来,在 72 所试点高校的共同努力下,已经累计培养了 5000 多名先锋教师,开设了1500 多门课程,累计 50 万名学 生参与了学习和实践,沉淀了大量的教学实践资源。
未来,深圳也将不断探索完善全过程创新生态链,加强基础研究的系统部署和前瞻布局,并与以华为等科技企业为代表的社会力量加大合作力度,为夯实基础研究和创新生态链发展增添动力。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有