在人类探索宇宙的征程中,人工智能对海量数据的深度挖掘、分析能力,已成为重要技术;在分子生物学和遗传学中,人工智能正在改变蛋白质折叠预测、新型药物快速研发、基因测序和分析;在化学中,人工智能使得一个世纪完成的元素周期表在几个小时内重构……
“目前,以GPT-3、Switch Transformer为代表,布局大模型已成为世界性趋势。未来,人工智能大模型时代即将到来,大模型会形成类似‘电网’的基础设施,为社会提供智力能源。”9月24日,在2021中关村论坛“人工智能与多学科协同创新论坛”上,智源研究院院长黄铁军教授说。
今年,智源研究院发布“悟道”大模型,连创“中国首个”与“世界最大”纪录。与会专家认为,在大模型时代,人工智能与神经科学、认知科学、量子科学、心理学、数学、经济学、社会学等相关基础学科加快交叉融合,大大拓展了时间、空间和人们认知范围,科学研究范式以及普通人的生活都在发生深刻变革。
传统科学领域正成为人工智能主战场
“化学、材料、生物、工程等传统科学领域,正成为人工智能的主战场。” 中国科学院院士、北京大学教授鄂维南在主旨演讲时说。鄂维南表示,有了人工智能,科学研究就可以从“小农作坊”模式转变为“安卓模式”,也就是平台科研。以其所从事的合金材料性质研究为例,“小农作坊”模式下,从理论到开发,如量子力学计算、拟合数据到分子动力学模拟,每个阶段找一个博士后做,一般要三年,这样下来十年过去了。“这种小农作坊的模式,从前到后全部自己搞定了。”鄂维南说,“优点是自给自足,但最大的问题是效率极差。”“以往,要改变这种科研模式并不容易。现在有了人工智能就不一样了,我们可以做一些统一的大平台,这个通用的大平台可以帮助你解决物理模型设计、分子动力学模拟等基本问题,同时在这些平台上你也能做感兴趣的应用和开发。”鄂维南强调。“这种模式,就叫‘安卓模式’,效率大大提升。”鄂维南说。未来,人工智能将深入到科学研究和技术创新的方方面面,科学研究将因为人工智能的加入而走上快车道,科学研究和技术创新的联系也将更加密切。在微软亚洲研究院副院长刘铁岩看来,近些年,人工智能虽备受关注,取得了长足发展,但其产业价值主要体现在语音识别、人脸识别等方面,科学价值也主要是在对噪声数据进行预处理、对光谱数据、天文图片等进行模式识别等辅助问题上发挥作用。“这些应用仍然是星星之火,尚未形成燎原之势,还有巨大提升空间。”刘铁岩说,作为研究人工智能的学者和从业者,必须要有勇气走出自己的舒适圈,拥抱更多的交叉学科和产业,才能推动人工智能本质发展。
悟道大模型 从世界最大到产业落地
“世界最大,大有可为。” 智源研究院副院长、清华大学教授唐杰在发布大模型应用技术创新时说,简单讲,就是更好用。
智源研究院副院长、清华大学教授唐杰发布大模型应用技术创新
唐杰介绍,“低门槛+高效率+高情商”的“悟道”开放平台及技术创新,包括“悟道”大模型开放平台、大模型高效推理工具包BMInf、全新升级的AI文图绘画大师CogView和实现大模型群聊的对话模型EVA,大模型性能进一步提升,更加便捷易用。AI工业化开发模式的“悟道”大模型开放平台,使得企业可以通过“大模型+少量微调”AI开发模式,实现十亿级别模型的在线训练与微调,规模化、产业化地进行AI应用开发,大大降低大模型开发门槛。与这些拗口的应用技术创新相比,“悟道”大模型赋能产业的最新技术应用更受与会者关注。目前,至少有1亿新问题无法通过AI语音助手找到答案,这些长尾问题单个问题命中率低、体量大却无法穷尽,非常影响用户体验,而传统人工标注带来的高昂经济与时间成本,令企业难以承受,因此“沉默”成为长尾问题的普遍答案。针对这一问题,智源“悟道”大模型与OPPO小布助手合作,基于“悟道”大模型创新性地开启“生成式回答系统”,全面功能上线后将极大解决行业共通性的长尾问题,单条回答的建设成本降低99%。相比智能语音助手传统“检索式回答”路径,悟道“生成式问答”不再局限于现存语料库的有限内容,借助大模型+知识图谱,高效、经济、大规模生成新的问答对,显著提升问答体验。
再就是基于智源“悟道”大模型的冬奥手语播报数字人,也正式亮相。这一“悟道”手语播报数字人,将在北京冬奥会期间正式投入应用,提供全流程智能化的数字人手语生成服务,方便听障人士收看赛事专题报道,提升他们的社会参与度和幸福感。这是“悟道”智能大模型在冬奥新场景下,进行智能普惠的关键一步,填补了这一领域的国内外空白。
一系列基于大模型应用的技术创新和产业成果的成功发布,预示着大模型时代正在走来。智源悟道CEO路绪清表示,大模型为代表的AI突破可以给产业界带来巨大改变。“概括说,就是未来所有人类社会需要一万小时训练才能获得的技能,都可以由当前的AI技术来模拟。”
“大模型就是把社会的各种数据资源、最强的算法以及算力整合在一起,变成公共基础平台。”黄铁军总结说。因此,他呼吁产学研共同努力发展大模型,使其更好地服务于各种应用。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有