安筱鹏:中国没有“百模大战”,未来也不会有“十模大战”

安筱鹏:中国没有“百模大战”,未来也不会有“十模大战”
2024年03月28日 17:56 中国电子报社

编者按:以大模型为代表的人工智能引发的新一轮科技革命和产业变革正向纵深发展,千行百业将面临巨大的机遇和颠覆性的挑战。在工业领域,人工智能是推进新型工业化的关键变量,工业大模型的落地生根将为制造企业探索新型工业化提供全新路径。中国电子报开设“人工智能赋能新型工业化”专栏,走进一线、走进工厂、走进企业,全方位报道以大模型为代表的人工智能技术在工业领域的生动实践。

中国信息化百人会执委安筱鹏

近日,中国信息化百人会执委安筱鹏接受了《中国电子报》记者的独家专访。他指出,中国大模型市场存在“加拉帕戈斯隐忧”,应明确区分基础模型与垂直模型,构建统一的大市场,优化资源匹配,加速产业生态培育。

“通用”是AI大模型的本质特征

“当前社会上对于AI大模型仍存在很多认知误区。AI大模型与之前的传统AI应用是两个不同的物种。”安筱鹏表示。

7年前,安筱鹏曾拜访全球最大的农业机械制造商、世界五百强企业——约翰迪尔,该公司把AI应用到了农业工程机械中。他们有一款喷洒除草机设备,哪些是草,哪些是庄稼,通过当年的AI技术就能精准识别。

“在美国,这种AI应用早已非常成熟,技术水平也是遥遥领先。但这种技术是弱人工智能(Artificial Narrow Intelligence)。”安筱鹏说道,“今天我们再谈的不应该是这种传统的弱人工智能应用,而应该是从AI基础大模型上生长出来的,能够自感知、自学习、自适配的强人工智能应用。”

比如电力行业,无人机在山区电力设备上采集信息后,传统垂直小模型给出的判断是“销子不规范”,而大模型能够基于多模态发展出图像认知能力,给出的结论是“高速公路附近上空,红色涂装的绝缘子左侧连接杆塔金件上,有10个螺栓,其中3个存在销子不规范,包括1个脱销、1个未插紧、1个损毁,已生成异常说明,建议尽快现场确认发起检修”。传统AI应用和AI大模型所带来的价值差异显而易见。

AI大模型的重要特征能实现跨模态、跨场景、跨行业,既能对话做诗,也能做事写代码。未来,随着AI基础大模型的能力越来越强,它在成本、质量、效率等方面都可以碾压传统AI应用。”安筱鹏强调。

“把握人工智能等新科技革命浪潮”“通用人工智能”“产业智能化”,日前,中央提出新一轮产业革命的重要特征“通用人工智能”。

安筱鹏表示,我们今天讨论的碳基生命和硅基生命,讨论是“通用人工智能”的特征。例如,2024年2月19日GeoffreyHinton(辛顿)在牛津大学提出“数字智能会取代生物智能吗?”很明显,在未来20年内,有50%的概率,数字计算会比我们更聪明。

中国没有“百模大战”,也没有“十模大战”

据不完全统计,国内大模型总数已经达到300个。其中,仅北京发布的大模型数量就达到了160个。然而,安筱鹏坦言:“‘百模大战’其实并不存在。”

他进一步解释说道:“打个比方,有100个人参加田径比赛,有的比跳高,有的比百米,有的比标枪。这100个人都在竞赛,但不是一个性质和维度的比赛。国内所谓的‘百模大战’亦是如此,首先要明确AI大模型究竟应该如何定义。”

如果讲人工智能(AI),有多年前就存在的弱人工智能( Artificial NarrowIntelligence),也有可能走向强人工智能(Artificial General Intelligence)的AI大模型。目前AI大模型包括基础模型(foundation model);以及基于基础模型做了一些针对性调试(FINE-tuning)的模型,这种大模型在某一个领域、场景表现得更好。前者可以叫通用模型,后者可以称作是应用模型(垂直模型)。

OpenAI的 GPT-3、GPT-4等是AI基础大模型,基于之上开发了许多行业应用模型。AI基础模型训练需要数月、万卡千卡,而基于基础模型之上的行业模型只需要十卡百卡、数天数周。比较应该在同类型的技术或产品间展开,而不是“关公战秦琼”。中国所谓的“百模大战”并不代表真的有100家企业都在同一个赛道上竞争,这里面有真正的AI基础大模型,也有在基础模型上进行微调的垂直行业模型,有基于开源模型套壳的,也有套壳微调的行业应用模型,还有传统AI包装出来的伪大模型应用。

安筱鹏坦言:“从AI基础大模型领域来看,能够跟上国际大模型创新步伐的国内选手不超过10个。

AI基础大模型是1,垂直行业大模型是其后的0

AI基础大模型是本轮全球科技竞争的制高点,是大国的游戏、巨人的战场、进化的力量,具有高技术门槛、高资本门槛、高人才门槛、高生态门槛的特征。

安筱鹏表示,AI基础大模型的能力是决定性的,是所有数字前面的“1”,而行业垂直应用的AI大模型是后面的“0”。垂直行业模型的能力取决于AI基础大模型的能力。没有AI基础(通用)大模型支撑的行业垂直应用AI模型,要么浑水摸鱼,要么混淆视听。

AI基础大模型决定了产业智能天花板、AI产业化步伐(算法、数据、业务、编程复合型人才)、商业价值与闭环、应用生态的繁荣与AI产业的竞争格局,并将最终决定新一轮数字科技领域的国家、企业的核心竞争力。

安筱鹏指出,只有AI大模型的训练和开发,才需要具备1万卡乃至10万卡高质量算力调度优化能力,需要百亿美元投入,需要TOP100科学家,也需要商业化的闭环。AI产业化的根本出路在于技术与商业的闭环,能否形成繁荣的AI产业生态是胜负手。

未来一切智能硬件被AI大模型驱动,一切软件系统被AI大模型重构

无论哪一种大模型,最终都要落地到行业应用中。安筱鹏指出,在工业领域,大模型带来的颠覆式变革首先便是产品功能的智能化升级。

“未来,一切智能硬件都会被AI大模型驱动。”安筱鹏说道。以AI手机为例,首先手机里的芯片会发生变化,随着图像大模型、小模型进入手机,传统的CPU芯片无法满足庞大的计算需求,必然会需要更多的AI芯片;其次,手机与用户之间的交互方式也会发生变化,以前订机票需要打开系统、点开APP,再根据需求选票、订票,新一代的AI手机已经化身AI助理,只需要对手机说出订票需求,它就可以自行完成后面的一系列操作。

阿里云通义千问已经基于联发科处理器,把大模型“装进”并运行在手机芯片中,打造端侧AI的Model-on-Chip部署新模式。

“这无论对手机厂商、操作系统提供商,还是对软件公司而言,都是一场颠覆式的变革。”安筱鹏坦言,“这也是苹果放弃造车,押注AI的一个重要原因。”

与此同时,大模型会催生AI原生的智能终端,比如人形机器人。人形机器人作为通用机器人的代表和具身智能的载体,将成为AI与物理世界的接口。进入AI大模型时代,多模态大模型赋能人形机器人,将带来全新的变革。

扫地机器人亦是如此。在今年1月美国消费电子展上(CES)上,已经出现了不少以大模型为核心驱动力的扫地机器人。这些机器人在功能、服务以及形态上的进化备受期待。安筱鹏强调:“未来无论是何种形态的机器人,核心竞争力在于是被什么样智力水平的大模型所驱动。”

此外,汽车也会被大模型重塑。“汽车卖不卖得出去,自动驾驶能力很重要,而如今,自动驾驶技术又在被大模型重塑。”安筱鹏表示。在他看来,大模型改变了自动驾驶的训练方式,为产业发展找到了一条新的路径。过去的自动驾驶训练需要把各种场景拍成照片,由专人进行大量的图片标注,标注完成后再让模型去识别。现在有了AI大模型,只需要把视频、图片“喂”给它,它就能自主学习、自主训练了。

特斯拉的自动驾驶FSD V11版本有30万行代码,是基于海量标注+规则代码;而FSD V12版本只有2000+行代码,其技术路线是海量数据+BEV+Transformer。2023年9月2日,1200万人围观马斯克特斯拉自动驾驶,他试驾后讲的最重要的一句话是,“没有一行代码让特斯拉在停车标志处停车”。大模型带来了自动驾驶研发模式的跃升:从规则代码输出的驾驶决策,到基于AI大模型生成的驾驶决策。

 “很多人对于大模型的认知就是写写小作文,生成个图片、视频,感觉和工业制造业的关系不大。其实并非如此,AI大模型给工业制造业带来的影响是非常深远的。”安筱鹏说道,“AI将重构软件开发范式、交互方式、使用流程和商业模式,无论是研发类、管理类、生产类还是后服务类工业软件,都将用大模型重新升级一遍。”

中国大模型市场存在“加拉帕戈斯隐忧”,要警惕统一大市场的“碎片化”

要在工业制造业领域把大模型用好,首先要做好模型训练资源的匹配。安筱鹏表示,制造业的大模型训练,有的需要行业知识、行业数据,有的只用通用的算法、数据就行。

其次要搭建完整的产业生态。今天市面上的大模型从“能用”到“好用”还有很长的路要走,而真正懂大模型,并且会操作、会训练的AI专业人才又很少,可以说大模型的生态尚未形成。

“大模型的产业化路径和以前完全不同,过去是卖产品,卖完就完了,现在是搭建一个生态。如果把大模型产业链比喻成足球赛,产业链上中下游可以对应后卫、中卫、前卫,我们要做的事就是让球踢起来更加丝滑,更加精准地传到对方的球门前。”安筱鹏解释道。

据他介绍,阿里魔搭社区已经服务了工业、医疗、金融等众多行业企业,包括做机器人的,做软件开发的,做AI应用的,自发形成了一个产业生态,包含多元利益主体。不过,这个生态还需要时间来持续成长繁荣。

“中国大模型市场存在‘加拉帕戈斯隐忧’。”安筱鹏感慨道。加拉帕戈斯是太平洋上的一个群岛。达尔文在一百多年前写的《物种起源》中提到,这个岛上有很多物种,每个物种都在自我进化、自我净化、自我迭代、自我演进。但它一旦离开了这座岛,就会因为无法适应环境而死掉。

安筱鹏认为,在数字化的企业市场领域,在AI大模型的2B市场侧,建立一个全国统一的大市场非常重要。中国SaaS产业过去十多年一直未能发展起来,与市场碎片化有很大关系。在2B数字化市场,没有形成全国统一的大市场,一方面,会导致市场丧失孵化培育大企业的能力;另一方面,也会让这个市场丧失优胜劣汰的能力,同时也不利于产业生态的建设。“加拉帕戈斯现象”提醒我们:要警惕在特殊背景和条件下形成的独特能力,并保持开放性,不断审视以往的成功,同时不断拓展边界。

定制化、私有化部署的大模型无法大规模商业化,成本很高、效率很低,会导致很多企业锁死在一个狭窄的赛道上,这是落后的产业模式,会导致大模型统一大市场的“碎片化”。安筱鹏认为,应该用公共云的方式来做大模型,发挥公共云集约化、规模化优势,提供平台化的服务,从而大大降低模型训练推理成本和创新门槛。只有公共云才是新质生产力的代表,私有云不是。

延伸阅读:

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部