今年初,DeepSeek横空出世,“一石激起千层浪”,并将智算产业推到了前所未有的新高度。
按照“杰文斯悖论”:技术进步本应降低资源消耗,却因效率提升催生了更强烈的需求。以DeepSeek为例,其模型训练成本较三年前下降85%,算力需求弹性扩大6倍。算力成本结构的剧变,使得AI技术逐步转变为所有企业均可负担的基础设施。
当智能算力“流”入千行万业,越来越多的行业场景与人工智能相结合,从智慧医疗,智慧金融,智慧城市再到无人驾驶,当AI技术加快向各行各业渗透,势必会刺激智算需求呈现几何级数的增长,供需力量的“碰撞”将会共同推动算力需求规模的持续增长。
权威数据显示:截至2024年底,中国智算人工智能算力供给规模达到1450EFlops,预计未来三年中国智算算力将保持40%以上的增长。2027年,中国算力供给规模将达到4080亿Flops。
我们知道,规模的扩张会放大“短板效应”,当需求量呈指数级增长时,整个系统的容错空间会被急剧压缩,原本微不足道的小问题,都可能成为阻碍整个行业发展的大难题。
华为中国政企大企业系统部总经理刘涛
如华为中国政企大企业系统部总经理刘涛所说,“传统数据中心架构的刚性供给与智算的高密度、高弹性需求之间形成了巨大的供需矛盾,传统的通算体系向智算体系演变成为必然,这将是一场涉及到计算架构创新、资源调度创新、商业模式创新以及算力基础设施建设创新的全方位变革。”
智算产业供需矛盾下的系统化挑战
越是巨大的市场机遇,越需要稳固的“底座”,否则就会成为“空中楼阁”。无疑,智能算力就作为行业智能化转型的“算力底座”,必须要在稳中求突破。
但智算需求的规模化增长,带来了一种复杂性,这使得我们面临的困难,也处于一种“系统化”的难题。
第一大难题,源自于大模型对于算力需求的数级增长,刘涛说,“这对于算力的需求量要比硬件算力供给量高出200倍以上。同时伴随着模型参数的不断增长,不仅需要大算力,同时对于网络、存储的协同诉求也与日剧增。”
这个变化让过去广义上的“算力”,走向计算-网络-存储的系统化能力,决定算力水平的除了AI芯片之之外,算力与网络技术、存储技术的融合成为大势所趋。这意味着智算提供商的考量因素,从过去单纯的计算能力,逐步走向智算解决方案的系统化整合能力。
第二大难题,源自AI对各行各业渗透速度的加快,带来了AI技术与场景融合的难题。
刘涛在采访中说,“智算已广泛部署于自动驾驶、智慧城市、医疗影像和工业制造等成熟行业。与此同时,一批新兴场景正在加速崛起。元宇宙与数字孪生技术被应用于城市规划、交通管理与应急演练;‘AI for Science’推动气候模拟、生命科学与材料研发等复杂科学计算进入智能化时代;金融量化交易依赖智算实现海量数据处理与实时决策;影视制作也开始借助智算加速数字创意的生成与渲染……”
如此丰富的创新场景,为AI技术提供更多的施展舞台,但也为AI技术融入场景带来了更多难题。特别是这些创新场景,没有可参考的最佳实践,对智算服务商的场景化解读能力提出了更高要求,如何为场景找技术,为技术匹配合适的场景,也成为一个长期课题。
第三大难题,指向了生态的挑战。比如AI技术生态当中,开发者生态面临工具链碎片化、学习成本高和资源获取不均的挑战,云计算厂商和芯片厂商的软硬件优化策略差异,导致开发者需针对不同平台重复适配,效率低下。从产业协同的角度,受限于供需错配和信任壁垒,传统企业缺乏技术理解力,难以明确AI需求,而多数AI技术供应商往往无法深度匹配行业场景,双方合作易陷入“试点陷阱”。
解决问题的关键在于生态中的“轴心”企业,能够通过根技术创新,拉通产技术标准,并投入开发者及伙伴生态建设,坚决技术生态的演进迭代和产业生态的供需错配。
华为实践:技术、场景、生态的三维破局
《未来呼啸而来》中提出:未来的创新将不是单向式、重度垂直的,若干个重要领域的创新需求之间,会突然产生“叠加效应”。
这个理论也说明,智算要走出产业级的创新,就无法单纯发展某一个单项技术,而是要走向技术、场景加生态的协同发展,才会产生创新的“叠加态”。
首先,在技术创新上。华为一直引领着智算行业的创新风向。比如在硬件方面,向业界提供领先的人工智能大规模AI算力集群,“未来我们将向超节点架构持续演进,提供万卡、10E级规模AI集群,匹配更大的模型训练需求。”刘涛说。
同时,华为通过软硬件原生协同设计,系统级优化AI集群,例如通过对CANN的算子优化升级,充分释放和提升昇腾芯片有效算力使用,来满足大模型日益增高的算力需求;在绿色化探索方面,华为通过基于精准液冷及其数字化联控技术,可以实现最优整体能耗,全栈联动节能减少数据中心的能源消耗,提高能源利用效率。
其次,场景化一直是华为最大的优势。经过30多年的发展,华为早已深入千行万业无数个细分场景,“懂行业”也一直是华为的标签。也正是基于对场景的理解,华为在每一次热门大模型出现后,都能够最快速度做出回应。
华为中国政企大企业MKT与解决方案销售部总经理肖雪岗
比如被DeepSeek带火的MoE架构,华为已经形成了一套完整的解决方案。华为中国政企大企业MKT与解决方案销售部总经理肖雪岗指出,“针对MoE架构,华为国内首创大规模专家并行方案,更多的专家和更大的专家并行域。昇腾支持多专家动态均衡,避免形成单点专家过热,实现专家热点均衡,资源利用率提升20%。”目前,华为面向全行业提供“高性能、高稳定、易开发、易运维”的AI解决方案,使能包含蒸馏、微调及强化学习、推理在内的场景,面向行业通用任务、复杂工作以及专业业务场景提供解决方案。
第三,生态优先是华为在智算产业中始终坚持的重点。
肖雪岗指出,华为一直坚持“硬件开放、软件开源、使能伙伴、发展人才”发展战略,联合技术和商业伙伴,打造“共建、共享、共赢”的人工智能产业。
在硬件开放方面,华为计算产业拥有14家OEM伙伴,自研产品50多款,50家APN伙伴,自研产品100多款;软件开源方面,华为计算开源社区MindSpore企业服务数量5500多个,社区下载量超1100万,社区开源模型超500个,中国AI框架2024年新增市场份额达30%;在使能伙伴伙伴方面,华为计算产业拥有2500多个行业合作伙伴,5800多个解决方案认证,全国26个创新中心,深入IDC、ISP、互联网、运营商、金融等行业核心场景;在发展人才方面,华为计算产业拥有超330万开发者,联合72所高校启动智能基座2.0建设,开设1600多门课程,赋能超6000先锋教师。
华为为智算产业发展带来的启示
达尔文在《进化论》中提到的:“自然选择是进化的动力。”在智算产业的发展中,能够成为用户、伙伴和开发者的首选,华为又给智算产业带来了哪些启示?
第一,战略支撑,坚持长期主义。
在今年初的华为中国合作伙伴大会上,华为提出,为迎接通用人工智能时代的到来,华为推进全面智能化战略,使能百模千态,赋能千行万业。
并显露出以算力基建为基石,以昇腾AI生态为纽带,以AI赋能产品为触手,通过基础模型突破与内部实践验证,构建“技术研发-产品落地-生态协同”的开放体系,支撑千行万业智能化转型的决心。
这份AI战略无论从根技术的深度,到面向行业场景的广度都是业界首屈一指的,坚持长期主义,也意味着华为有能力为智算产业发展指引方向。
第二,在算力生态的构建上重点突破。
在大的发展战略下,对于昇腾 AI为核心的生态体系建设,华为则采取了“重兵深入”。
一方面,昇腾AI推出昇腾万里伙伴计划,为伙伴提供开发激励、算力激励及营销激励,助力伙伴及客户实现商业成功。不仅将应用类软件伙伴,分为普通应用软件伙伴和大模型方向软件伙伴。还基于伙伴的资质,市场贡献,产业贡献和能力要求,给予了不同等级。根据等级的不同和权益。
另一方面,昇腾 AI 坚定围绕“原生”,每年投入 10 亿元的专项资金,以“技术+商业”双轮驱动生态繁荣。面向技术生态,通过培养布道师,体系化赋能开发者;面向商业生态,通过发展双模式,协同伙伴拓展行业场景,一方面助力伙伴更深入的理解行业,另一方面赋能伙伴打造更匹配场景需求的产品,真正支撑伙伴商业成功,加速AI规模应用。
第三,发挥算网协同创新的优势。
华为有别于其他智算服务商的一个重要的特征就是华为在计算和网络两条技术线上都是头部“玩家”,这让华为更有资格在算网融合创新上拥有话语权。
肖雪岗表示,“华为依托零丢包无损网络技术、多级可靠性架构及智能算网调度措施,有效化解网络波动对算力效能的制约,实现算力资源利用率最大化,显著提升智算中心的综合性能。”
智算时代的供需鸿沟既是挑战,更是产业跃迁的契机。华为以技术创新为矛,突破算力、网络与存储的协同瓶颈;以场景深耕为盾,将AI能力精准注入千行万业;更以生态为纽带,汇聚开发者、伙伴与行业力量,构建“以客户为中心”的“伙伴+华为”体系,构建开放共赢的智算新生态。坚持长期主义的华为,就是智算时代的新底座。


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有