AI推理时代:算力能耗瓶颈下的“密钥”何在?

AI推理时代:算力能耗瓶颈下的“密钥”何在?
2024年11月15日 11:20 智东西

智东西

作者 |  程茜

编辑 |  漠影

2024年,千行百业对AI推理的需求将呈现出爆发式增长,行业对算力的需求远远超越以往。在这样的形势下,如何突破能耗瓶颈,进而获取更充足的算力,已经成为每个企业迫在眉睫且亟待解决的关键问题。

然而,当前的现实情况是有效算力供给已无法满足算力需求:一方面,从储备到应用的算力需求都愈发旺盛,OpenAI CEO召集全球投资者组建联盟为大模型构建基础设施,马斯克的无人驾驶出租车Cybercab为科技行业描绘了未来感十足的面面,还有性能愈发强大的GPT-o1等模型层出不穷。

另一方面,数据中心的算力潜能尚未被完全挖掘出来。数据中心常被认为是“耗电怪兽”,因为服务器运行伴随着热量释放,温度一旦超过极限值,服务器性能就会显著降低,限制数据中心算力发挥。于是各类创新技术涌现,试图让数据中心再次突破能效瓶颈,释放出被束缚的算力潜能。

这背后的关键变量就是冷却技术,液冷技术作为推手帮助数据中心一次次突破制约。就在联想集团Tech World上,联想集团董事长兼CEO杨元庆与NVIDIA创始人兼CEO黄仁勋,这两大全球科技行业顶尖企业的领军者同台,联合发布全新液冷AI服务器,勇闯“最大工业革命”。

今天,伴随2024/2025财年Q2财报,联想集团发布《Game of AI》系列知识科普视频的第二集《数据中心如何与世界交换算力》

视频延续桌面电影形式,通过《权力的游戏》风格的开场片头,复刻北境冰雪气候变化,打造亦真亦幻的三维沙盘动画,以此紧扣液冷主线。

同时,视频还以两条科技树线索,介绍了数据中心和能效的角逐演进历程,采用冰雪白为主的配色方案与模拟芯片的三维结构,融入液冷主题。

视频中以第一人称桌面电影的创新手法,让观众跟随存在于2100年未来时空,以科技历史学家李约瑟为原型的智能体,并通过它的主观视角展开了一场算力史与能源技术史的探究,如何通过计算重构世界,以及其中的可持续发展路径,发现液冷技术在释放数据中心算力中的关键作用。

一、提升能效、维持功耗,数据中心效率革命正当时

联想集团最新发布的第六代Neptune海神液冷解决方案,可以为生成式AI高效计算提供动力。这在当下对于数据中心算力效率提升的重要性不言而喻。

通过视频中联想集团梳理的数据中心百年发展历史,我们发现,数据中心的算力与能效密切相关,二者共同掌握着能量密码。

人类对算力的利用由来已久,但随着信息技术革命到来,算力的性能和规模迎来爆发,算力需求逐渐多元化,深入汽车、大模型等各种应用场景。

2024年,算力提升的关键已经从狂堆硬件转向提升效率,如今数据中心需要的革命是基建效率的角力。目标是在充分利用数据中心已有硬件设备的基础上,使其发挥出更高能耗并提供更强大的算力。视频以桌面电影第一视角,通过网页、文件等多样化载体提取信息,给观众带来更多操控互动感受。

在明确数据中心效率这一概念的同时,需要先搞清楚一个指标——TDP热设计功耗。这指的就是当芯片达到最大负荷时热量释放的指标,也是冷却系统要面对的重大挑战。

一旦超过这一极限值,处理器的温度继续升高,就会导致数据中心的性能降低,让芯片发挥计算能力的前提就是,处理器运行过程中产生的热量和冷却技术的散热能力达到平衡。

因此提升基建能效,将其从能耗制约下拯救出来的关键就是冷却技术。二者相互制约又相互关联,共同决定了数据中心的稳定运行和能源利用效率。

数据中心和能效两条技术路线交织前进的同时,一步步助推AI产业的技术创新与应用落地加速实现,加速智能时代到来。

二、冷却技术:算力历史长河中的关键脉络

算力工具从仅凭大脑运算到机械计算机、电子计算机,形态几经变迁,已经从数据中心的无限扩张转移到基建效率的角力上。

联想集团以桌面电影的形式,让我们亲身体验了计算的百年历史。视频中通过更契合冷却与算力主题模拟芯片三维结构,展现出数据中心变迁的关键环节。最初图灵机理论出现,奠定计算的设计理念,由虚拟机器替代人类进行数学运算。再到1946年运算速度达到了手工计算20万倍的ENIAC出现,1951年第一台商用计算机UNIVAC I首次拥有存储能力,为现代计算机的体系结构奠定了基础。

再到后面,20世纪60年代分时操作系统使得计算开始通用,计算机的处理器占用被切分,可以让多人同时使用计算机。

计算性能的大幅提升,随之而来的就是散热系统的工作负荷急剧增加。视频以水上、水下逐步揭示数据中心明线与能效暗线,通过水中浮起等细节动画,让人沉浸其中。

早期风冷技术是数据中心散热的主要方式之一,20世纪90年代出现的机架式服务器就是数据中心的初始形态,但因为空间紧凑、设备密度较高,风冷无法再满足散热需求。

机械冷却登上历史舞台,空调通过压缩机、冷凝器、蒸发器等核心部件的协同工作,产生低温冷风带走热量。从而使冷却技术在互联网首次蔓延,第一次拯救了算力。

冷却技术拯救算力的第二大节点,就是高性能计算集群的出现。高性能计算集群将单机柜功耗直线拉升百倍,达到50kW,冷却技术再遇瓶颈,空调无法满足如此快速、高效散热的需求。

其中的标志性事件就是联想集团2012年推出的海神Neptune温水水冷技术。其率先提出了适用于高密度计算环境的温水水冷技术,使用45℃~50℃的温水在冷却板和循环水路中循环,达到降温的效果。视频通过对温水水冷服务器进行首次全方位拆解,结合图表、动画,深入浅出展现了温水水冷技术。

该技术通过全水冷无风扇设计,使服务器散热效率达98%,并实现90%的余热回收再利用,降低42%的能耗,数据中心PUE可降至1.1,同时其总体成本低于风冷。

这之后,液冷技术全面爆发,成为高性能计算的主流选择。

液冷技术的发展为数据中心能效提升,开辟了一条行之有效的路线,并为大模型时代的算力注入了新的动力。

三、液冷——AI时代释放澎湃算力的 “动力源泉”

AI时代下半场,百模大战落下帷幕,GPU、CPU、TPU、服务器演化出千百种形态,AI军备竞赛的焦点,正从模型向数据中心转移。

AI训练和推理的算力需求激增,对数据中心的需求水涨船高。一张GPU的功率飙升至1000W,单机柜功率密度增至100kW。

随之而来的就是对冷却系统的又一次严峻考验。这是因为在高功率密度的环境下,设备单位体积内产生的热量会大幅增加,就需要散热系统的工作效率更高,才能快速带走热量保证设备持续运转。

联想集团2024 Tech World大会上发布的全新液冷AI服务器,搭载第六代海神液冷系统,具备突破性的垂直液冷设计方案。视频通过三维动画直接对该系统进行了拆解,更为直接的呈现了其内部构造。

凭借ThinkSystem N1380 Neptune和新的ThinkSystem SC777 V4 Neptune,联想集团率先在不需要专用数据中心空调的情况下就可以运行100kW以上的服务器机架,这一设备就是专为大模型而打造。

在优化部署方面,液冷服务器可竖直放置,能在提升空间利用效率的同时,进一步增强散热效果,这在此前的液冷系统中并不多见。

其还采用精巧封装设计,包含8个托盘槽、4个15kW功率转换站以及Neptune水流分配系统。

基于这样的优化设计,第六代海神技术使得数据中心的PUE趋近于1.0的极限,这也意味着整个数据中心设备对能源的利用率接近100%。

视频画面穿越数据中心的服务器,看到了海神液冷系统为解决数据中心能耗问题带来的希望。

但这并不是液冷技术的终场战局。如今,算力需求汹涌向前,联想集团通过颠覆机柜、机房固有格局,用全面液冷的超大型AI集群解决方案——液冷集群微模块,为AI产业的突破装载了推进器。

视频中通过逼真写实风格的服务器形态切换三维动画,再辅以鼠标手动操作方式,让观众直观感受了从服务器模块到机柜再到液冷微模块的重构过程。

液冷集群微模块的出现,成为数据中心的最优解之一,液冷技术第三次释放了数据中心的算力能耗限制。

从高性能计算时代,到AI时代的下半场,联想集团持续引领液冷解决方案设计,加速算力的释放。液冷技术的革命日益受到广泛而密切的关注,并对数据中心产业链、供应链产生革命性影响。

结语:液冷成可持续算力保障,AI加速向实

算力已经成为人工智能进入真实的产业环境中不可或缺的核心要素,液冷技术更高效地带走高温,使算力可持续,让数据中心源源不断与世界交换算力。

黄仁勋在与杨元庆对话时提到:“现在,我们正在以前所未有的规模重塑计算领域的整个架构。现在,速度就是可持续性,速度就是表现力,速度就是能源利用率。”

如今,AI重塑整个世界运行逻辑,算力正是其坚实的底座。正如联想集团打造的视频结尾所说,“服务器与数据中心作为千行百业的基础设施建设,将重新定义AI作为生产力的能量源泉,并以世界之力再造世界”。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部