AI推理时代：算力能耗瓶颈下的“密钥”何在？_

智东西

作者 | 程茜

编辑 | 漠影

2024年，千行百业对AI推理的需求将呈现出爆发式增长，行业对算力的需求远远超越以往。在这样的形势下，如何突破能耗瓶颈，进而获取更充足的算力，已经成为每个企业迫在眉睫且亟待解决的关键问题。

然而，当前的现实情况是有效算力供给已无法满足算力需求：一方面，从储备到应用的算力需求都愈发旺盛，OpenAI CEO召集全球投资者组建联盟为大模型构建基础设施，马斯克的无人驾驶出租车Cybercab为科技行业描绘了未来感十足的面面，还有性能愈发强大的GPT-o1等模型层出不穷。

另一方面，数据中心的算力潜能尚未被完全挖掘出来。数据中心常被认为是“耗电怪兽”，因为服务器运行伴随着热量释放，温度一旦超过极限值，服务器性能就会显著降低，限制数据中心算力发挥。于是各类创新技术涌现，试图让数据中心再次突破能效瓶颈，释放出被束缚的算力潜能。

这背后的关键变量就是冷却技术，液冷技术作为推手帮助数据中心一次次突破制约。就在联想集团Tech World上，联想集团董事长兼CEO杨元庆与NVIDIA创始人兼CEO黄仁勋，这两大全球科技行业顶尖企业的领军者同台，联合发布全新液冷AI服务器，勇闯“最大工业革命”。

今天，伴随2024/2025财年Q2财报，联想集团发布《Game of AI》系列知识科普视频的第二集《数据中心：如何与世界交换算力》。

视频延续桌面电影形式，通过《权力的游戏》风格的开场片头，复刻北境冰雪气候变化，打造亦真亦幻的三维沙盘动画，以此紧扣液冷主线。

同时，视频还以两条科技树线索，介绍了数据中心和能效的角逐演进历程，采用冰雪白为主的配色方案与模拟芯片的三维结构，融入液冷主题。

视频中以第一人称桌面电影的创新手法，让观众跟随存在于2100年未来时空，以科技历史学家李约瑟为原型的智能体，并通过它的主观视角展开了一场算力史与能源技术史的探究，如何通过计算重构世界，以及其中的可持续发展路径，发现液冷技术在释放数据中心算力中的关键作用。

一、提升能效、维持功耗，数据中心效率革命正当时

联想集团最新发布的第六代Neptune海神液冷解决方案，可以为生成式AI高效计算提供动力。这在当下对于数据中心算力效率提升的重要性不言而喻。

通过视频中联想集团梳理的数据中心百年发展历史，我们发现，数据中心的算力与能效密切相关，二者共同掌握着能量密码。

人类对算力的利用由来已久，但随着信息技术革命到来，算力的性能和规模迎来爆发，算力需求逐渐多元化，深入汽车、大模型等各种应用场景。

2024年，算力提升的关键已经从狂堆硬件转向提升效率，如今数据中心需要的革命是基建效率的角力。目标是在充分利用数据中心已有硬件设备的基础上，使其发挥出更高能耗并提供更强大的算力。视频以桌面电影第一视角，通过网页、文件等多样化载体提取信息，给观众带来更多操控互动感受。

在明确数据中心效率这一概念的同时，需要先搞清楚一个指标——TDP热设计功耗。这指的就是当芯片达到最大负荷时热量释放的指标，也是冷却系统要面对的重大挑战。

一旦超过这一极限值，处理器的温度继续升高，就会导致数据中心的性能降低，让芯片发挥计算能力的前提就是，处理器运行过程中产生的热量和冷却技术的散热能力达到平衡。

因此提升基建能效，将其从能耗制约下拯救出来的关键就是冷却技术。二者相互制约又相互关联，共同决定了数据中心的稳定运行和能源利用效率。

数据中心和能效两条技术路线交织前进的同时，一步步助推AI产业的技术创新与应用落地加速实现，加速智能时代到来。

二、冷却技术：算力历史长河中的关键脉络

算力工具从仅凭大脑运算到机械计算机、电子计算机，形态几经变迁，已经从数据中心的无限扩张转移到基建效率的角力上。

联想集团以桌面电影的形式，让我们亲身体验了计算的百年历史。视频中通过更契合冷却与算力主题模拟芯片三维结构，展现出数据中心变迁的关键环节。最初图灵机理论出现，奠定计算的设计理念，由虚拟机器替代人类进行数学运算。再到1946年运算速度达到了手工计算20万倍的ENIAC出现，1951年第一台商用计算机UNIVAC I首次拥有存储能力，为现代计算机的体系结构奠定了基础。