MRDIMM:为英特尔至强6性能核处理器加速的“秘密武器”

MRDIMM:为英特尔至强6性能核处理器加速的“秘密武器”
2024年11月28日 17:33 ZOL中关村在线

在数据中心领域,历来都有“力大砖飞”的传统,因此在前几年算力相对匮乏的时候,在CPU上增加核心数量几乎成为了芯片厂商的共识,但随着处理器核心数的不断增加,并一举破百之后,如何为处理器提供足够的内存带宽成为了新的挑战,毕竟处理器核心数量的增长速度要明显高于内存带宽的提升,一旦核心数过多,每个核心能够分配到的内存带宽就会变少。

特别是在天气建模、计算流体动力学这些特定的AI场景中,往往需要运行大量的工作负载,而处理器核心与内存带宽之间的失衡则会导致计算瓶颈,而MRDIMM的出现,则为解决这一问题提供了新的思路。

MRDIMM由英特尔DCAI内存开发资深首席工程师George Vergis于2018年开始研发,其设计初衷是通过现有的DDR5DIMM技术实现带宽翻倍,与标准的DDR5 DIMM相比,MRDIMM采用创新的方法,通过在DRAM模块上放置一个小型接口芯片,也就是多路复用器(Mux),让数据可以在同一个时刻跨两个内存阵列进行传输,由于多路复用缓冲器整合了每个MRDIMM的电力负载,使得接口能够运行得比RDIMM更快,并且由于能够同时并行访问两个内存阵列,带宽也实现了翻倍。

经过三年的努力,MRDIMM技术于2021年完成原型概念验证,并在2022年底被正式提交给JEDEC作为新的开放标准。而在今年,英特尔首次将这项技术应用到了英特尔至强6性能核处理器上。

作为一款面向AI、数据分析、科学计算等计算密集型业务推出的数据中心CPU产品,至强6性能核处理器最高可配备128个核心,并从PCIe通道、L3缓存等一系列专门针对高性能的场景做了很多扩展,同时在英特尔高级矩阵扩展AMX加速器的赋能下,至强6性能核处理器可以更好地支持大语言模型、深度学习和机器学习的相关模型推理,这使得其成为了当下最佳的AI头节点处理器。

在内存带宽方面,已上市的至强6900P系列处理器拥有12通道的内存,内存规格支持DDR5 6400或者MRDIMM 8800,相比上一代实现了大幅提升,这使得至强6900P系列处理器的每个核心拥有了更加充裕的内存带宽,更加有利于核心性能的释放,从而在生成式AI、深度学习、机器学习、推理训练等场景中获得更好的表现。

英特尔技术专家表示,虽然MRDIMM从原型设计到正式发布已经很多年了,但之所以在至强6这一代才开始支持MRDIMM技术,主要原因是基于性能和收益的平衡,并且还能和现有的DDR5实现兼容。

事实上,MRDIMM的突出优势之一正是其兼容性,通过采用与常规RDIMM相同的连接器和外形规格,使小型多路复用芯片也可适配之前模块上的空余位,因此无需对主板做任何更改,这意味着服务器制造商可以轻松集成MRDIMM,而无需对其设计进行任何调整,此外,由于MRDIMM具备与RDIMM相同的纠错及可靠性、可用性和可维护性(RAS)功能,无论数据缓冲区中产生怎样的独立多路复用请求,都可以保持数据的完整性,因此数据中心客户可以在不对其基础设施或软件进行任何调整的情况下体验MRDIMM带来的全新性能。

在当下的服务器领域,功耗一直是个不可小觑的问题,和普通的RDIMM相比,MRDIMM也会带来一定的功耗提升,且这种提升与带宽和容量基本成正比,随着CPU、GPU等核心部件的功耗提升越来越明显,包括浪潮信息、新华三、超聚变、联想等公司在内的主流液冷服务器已经开始考虑内存部分的散热需求,会针对所有关键散热部件进行统一设计,从而为服务器整机带来更低的PUE。

根据JEDEC的路线图,预计在未来,MRDIMM将在8800MT/s的基础上实现翻倍,从而更好地满足下一代处理器的卓越性能,随着核数的增多、处理能力和主频的提升,数据中心也会对打破“内存墙”、突破内存的容量和性能问题提出更高的要求,而MRDIMM则为数据中心的算力提升提供了新的可能性,有望成为推动科学计算和AI等领域发展的关键技术之一,为数字化转型注入强大动力。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部