救急AI训练内存荒!Rambus发布DDR5服务器PMIC,用智能DIMM架构解锁高性能内存

救急AI训练内存荒!Rambus发布DDR5服务器PMIC,用智能DIMM架构解锁高性能内存
2024年06月28日 12:06 芯东西
芯东西(公众号:aichip001)

作者 |  ZeR0

编辑 |  漠影

芯东西6月28日报道,随着AI模型日趋复杂强大,它将需要更高带宽的内存和性能需求。近日,美国芯片和半导体IP供应商Rambus发布全新DDR5服务器电源管理IC(PMIC)系列,包含适用于高性能应用的业界领先超高电流电源器件,可满足AI及其他高级工作负载对最高性能与容量内存模块的需求。

作为DDR5内存架构中的关键组件,PMIC可实现更多的内存通道、更大容量的模组和更高的带宽。Rambus DDR5服务器PMIC系列包含符合JEDEC超高电流(PMIC5020)、高电流(PMIC5000)和低电流(PMIC5010)规范的产品,现已上市。

其中,业界领先的Rambus PMIC5020将使未来几代DDR5 RDIMM的性能和容量达到新的基准。这一全新的Rambus服务器PMIC芯片产品系列与Rambus DDR5 RCD、SPD Hub和温度传感器IC一起组成一个完整的内存接口芯片组,适用于各种DDR5 RDIMM配置和用例。

▲DDR5 RDIMM上的Rambus服务器PMIC

目前Rambus在全球有600多名员工,其中70%为工程技术人员;拥有约2700项专利积累,大部分为基础专利。其2023年产品收入达2.25亿美元,经营现金流为1.96亿美元,75%以上的芯片和半导体IP收入都来自数据中心。

经过三十多年的发展和创新,Rambus的主要业务包括内存接口芯片、半导体IP(接口IP和安全IP)授权和基础专利授权,后续还会推出CXL各产品组合芯片。其服务市场主要有数据中心和边缘设备,面向5G、汽车自动驾驶、IoT(物联网)等应用。

凭借在高性能内存领域积累30多年的经验,Rambus已成为RDIMM制造商的“一站式” DDR5内存接口芯片供应商,能够为制造商提供最高级别的验证保证并加快其产品上市时间。

一、AI训练需要更大内存容量

AI需要更大的内存带宽和容量,基于DDR5的服务器对于AI训练管道至关重要。Rambus内存互连芯片业务部门产品营销副总裁 John Eble分享说,AI大模型能在短时间内取得惊人的增长,有赖于用于处理这些海量数据的服务器内存技术的不断发展。

他展示了一段简化的AI训练管道。左边是数据存储,比如OpenAI的SDXL应用会把文字转换为图像,有超过1亿张图片用作训练的数据集,存储左边管道中。这种存储服务器的主内存容量相对比较适中,因为在这个阶段,GPU还不需要参与到训练管道的实际运行中。

数据准备阶段要对数据进行整理、正常化及验证,主内存的需求量上升到1TB左右。比如SDXL训练网络架构,在数据准备阶段,所有图像都要被规整成统一的规格、大小、像素、尺寸,从而更加高效地利用网络中的这些资源,去降低延迟并在空间展示过程中节省资源。

训练阶段需要强大的GPU,同时附着在GPU上的内存需求也是最大的,主内存的容量需求通常被认为是GPU内存的两倍,还有需要主内存有非常高的带宽。这样才能让GPU本地内存满足这个数据的吞吐速度。

这个简化的AI训练管道完整描绘了数据从采集到存储、准备和训练,再到最终形成推理模型的过程。在现实中,一个集群或一个实例的内存容量会是简化模型所需内存容量的好几倍。

二、详解DDR5 PMIC工作原理,用更智能的DIMM架构实现更高内存性能

实现更高内存性能,需要更智能的DIMM架构。

首先,DDR5内存已经开始转移到双通道架构,DDR5 RDIMM架构在DDR5中数据流的通道比特率是32,还加上8位的ECC,以此来保证它们能在连接器上有着各自所需的存储、吞吐量和内存性能。

其次,上图中的双通道RCD在主机端以DDR5速度运行,因此它的运行速度与DRAM相同。图中每个引脚的开关频率将比DDR4高出一倍多。

DDR5的每通道最高频率速度达到8400MT/s。但根据JEDEC今年4月发布的数据,在DRAM的规格中可以达到8800MT/s的速度。数据传输速率变得更高、所有这些数据信号所需的连接器引脚数量的增加以及主电源电压从1~1.2V降至1.1V,这些因素共同促使Rambus决定采用专用的电源管理IC,帮助控制更加精细的电压。

如图中蓝色部分所示,DDR5模块增加了PMIC和相关的无源组件,这是从DDR4到DDR5最显著的变化之一。

前几代DDR将内存电源电压调节放在主板上,通过连接器将多个电源传输到模块上。而通过将电源管理集成到内存模块(DIMM)上,主板能为内存模块提供单一的高电压电源。

为了实现更高的数据传输速率,DDR5需要更严格且精准的电压范围,在电源配置变化的情况下需要非常低的噪音,以及在这些较低电压下保持可靠性。

John Eble谈道,内存模块的设计现在遵循通用工程实践,即提供单路高压、低电流电源轨,并尽可能靠近使用点。DDR5内存模块是第一个在内存模块上集成PMIC的主要内存类型。这样的设计能对DDR5采用的较低电压进行更加精细、可靠的控制,可以在增加容量的同时增加电源管理资源,还能真正减少系统中的过度设计。

这种架构变化解决了电阻下降(IR Drop)的问题,与其他创新技术一起将功率保持在目标范围内,并实现了更大的内存带宽和容量。

将PMIC放置在内存模块上存在一些设计挑战:1)需进行热模拟并确保热量以一种不会影响模块的方式消散;2)为PMIC腾出空间、确保在其功率完整性达到最佳状态的同时不会造成干扰或散热问题;3)确保PMIC上的开关稳压器不会将不需要的噪声引入DIMM其他部分;4)确保PMIC可靠且强大,能应对可能的压力条件。

DDR5模块上的PMIC接收12V输入电压。PMIC有4个开关降压调节器,其中两个采用双相配置,还有两个低压差调节器,为模块上的各种组件产生总共5种不同电压。系统内电源管理芯片的所需数量,将在系统配置所需的内存模块数量基础上进行扩展。

这节省了主板空间,而且不再需要设计来自主板的电压调节器对内存模块的工作支持,还能避免通过模块连接器从主板向内存模组组件输出如1V的电压,大大降低了输电网络上的IR下降问题。整体来看,模块的功率和电源供电的完整性、稳定性得到了显著提升。

服务器PMIC的一大技术挑战是设计空间受限,Rambus已经解决了这类难题。PMIC是一个高度集成的单芯片解决方案,因此它的所有输出轨都在单芯片解决方案上而且轨数精确,它们是可编程的,没有额外开销。稳压器的开关频率经过优化,以适应特定区域内的电感器尺寸。因此,John Eble认为这是芯片设计本身与微调解决方案之间的协同优化。

这种应用产生的低电压需要精确无噪声,以确保在非常高速的单端总线上的裕度。DIMM的工作量也会发生很大变化,PMIC和稳压器的设计必须能够以最小的噪声处理这些变化。因此电感器、电容器和稳压器带宽的共同设计是Rambus应对这一挑战的方法。

Rambus大中华区总经理苏雷说,所有电源芯片都要求高效转换与安全稳定的工作,但不同应用的具体要求有所差别,汽车和工业级的应用对芯片的稳定性和质量要求较高,消费电子对电源管理芯片的要求低一点,但对价格相对敏感。

三、全新DDR5服务器PMIC系列发布,包含3种规格

Rambus在2016年就已经开始开发DDR5组件,2017年提供首批样品。其解决方案能覆盖绝大多数RDIMM内存接口组件,并积极参与JEDEC的工作来帮助完善相应的技术规范。

针对不同电流输出水平,Rambus DDR5 PMIC系列包括符合以下JEDEC规格的产品:极值电流(PMIC5020)、高电流(PMIC5000)、低电流(PMIC5010)。

它们共享相同的封装尺寸、引脚布局,大多数寄存器集相同。每种设计的电源效率都针对其目标应用的预期电流水平进行了优化。

Rambus已开始提供样品并与客户合作,推出第一代面向所有模块类型和所有服务器类别的 DDR5服务器PMIC芯片系列,以满足之前讨论的AI管道需求。这些PMIC以及多代寄存时钟驱动器(RCD),再加上SPD集线器和温度传感器,使Rambus能提供完整的芯片组解决方案。

其首要重点是PMIC 5020的设计,旨在为下一代AI训练服务器和其他高级工作负载提供最高容量和最高性能的模块类型。

极高电流的PMIC 5020目标是约30安培的最大持续直流电流,是这3种服务器PMIC中最新定义的。Rambus是首家提供样品的公司。该PMIC针对的是最高带宽和最高容量的模块。

高电流PMIC 5000一直是主要的PMIC,支持的最大持续直流电流约为20安培。这款特定的PMIC针对标准到四阶模块,容量为64GB、96GB和128GB。低电流PMIC 5010面向容量较低的市场,支持的最大持续电流约为12安培。

多数速率高达60400MT/s的DDR5 RDIMM都使用PMIC 5000高电流版本和PMIC 5010低电流版本PMIC,这两种型号正在大批量生产阶段。PMIC5020主要用于数据速率达到7200MT/s的第四代DDR5,以及第一代的MRDIMM模组,另外还包括有一些6400MT/s数据速率但容量特别高的(如256GB内存模组)。

Rambus现可为RDIMM提供完整的芯片组,凭借30年的经验提供高性能内存技术,进而支持广泛的数据中心用例。该公司提供完整的DDR5 RDIMM芯片组,经过预先验证,能带给客户具有经过验证的互操作性和非常优秀的时序、功率优化,而且也有足够稳健的供应链供给,能为客户提供单一来源的支持,可帮助他们减少需要经过额外验证合格的组件,减少交付和在实际安装、调试等方面所需耗费的时间和精力。

四、中国内存市场蓬勃发展,Rambus积极参与其中

据苏雷分享,中国内存市场蓬勃发展,已经形成了内存颗粒、内存模组、服务器、OEM、ODM、云一套连贯的生态链,在全球内存生态中扮演重要角色。Rambus非常重视中国市场内存生态的建设并积极参与其中,通过提供高效、优质的产品和全面、细致的技术服务与行业经验,来践行“in China for China”的理念,最终实现跟客户的成长与共赢。

Rambus中国的业务理念不仅仅是把自己作为一个产品供应方,更多将自身定位成业务的合作伙伴,通过与内存上下游合作伙伴的紧密协同工作,利用Rambus内存产品方面的经验和积累,以服务中国市场,助力中国内存产业链的生态发展。更具体而言,可以概括为高性价比的产品以及Turn-key保姆式的服务。

在客户产品布局阶段,通过全球业务视野和凭借深耕行业标准组织的经验,Rambus和客户一起来分享新产品定义的业界状态、演进的方向和发展的建议,供客户进行参考。

在产品设计阶段,Rambus提供DDR5内存接口芯片系列产品,具备高性能,能够确保信号完整性、电源完整性的设计裕度,可帮助解决模组制造商在设计DDR5时面对的一些技术挑战。

在产品研发问题定位阶段,因为所有Rambus的内存接口系列产品,比如RCD、SPD、TS均来自于自研,所以更懂得产品本身。在发生任何问题、需要issue定位的时候,Rambus可以迅速帮助客户进行问题定位,解决issue,从而缩短客户产品的上市时间。

在产品的量产阶段,Rambus的产品提供市场上高竞争力的价格,可以帮助模块制造厂商,使其产品在全球市场上具有更好的价格竞争力。

结语:未来可能会定义新型内存模块

生成式AI等高级数据中心工作负载需要具有最高带宽和容量的服务器RDIMM,以满足不断增长的数据管道日益增加的内存需求。作为一家成熟的模组内存接口芯片量产供应商,随着新服务器PMIC系列的推出,Rambus扩展了现有的基础技术,并为客户带来了支持多代DDR5服务器平台的全套内存接口芯片组。

John Eble谈道,DDR5在服务器和个人电脑领域都得到了相当迅速的采用,在服务器方面已经或即将达到平衡点。PMIC的供应对DDR5服务器模块来说非常重要。整个供应链已经恢复了,目前没有看到PMIC供应短缺的情况。DDR5内存的价格总体上根据DRAM内存行业的供需关系正常运行着,DDR5的需求似乎大于供应,在供应恢复平衡前,可能会造成价格上涨。

谈及未来趋势,他认为随着对更高性能和电源效率的需求不断增长,未来可能会定义新型内存模块,而且很有可能会继续在模块上集成PMIC,以进一步优化电源管理并提高整体系统性能。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部