挑战-40℃-70℃,边缘计算设备再突破极限值

挑战-40℃-70℃,边缘计算设备再突破极限值
2022年10月27日 14:19 袁大善人

计算是智慧时代一个永恒的话题。那边厢云计算已是热火朝天,这边厢边缘计算已呈燎原之势。

有人形容,边缘计算是“人工智能的最后一公里”,“物联网的最后一公里”,“打通用户的最后一公里”……边缘计算看似不起眼,却将承载起边缘侧海量的数据计算处理。但“最后一公里”恰恰是最为艰难的一公里,需求的多样化和差异化,让边缘计算产业化受到一定程度的制约,落地略显尴尬。

如何打破这种局面,让边缘计算不再“边缘”,在更多业务场景中加速走向落地?来自浪潮信息的一群人,他们并没有选择坐而论道和纸上谈兵,而是深入到海南太阳暴晒的路口、东北寒冷偏僻的油井现场、西北大山深处的煤矿等地进行多方位需求调研,坚定地提出边缘服务器-40℃-70℃环境极限值挑战,并且创新性地发明了三明治散热架构,大幅提升边缘计算设备适用性。

这些实践无疑证明当前边缘计算落地关键所在:即边缘计算产品的研发与边缘场景需求必须深入对接,既需要双手沾泥般深入业务场景去了解真实需求,又能在产品研发上打破常规进行大胆创新,只有这样方能真正引领边缘计算走向落地。

上山下海,才敢提挑战-40℃-70℃极限

如今,在5G、大数据、AI、物联网等技术的驱动下,边缘场景在各大行业中迅速兴起。Gartner预测,到2025年将有30%的数据会运行在边缘,边缘场景将会成为数据产生、智能应用的主阵地之一。

与数据中心等相对稳定的环境和专业的运维团队不同,边缘场景的环境可谓是千差万别,更没有专业团队负责日常的运维与管理,这就让边缘设备的研发遇到两大挑战:

其一,温度、湿度、粉尘等环境因行业而异,不同行业的需求复杂多样,对于边缘设备的适应性提出极高挑战;

其二,边缘场景尚未成熟,有着巨大的需求空间尚待探索,用户需求也不明确,厂商没有标准来参考开发边缘设备与方案。

“一切都需要以用户为中心,去真实场景中探索详细需求。例如,在室外一些智慧交通路口、智慧电网智能运维等场景中,用户对于设备的环境适应性、运行稳定性要求很高。”浪潮信息边缘计算产品线高级产品经理刘香男介绍道。

事实上,针对边缘计算设备部署环境这个最大的挑战,浪潮信息的产品团队大胆提出了“-40℃-70℃”的部署环境温度极限值。做出这个决定,产品团队并不是拍脑门和想当然。从2020年浪潮信息成立专门的边缘计算事业部起,产品团队在两年时间里进行了大量的用户走访与需求调研,并总结得出“-40℃-70℃”温度极限值的产品研发需求。

但这却给产品研发团队提出了一个极大挑战。众所周知,由于环境的限制,边缘计算设备通常采用无风扇的设计,对于边缘设备的散热是极大考验,远超市面其他产品的“-40℃-70℃”极限值需求着实让研发团队大吃一惊。

“当时拿到产品团队的需求第一感觉是太难了。”浪潮信息边缘计算产品线高级硬件架构师付长昭如是说,“一开始甚至一些抵触。因为接触过一些包括雾计算、小型通信类设备,也了解这些行业的规范与标准,很少有规范和标准会把无风散热的极限值设定在70℃,觉得产品经理提的需求根本实现不了。”

在产品与研发不断沟通之后,产品团队觉得有必要让研发理解“-40℃~70℃”极限值需求是真实存在且极其有必要。于是,产品团队和研发团队一起亲自体验了真实的边缘场景。

“到了道路口的一个信控箱,打开一看,真是大开眼界,能想到的和想不到的全有,环境之复杂超乎想象。”付长昭回忆道,“此刻,我终于明白产品团队所提需求绝非虚言,边缘计算要想获得有效地应用,必须克服这个难题。”

确认好需求之后,摆在研发团队面前的难题就是:如何实现“-40℃-70℃”的极限值。由于并无先例,研发团队一时并无头绪,正当研发团队陷入苦恼、压力山大时,一块三明治的出现,彻底“拯救”了研发小伙伴们。

一块三明治带来的启发

众所周知,散热是边缘计算设备稳定运行的关键因素和最大难点。

这是因为如今的边缘计算设备早已不是简单的执行控制程序,还需要进行大量的数据流处理、AI模型推理等,对于算力的需求大幅提升,也让CPU的运行往往处于较为饱和的状态,CPU一旦高速运转,温度最高可达90℃,加上像交通信号柜等边缘场景往往是封闭的铁皮箱,环境温度在夏天往往达到60~70℃,让边缘计算设备的散热更加困难。

“前期我们主要是确定研发方向:在散热上盖和热源之间增加高导热系数的导热材料,让热量快速传递出去。”付长昭介绍道,“但尝试了很多次,连60℃的散热极限的都无法满足。”

研发项目进度陷入停滞,研发团队甚至一度动了“适应不了环境,就改变环境”的想法,与产品团队沟通修改需求。对此,刘香男表示:“其实在产品研发过程中修改需求很正常。但70℃散热极值的确是用户的关键需求,为此,产品团队与研发团队也是进行持续沟通,帮助研发团队理解需求和寻找可行方案。有时候再坚持坚持,捅破那层窗户纸,方案就找到啦。”

为此,研发团队再次拆解和梳理需求,把关键点、矛盾点逐一列举出来,利用思维导图将问题点按照大小级别进行分类,以求寻找到关键的突破口。正当研发团队再次陷入僵局,一块加班中用来充饥的三明治引发了研发团队的灵感。

三明治各种食材层层叠加的形状,让研发工程师们意识到可以借鉴到边缘计算设备的散热上,散热上盖底部压铸出导热凸台,通过导热凸台与导热界面材料、热源部件依次贴合的结构,可以排出热源上方的空气,大大消除内部界面热阻。

窗户纸终于捅破了!“三明治”散热架构就此诞生,散热盖、凸台、界面材料、热源从上到下就类似一块三明治。不仅如此,研发团队还针对边缘服务器百变的配置需求,设计了不同形状上盖,让导热凸台、界面材料的位置、大小随着内部器件的变化而变化,实现产品的灵活百变和高效散热。

付长昭介绍:“研发团队前前后后做了七版方案,终于经过不断努力,寻找到最为合理的方案。”

有了整体的方案之后,接下来就是细心打磨、不断优化的阶段。例如,三明治的多层食材中,每一层食材的不同、食材的多少都会决定三明治的口感;同理,在“三明治”散热架构中,每一层材料的区别是否也会带来散热效果的不同?为此,研发人员进行了仔细研究发现,界面材料厚度的微小差异,都会影响散热的效率,材料厚度缩小0.6毫米,CPU的温度就可以降低2.1℃。因此,研发团队需要在CPU、内存等等部件凸台最小结构公差下,设计出最小厚度的界面材料。

经过多次仿真和实测,研发人员最终采用高导热和高压缩性的界面材料和凸台填充在热源与散热外壳之间,导热效率达到10W/m·K,是空气导热效率的435倍,让服务器适应的极限环温从原来的60℃提升到67℃。

67℃已经超越了很多边缘设备的极限值,但这还不够,离最终需求还差3℃。正所谓行百里者半九十,最后这3℃最为接近极限需求,那么,还能有继续优化的空间么?

对此,付长昭介绍:“把CPU散热这个最大难点解决了,等于大幅提升了内部热传导效率,相当于成功了一大半。接下来,可以从边缘计算设备整体散热的角度去优化考虑,从机箱结构、每个部件等方面做到最优。”

随后,研发团队从“设备与环境之间如何进行高效导热”的角度出发,利用热仿真软件对多组参数组合进行对比分析,并绘制响应面优化曲线,最终确定出一组关于鳍片厚度、间隙和高度的最优组合,在有限体积内形成超过3000平方厘米的散热面积,达到了最佳散热能力。同时,为了进一步让上盖均匀的将热量扩散出去,消除局部热点,散热上盖中设计了2D热管网络,热管走向经过反复优化仿真,精准布局,有效规避局部热点的产生,提升整机均温能力。

终于,浪潮边缘微服务器EIS 800这台能够在无风条件下、70℃极限环境也能高效、稳定运行的边缘计算设备横空出世。

“从最开始有一些抵触,到接受挑战,再到陷入煎熬,最后取得豁然开朗般的突破,研发工程师整个心理过程是在微妙变化的。有时候多一份坚持,问题也就迎刃而解,付出也是值得的。”付长昭如是说。

据悉,浪潮边缘微服务器EIS 800已经获得2022年度德国红点设计大奖,并且在制造、交通、能源、水利、零售等多个行业用户的环境中通过了POC验证,未来将在各个边缘场景中发挥重要作用,进一步推动边缘计算产业走向落地。

模块化设计应需而变:一切为了边缘计算

“边缘计算设备的产品设计与规划,并不会围绕某个部件的迭代而展开,而是会从实际需求的角度进行迭代。”这是刘香男两年来最大的感悟。

不过,边缘场景需求的差异化、多样化,的确又是横跨在边缘计算设备走向规模化的一大难题。差异化和多样化意味着大量需求彼此互斥,需要单独设计,产品通用性差,后期的维护、保障也会遇到各种问题。如何改变这种局面,真正让边缘计算走向落地?

在经历了大量调研和反复论证之后,浪潮信息提出了解耦模块化设计的思路。这种思路类似乐高搭积木,形成核心计算模组、AI模组、通信模组、管理模组、散热模块等核心模块,统一不同模块的接口标准,再根据边缘场景的差异化需求进行拆解和组合,实现不同边缘场景的产品需求。

例如,智慧路口场景中,摄像头从几路到十几路,边缘计算设备的算力需要阶梯式布局;又如,在工业场景,需要更加灵活的通信方式,需要兼容有和无线不同网络通信;而针对油井、矿山等环境会出现的边缘设备低温启动难的问题,浪潮信息研发团队还为系统设计了远程运维模块,低温热启动装置,可以在环境温度-40℃的环境下,远程或自动调动系统来加热边缘计算设备,让设备每部每个组件满足温度要求后再启动运行。

从模块组件解耦到根据需求进行灵活组合,既考验边缘设备研发团队的整体设计能力,又对于模块之间组合后的产品效果提出挑战。为此,浪潮信息不断摸索,推出了边缘模块化设计架构ECOM(Edge Computing Optional Module),并且对各个模块之间通信进行优化。

据悉,浪潮信息已经将边缘计算模块化设计标准ECOM贡献给全球开放计算组织ODCC。付长昭坦言:“传统服务器的设计方式、理念、应用和标准比较清晰统一,但边缘计算依然处于探索期,更加需要有意识地去完善标准,从而更好地推动边缘计算技术快速落地。”

星空不问赶路人,岁月不负有心人。如今,浪潮信息蝉联中国边缘服务器市场第一,2022年上半年市场占有率甚至达到53.1%,同比大幅增长133.6%,领涨边缘服务器市场。“浪潮信息会持续以客户为中心,贴近用户场景需求,携手生态伙伴共同推动边缘计算加速落地。”刘香男最后表示道。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部