在争夺数据中心的战役中 DPU将成为NVIDIA新法宝

在争夺数据中心的战役中 DPU将成为NVIDIA新法宝
2021年06月25日 11:15 ChinaByte比特网

目前,在各类工作中,CPU承载了过多的网络与存储工作负载,这不仅会影响效率,而且还会损失掉过多的CPU性能,有什么办法能帮助CPU从繁杂的工作负载中解脱出来呢?

作为芯片领域的巨头,NVIDIA也在试图缓解CPU在工作中的负载,他们推出了可通过硬件加速的DPU,其不仅解决了以往CPU算力严重不足,还加强了NVIDIA在数据中心服务器市场的布局。

从未来的趋势来看,NVIDIA正在构建一个CPU、GPU、DPU,三U一体的架构,通过CPU、GPU、DPU之间的协同计算,可以在数据中心和边缘中都达到性能最大化,从而助力企业提升效率以及业务创新。

这一次,比特网有机会采访到NVIDIA网络事业部亚太区市场开发高级总监宋庆春、UCloud资深技术专家马彦青,与他们聊聊目前全新一代DPU的升级以及DPU到底能解决用户遇到的哪些问题。

DPU是什么?

众所周知,芯片在我们生活中占有重要的地位,它驱动着手机、电脑等科技产品,同时在数据中心、物联网、边缘计算等领域中也起到了最关键的作用,其中,芯片产品又被分为了很多种类,例如CPU、GPU、NPU等等,这些芯片分别赋能计算、图形、AI等,而现在NVIDIA又推出了DPU。它将会负责什么呢?

DPU事实上可以看作是SmartNIC的增强版本,一方面加强SmartNIC对于网络协议和网络安全的处理能力,另一方面加强了分布式存储的处理能力,从而让DPU能在这两个领域更多地替代CPU。

此外,DPU芯片拥有全新的数据处理中心IOC,可以集成GPU、网络、存储和安全等功能,目前,NVIDIA所研发DPU芯片已经被应用至企业级服务器产品上,解决了以往CPU算力严重不足的局面。

宋庆春表示:“随着数据量越来越大,AI技术的发展,数据在网络通信过程也越来越复杂,很多通信模型会制约整个系统性能发展,比如在通信过程中,要出现Allreduce、Barrier这样的多打一的通信情况时,用传统的冯·诺依曼架构的计算模型就会造成严重的网络拥塞。”

NVIDIA网络事业部亚太区市场开发高级总监宋庆春

据了解,全新BlueField-3 DPU所提供的数据中心服务,可相当于多达300个CPU核实现的服务,这就意味着DPU数据处理对CPU资源的释放,使CPU在其他关键业务上进行赋能。

马彦青补充道:“在加解密方面,DPU也可以对SSL、TLS可以进行加解密。IPSec的算法也可以实现硬件卸载,这样ASIC做了几个算法,就可以把CPU的算力释放出来,这也就是DPU的价值。”

UCloud资深技术专家马彦青

据了解,NVIDIA与UCloud在DPU领域有着长期的合作,因此UCloud对于DPU的研究非常深刻,他们认为DPU对于云计算供应商在云数据中心领域有多个方面的助力。

第一主要包括使用ASAP2做网络的卸载;第二是使用SNAP/Virtio BLK SNAP来做存储的卸载;第三是使用ARM处理器来做上面服务的编排管理;第四是可以利用它的DPI深度包检测功能做正则表达式的算法卸载;第五是可以做安全加解密的卸载,包括TLS、SSL以及IPSec这些算法;第六可以通过InfiniBand网络以及RDMA做数据的加速传输。

此外,UCloud在DOCA生态中,针对网络、安全、存储、HPC、机器学习领域也有着不同程度的提升与发展。

总体来看,DPU是一种新型的可编程处理器,DPU是一种片上系统或SoC,它结合了3个关键因素:

1、行业标准、高性能、软件可编程的多核CPU,通常基于广泛使用的Arm架构,与其他SoC组件紧密耦合。

2、一种高性能网络接口,能够以线速或网络其余部分的速度解析、处理和有效地将数据传输到GPU和CPU。

3、一组丰富的灵活可编程加速引擎,可为AI和机器学习、安全、电信和存储等卸载并提高应用程序性能。

DPU的推出将会成为继续提升数据中心性能的最关键点。

最后,从目前的DPU生态来看,它已经得到不少的支持,其中包括操作系统、应用、安全、存储等领域厂商。

DPU到底解决了哪些问题

比特网了解到,目前CPU来做IPSec或者TLS加解密操作,即使采用100G、200G的网络,它的性能可能只能达到20-30Gb/s或30-40Gb/s,即便把所有的CPU资源都用在加解密上,也没有办法达到加解密的线速。

宋庆春表示:“BlueField-3会是业界第一款400G速度的DPU。在BlueField-3上,我们会出400G的Ethernet或者InfiniBand的接口。值得一提的是,在BlueField-3上可以实现400Gb/s加解密的速度,不管是用IPSec还是用TLS,在加解密的速度上都可以达到400Gb/s的全线速。”

从最新推出的BlueField-3来看,其主要是针对在安全、网络、存储、AI 和HPC、5G和电信、多媒体等业务上来进行加速:

1、首先是安全方面,BlueField-3从IP层,传输层以及到MAC层的加解密,都可以实现它的在线加解密400Gb/s全线速在线加解密。此外,从BlueField-3以后,会对未来加密计算开始做铺垫,到BlueField-4以后,可以真正实现加密计算。

2、在网络方面,BlueField-3对RDMA技术以及Connection Tracking、ASAP2等这些网络通信技术进一步加强,对未来产生新的业务、应用提供了非常好的方向。5T for 5G也是未来在电信领域非常关键的技术。

3、在存储方面,可以实现此前不能完成的池化块存储、对象存储或者文件存储等,此外,存储上的各种签名操作都被卸载到DPU。还有AI/HPC的通信框架也可以卸载到DPU。通过卸载到DPU,可以实现无阻塞通信。

与全新BlueField-3 DPU同时推出的还有 NVIDIA DOCA1.0,据悉,DOCA为开发者提供一个完整、开放的软件平台,利用DOCA,开发者就可以在软件定义和硬件加速的网络、存储、安全和管理等应用的开发上如鱼得水。

DOCA的价值类似于CUDA对于GPU一样,通过CUDA可以看到所有GPU的开发接口,并对它做编程。DOCA上各种业务,不管存储还是安全都可以通过DOCA界面调用DPU里Offload的Engine来对它进行编程。

DOCA提供了BlueField-3创建、编译和优化应用的运行时环境,用于配置、升级和监控整个数据中心数千个DPU的编排工具,以及各种库、API和日益增加的各种应用,如深度数据包检测和负载均衡等。

目前已经在一些包括大数据业务、金融业务以及数据库的业务,容器云业务以及一些做芯片模拟的公司进行使用。

可以预见,NVIDIA在正式完成收购ARM后,那么,集成了ARM核的DPU将成为NVIDIA进入到数据中心存量市场取代x86 CPU的第一个切入点。

写在最后

从NVIDIA推出DPU我们可以看到他们对于网络数据处理的重视。此后,NVIDIA计划继续推进BlueField DPU产品线,旨在增强其网络互连处理能力,还将加强其AI处理能力,从而在多个维度上面增加产品的功能性。

比特网认为,未来数据中心领域已经成为各个芯片厂商争夺的主战场,这场围绕着人工智能、云计算、超算等领域的战争才刚刚开始,而NVIDIA推出的DPU则成为其切入数据中心的关键点。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部