第一批做DPU芯片的厂商发展怎样了?

第一批做DPU芯片的厂商发展怎样了?
2022年10月01日 11:00 半导体行业观察

DPU自2020年爆火至今已有2年,从目前行业的关注度来看,DPU带来的机遇已经基本形成共识。世界范围来看,DPU竞争激烈,国外大厂英伟达、AMD、英特尔、高通、博通一线厂商均开始在DPU方向发力,DPU已经成为很重要的一个赛道。最好的时代就在当下。

DPU火热两年,我们对其又有了新认识

首先让我们再来看看,DPU为何会在2020年左右火起来呢?此前的解释:摩尔定律的放缓与全球数据量的爆发这个正在迅速激化的矛盾通常被作为处理器专用化的大背景,但是该大背景虽然有一定的合理性,但是还是过于模糊,并没有更好的解释出DPU“横空出世”的原因。中科驭数发布的《专⽤数据处理器 (DPU)技术白皮书》中对这一原因做了另外的解释:通过比较网络带宽的增长趋势和通用CPU性能增长趋势,能发现一个有趣的现象:带宽性能增速比(RBP,Ratio of Bandwidth and Performance growth rate)失调

2010年前,网络的带宽年化增长大约是30%,到2015年微增到35%,然后在近年达到45%。相对应的,CPU的性能增长从10年前的23%,下降到12%,并在近年直接降低到3%。在这三个时间段内,RBP指标从1附近,上升到3,并在近年超过了10!如果在网络带宽增速与CPU性能增速近乎持平,RGR~1,IO压力尚未显现出来,那么当目前RBP达到10倍的情形下,CPU几乎已经无法直接应对网络带宽的增速。因此,带宽性能增速比的失调激化了对DPU的需求。

那么什么是DPU?关于DPU的定义很多,DPU是以数据为中心构造的专用处理器,采用软件定义技术路线支撑基础设施层资源虚拟化、存储、安全、服务质量管理等服务。DPU是下一代“算力网络”的核心支撑组件。

其实DPU是什么不重要,重要的是DPU能做什么。如果从功能角度来看DPU,英伟达认为DPU的功能是,用来把数据在正确的时间放到正确的位置。什么叫正确的时间放到正确的位置?正确的时间指的是必须延迟要满足要求,带宽要能达到数据量,自己的数据带宽要做到匹配;正确的位置指的是要把所有的远程资源都本地化,所有的跨节点访问都要做的跟访问本地的资源是一样的。

那么,DPU的市场价值是怎样的呢?很多人会认为DPU是一颗专用芯片,一旦专用化,就代表你需要很多定制化,定制化以后就会非标,一旦非标价值就很低,其实这是一个认知的误区。定制化、专用化、标准化这三者是完全不相关的概念:专用化强调的是应用场景,跟最后的价值高低没有直接关系;定制化是技术实现的路径选择;标准化是为了降低边际成本。那么DPU是否能标准化?中科驭数创始人兼CEO鄢贵海表示,我们觉得,DPU肯定是个好东西,标准化也能做成,但是有挑战

DPU特有的挑战,要求芯片厂商必须软硬兼施

任何一个新技术在做产业化的过程中,都会面临一些特定的挑战,DPU也不例外,而且其面临的挑战还不小。

DPU很大的一个应用挑战就是跨平台下的“适配”问题,DPU要与当下的CPU以及各种操作系统进行适配,这非常考验DPU厂商的技术实力。而且加之DPU本身特有的挑战主要有需求比较碎片化、软件生态不够成熟。当然DPU还有一些行业共性的挑战,比如芯片量产供应链的问题和高水平研发人员的短缺问题。

所以DPU必是一个软硬兼施的产业,“如果不做软件,DPU整个功能和性能都没法得到充分的释放,这就导致最后你要去兼容各种奇形怪状上层的系统,那些系统比应用还碎片化。”鄢贵海指出。

正因为如此,我们可以看到,英伟达为其BlueField DPU特意打造了DOCA软件框架,DOCA能将BlueField DPU提供的硬件能力做软件抽象和封装,以SDK Library的形式提供友好的可编程接口,提高应用开发的效率。

中科驭数从2018年就提出了“软件定义加速器“的发展路径,四年磨一剑,中科驭数自研的HADOS系统已经迭代到第三代,直接对标英伟达的DOCA。在中科驭数看来,HADOS是解决DPU众多挑战的最重要的一招棋。下图展示了DOCA、OneAPI和HADOS的比较。得益于中科驭数自研的软件开发平台HADOS,驭数产品灵活度高、稳定性强、兼容性好,全面适配国内外多种操作系统,大幅降低应用软件开发难度。

DOCA、OneAPI与HADOS比较分析(需要指明的是,OneAPI本身并不提供DPU设备,而是构建一个软件框架来整合业界现有的异构计算设备)(来源:2021《专用数据处理器(DPU)技术白皮书》)

第一批国内做DPU的厂商发展到哪一步了?

芯片算力的发展有三个要素:第一,性能必须要高;第二是生产率,主要看系统能不能做的更好用,学习成本更低,以及兼容性做到最广;第三是成本能不能尽量做到优势。

对一个初创公司来说,大抵都是从第一点开始做起,循序渐进。那第一批国内创业做DPU的厂商发展到哪一步了?拿中科驭数来说,目前大致处在第二阶段,不管是DPU的核心架构还是软件的频繁迭代,以及跟国产品牌适配等等,这些都是为了解决DPU产品能好用、易用的问题。

接下来就是解决第三个成本的问题,今天单颗DPU成本还比较高,主要原因是:大规模化还没起来,AMD认为10万颗以上才算上量,就服务端的CPU来看,确实还是一个比较不错的量。那么DPU能达到怎样的体量呢?鄢贵海表示:“DPU最后的量不会低于服务器的量,这就意味着我们还有很大的空间去通过规模效应降低我们产品的成本。这也是驭数从现阶段基本形成商业闭环,到发展成为产业比较重要位置的公司,要突破的最后一道屏障。”

中科驭数的DPU也是按照算力发展的三大要素这样的路径演化:其K1主要用于交易风控;K2开始进入了数据中心的一些场景,而且K2在功能和性能上都有了较大的提升,第二代DPU芯片K2预计近期回片,这也是国内目前功能定义相对较完整的首颗DPU芯片;到明年,K2的增强版主频提高到800MHz,功耗优化60%,面积优化75%等等,并进一步拓宽DPU的应用领域,完善DPU功能设置;K3设计方案已经完成,今年第四季度将启动研发K3有望对标甚至超越BF3、MtEvans。可以看出,中科驭数作为国内第一批研究DPU芯片的企业,其芯片迭代的节奏正在有条不紊的进行中

值得一提的是,中科驭数在落地场景的选择上,首先瞄准的是超低时延的金融场景。在金融场景,对于DPU来说,超低延迟网卡是刚需,必须要做到1.7μs才是超低时延。而在这个场景下,处于长期被国外厂商垄断的局面,直到去年,AMD占据90%以上的市场份额,剩下的几乎被英伟达占据,还有思科。中科驭数做了4年,才在这个场景跻身为行业第四个玩家,打破了国际厂商的垄断。接下来,中科驭数将发力更广阔的数据中心和5G边缘计算等云原生场景,预计到2022年底,中科驭数将成为国内DPU行业在云原生应用上首个大订单。

所以接下来的重头戏将是K2芯片。据中科驭数CTO卢文岩博士的总结,中科驭数的K2-DPU主要有五大优势:

1)技术先进:通过架构创新,首创KPU芯片架构,可集成数百异构处理器核;

2)功能完备:K2从指标和功能覆盖面来看,相比一线厂商相比是不弱的,K2-DPU可以覆盖虚拟化、网络、计算、存储、安全等全功能;

3)性能高:具体到各功能来看,其中在DPU中很关键的一个功能网络处理的引擎方面,中科驭数的K2可以直接对标业界领先的AMD方案,达到400Gbps,转发延迟小于5μs;再者,被认为是下一代数据中心互联核心的RDMA协议,目前能商用的RDMA的引擎只有英伟达,但是现在中科驭数RDMA引擎已经做到在链接数和延时等多方面功能和性能直接对标英伟达。此外,K2无论是性能还是时延方面远超FPGA智能网卡方案,

4)成熟度高:已达到量产标准,2023年全面量产;

5)生态完善:HADOS软件已经批量部署。

日前,中科驭数宣布完成超以往轮次融资规模的数亿元B轮融资,本轮融资将进一步加速驭数DPU芯片的研发迭代和产业布局,加速构建DPU芯片的生态体系,为数据中心下一代算力架构变革,提供纯国产核心级基础设施,继续保持DPU赛道的领跑地位。

写在最后

对于DPU乃至整个半导体产业而言,当下我们正处于百年未有之大变局。新基建、东数西算以及运营商的算力网络规划等给国产DPU行业带来了重要的机遇。在这样的背景下,国产DPU厂商应当利用好国产信创行业的发展机遇,扎实推进核心功能的自主研发,把产品做好;走开放的系统,与CPU、OS、网络等厂商,相互融合,共创繁荣。同时,构筑与国内其他类型DPU研发团队写作共赢的机制,早日将DPU发展成为行业新的生产力。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部