英伟达:软硬件生态是DPU的灵魂 中国开发者占全球总数的一半

英伟达:软硬件生态是DPU的灵魂 中国开发者占全球总数的一半
2022年07月11日 14:57 半导体投资联盟

图源:英伟达

集微网报道,芯片公司英伟达正努力让DPU(Data Processing Unit,数据处理器)成为继CPU、GPU后的第三大计算支柱。而正如其当年在发展GPU时同步推进CUDA生态发展一样,在DPU时代积极发展DOCA生态,对英伟达而言是异曲同工。

DPU被视为仅次于CPU、GPU的第三颗大芯片,负责处理“CPU做不好,GPU做不了”的数据任务。全球芯片巨头英伟达、英特尔先后下场,国内也涌现了中科驭数、云豹智能、大禹智芯等一系列创业公司,下游云计算龙头亚马逊的AWS、阿里云等厂商也早已布局……DPU行业正迎来百家争鸣的竞争格局。

英伟达自2020年10月发布了首款DPU产品BlueField-2 DPU系列以来,规划了多代产品,计划在2022年推出性能更强的BlueField-3 DPU,2024年推出集成其GPU模块的BlueField-4 DPU。而DOCA(Data Center Infrastructure On A Chip Architecture ),即“线上数据中心基础设施体系结构”,是一个为BlueField  DPU量身定做的软件开发平台,主要的目的是为开发者打造一个全面开放的开发平台,支持广大开发者可以在BlueField DPU上进行简单灵活的软件开发,让开发者可以快速地创建BlueField DPU,加速高性能的一些应用程序和服务。

今年5月,英伟达发布了DOCA1.3版本,与此前三个版本相比,它已经是比较完善的软件栈,开发者可以轻松地基于这个软件栈在本地BlueField DPU上或X86开发容器中搭建开发环境,来快速地开发自己想要实现的应用程序或服务。

在日前的一场媒体会上,英伟达介绍了其网络技术方面的最新进展。

软硬件生态是DPU的灵魂

据英伟达网络技术专家崔岩介绍,DOCA是为BlueField DPU量身定做的一个软件框架,它的主要目的是为开发者打造一个全面开放的开发套件,支持广大的开发者能够在BlueField DPU上面做简单灵活的软件开发,让开发者能够快速地创建BlueField DPU上面的应用程序和相关的服务。“其实它的定位就是DPU的灵魂,相当于用软件解锁DPU相关的功能。”

赛迪顾问的数据显示,从2023年开始全球DPU市场规模将突破百亿美元,并进入年增长率超过50% 的增长快车道。而在中国 DPU 市场规模在2023年也将有 300亿元人民币以上,会出现跳跃式增长。DPU 的广泛采用,将会催生大量新的应用和服务,带动相关硬件和软件系统平台的增长。

一项新技术的推进,尤其是到了大规模落地层面,应用和生态的驱动至关重要。

集微网了解到,在中国,英伟达则主要通过DOCA中国开发者社区、DOCA培训课程及开发者训练营和英伟达合作伙伴网络等三个方面构建自身生态。

DOCA中国开发者社区于2021年4月开始筹备,到目前已经逐步建立起DOCA在国内的生态体系。崔岩表示,DOCA 中国开发者社区正在持续拓展中,全球一半以上的注册开发者来自中国。此外,在构建 DOCA 应用程序及行业解决方案方面,裸金属云加速网络平台、高性能分布式存储、数字孪生基础设施、超级计算网络平台都有合作进展。

在合作伙伴方面,当前,英伟达正在和VMware、Palo Alto Networks和Juniper Networks等厂商展开合作,扩展了英伟达BlueField DPU及DOCA软件架构在平台、基础设施、存储、网络安全、5G和边缘计算等应用场景的解决方案。

应用驱动DPU发展

DPU的问世源自应用驱动。英伟达创始人兼CEO黄仁勋在英伟达发布首款DPU时表示,“现代超大规模云正在推动数据中心的新架构。需要一种旨在处理数据中心基础设施软件的新型处理器来卸载和加速虚拟化、网络、存储、安全和其他云原生AI服务的巨大计算负载。”

随着人工智能与数据中心任务深度融合,CPU已经很难独自支撑数据中心工作负载,建设新的数据中心架构成为行业共识。在CPU、GPU和DPU“三U”一体的新架构中,DPU可以为云、数据中心、边缘计算各种环境中各种应用负载提供安全、加速和基础设施。

近年来,包括英伟达、英特尔、Marvell、博通等全球芯片龙头和众多创业公司,以及包括AWS、阿里云等各大云服务厂商都在布局自己的数据处理器,这说明大家也都认识到了实际应用在数据中心里面遇到的问题。 

不过,集微网注意到,在大规模应用层面,真正实现大规模商用DPU架构的,目前全球那只有亚马逊的AWS和阿里云两家。其中,AWS采用的是以Arm核为主的方案。2017年,AWS正式推出Nitro,将网络、存储和安全任务卸载到基于Arm架构的专用设备上。阿里云提出的X-Dragon系统架构核心MOC卡采用的则是FPGA+CPU的形式。

对此,崔岩解释,对于 DPU 的大规模应用,有三个角度:一个是通过数据中心加速计算模型带来的大规模应用,DPU 为 CPU 的业务应用负载和 GPU 的人工智能、机器学习工作负载提供数据传输及数据处理,性能成本比、基础架构通用性与软硬件可迭代成为关注要素;一个是针对客户自身的数据中心基础设施应用场景定制的设计,通过大规模部署 DPU 来满足特定应用场景的需求及解决特定场景的问题,但对客户的开发能力与资源投入带来挑战;此外,还可以通过生态体系带来的大规模应用,从客户多样化应用需求出发,基于开放、标准化平台来提供创新应用的通用集成解决方案,买来即可集成、即可部署,但需要构建优质的生态体系。(校对/Sharon)

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部