“迷你超算”遭吐槽,但NVIDIA的野心并不止于此

“迷你超算”遭吐槽,但NVIDIA的野心并不止于此
2025年01月12日 21:54 三易生活

几天前,NVIDIA在CES展前召开发布会时,除了公布RTX 50系列显卡之外,还带来了一些主要针对开发者和企业用户的玩意。比如其中有一款名为“Project DIGITS”的AI超算,就吸引了不少关注。

“Project DIGITS”是什么?NVIDIA方面将其称之为“目前体积最小的AI超算”。这是一款大约只有饭盒大小的PC主机,从发布会上的演示视频来看,它可能与大家熟悉的Mac mini,或是那些较小的x86 NUC差不多大小。

在“Project DIGITS”内部,却并不是常见的低电压移动版PC平台,但是NVIDIA称其称之为“超算”,确实是一点也没吹牛。

因为Project DIGITS使用了一颗定制的“GB10”超级芯片,它在一个核心里融合了基于Blackwell架构的GPU,以及NVIDIA与联发科、ARM三方合作研发的Grace CPU。

根据相关技术资料显示,其中的Blackwell GPU能够提供1PFLOPS的FP4算力,同时Grace CPU则包含了10个Cortex-X925核心和10个Cortex-A725核心。在GPU和CPU之间,则是通过大型超算同款的NVLINK-C2C芯片到芯片互联总线连接。

除此之外,Project DIGITS还配备了一颗独立的NVIDIA ConnectX互联芯片,它可以让“GB10”超级芯片内部的GPU兼容多种不同的互联技术标准,其中包括NCCL、RDMA、GPUDirect等,从而使得这颗“大核显”可以被各种开发软件和AI应用直接访问。

在存储配置上,Project DIGITS则提供128GB的LPDDR5X统一内存,并直接预装了4TB的NVMe SSD作为存储空间。

不难看出,无论从芯片级别的架构设计、还是外围配置来说,NVIDIA Project DIGITS都确实要远高于一般的“迷你PC”。况且从它的功能定位来讲,NVIDIA为其预想的使用场景,主要是作为小体积高性能的“AI开发平台”使用。

根据他们的说法,单台Project DIGITS即可离线运行200B(2000亿)参数级别的大模型。而且两台Project DIGITS还能实现“合体”,当做一台统一设备来使用,从而带动最高405B(4050亿)参数量大模型在桌面端的开发和训练工作。

看到这里,是不是觉得老黄这台“迷你超算”很强很无敌了?然而就在近日,以Raja Koduri为代表的一些业界知名人士公开提出了对Project DIGITS的质疑。

那么Raja Koduri是谁呢?他曾先后就职于AMD和Intel,主导过好几代RDNA架构显卡以及Intel近年来Xe GPU的架构开发。所以他“开炮”的主要对象,自然就是Project DIGITS内部的GPU设计。

根据Raja Koduri等人的说法,Project DIGITS的“问题”在于NVIDIA使用了FP4格式来计算其浮点性能、而不是通常GPU领域常见的FP16或FP32。而FP4格式算出来的浮点性能会比FP32高了8倍,换句话说,如果改用行业常见的统计方式,那么Project DIGITS的“实际浮点表现”就远没有NVIDIA所宣传的那么高。

Raja Koduri甚至声称,如果按照GPU领域的通行算法,Project DIGITS集成的“GB10”芯片浮点性能可能并不会比RTX 5070高多少,甚至有可能接近售价不到2000元的Intel ARC B580。如此一来,开发者其实完全可以自行“攒机”,用少得多的成本得到更高的浮点性能,而不需要去购买NVIDIA这个售价高达3000美元(约合人民币22000元)的“迷你超算”。

乍看之下,作为行业公认的GPU设计专家,Raja Koduri这个说法似乎有一定道理。但问题在于,他可能误解了Project DIGITS的“用途”,将其错误地理解为一款普通的、基于ARM架构的Linux PC。

根据NVIDIA方面公布的相关资料显示,Project DIGITS出货时不止会预装专为其设计的Linux系统,同时还会预置一系列AI软件库,包括各种AI开发工具包、AI框架、AI模型,以及一系列用于加速模型运行的NVIDIA专用工具。而这些工具软件的配置、优化,包括软硬件的调试成本,显然便不是普通用户靠自行攒机就能够解决的。

诚然,从“游戏显卡”这个角度来看,FP4这种低精度的浮点格式确实几乎没什么用,但对于AI开发来说,只要优化得当,它也确实能起到成倍加速模型训练、运行的效果。所以只要NVIDIA方面没有隐瞒他们的性能指标是在FP4格式下计算出来这件事(他们也确实没有隐瞒这一点),并且提供了相应的AI开发工具,那自然就算不上是任何的欺诈或者对用户不负责。

不过从Project DIGITS的“使用场景”来看,虽然它的硬件架构非常专业,也确实是专为AI开发而生,但正如Raja Koduri所说的那样,它也的确可以视为一款跑在Linux系统上、基于ARM指令集的PC。

从这个角度去思考就会发现,Project DIGITS多少也可以看作是NVIDIA、联发科、ARM三方联合,针对ARM PC这种产品形态的一次尝试。虽然它目前当然不是针对的大众消费者,但只要NVIDIA(或联发科)能解决好这一生态下的软件运行效率问题,那么未来还真不好说它会不会成为苹果Mac、甚至是隔壁x86 PC生态的又一个有力挑战者。

毕竟就连老黄自己也确实曾在推出Project DIGITS之后表示,NVIDIA对于桌面级的PC CPU“有进一步计划”,只是目前还不方便透露而已。

【本文图片来自网络】

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部