2000T算力不是全部!英伟达DRIVE Thor芯片,还要抢高通的饭碗

2000T算力不是全部!英伟达DRIVE Thor芯片,还要抢高通的饭碗
2022年09月21日 22:12 电动知士运营小妹

在GTC2022线上大会上,英伟达给汽车行业送上一份“大礼”——NVIDIA DRIVE Thor系统级芯片。这款芯片的算力高达2000 TOPS,是Orin芯片的8倍,同时还取代了去年发布的DRIVE Atlan。

Thor凭什么取代Atlan?

Atlan芯片发布于2021年4月,算力超过1000TOPS,曾被认为是Orin的“接班人”以及未来L4/5级量产车的主流计算平台。但一年多后,Atlan甚至还没真正上市,就宣布将被Thor取代,这在业内是不多见的。

Atlan“下马”,是因为算力吗?

对于英伟达来说,算力一直不是问题。目前车载AI芯片的顶流Orin算力为254 TOPS,双芯冗余配置的总算力已经高达508TOPS,是特斯拉FSD算力(144TOPS)的3.5倍,足以满足L3级甚至更高的自动驾驶的需求。

当然,如果觉得508 TOPS不够高,还可以像蔚来一样搭载四颗芯片,算力再次翻倍,达到1016 TOPS。

而Atlan,一颗就能达到这个数字,算力绝不是Atlan芯片被取消的核心原因。

Transformer才是!

在发布会上,英伟达CEO黄仁勋提到:Hopper架构令人惊叹的Transformer引擎以及Vision Transformer的快速变革都至关重要,必须纳入到下一代的机器人处理器。

Transformer是谷歌提出的一种神经网络模型,Vision Transformer(ViT)则是一种面向图像领域的Transformer模型。

简单来说,这种模型中引入了一个概念叫“注意力(Attention)”,通过SE、CBAM等注意力模块,可以把握到较远距离像素之间的联系,而传统的CNN(卷积)算法往往只能注意到相邻像素点之间的关系。因此,Transformer模型往往能带来更高的准确度。

但与CNN、RNN相比,Transformer模型的结构复杂、参数量多,导致其规模呈指数级增长。在过去五年中,Transformer模型的计算量增长比大多数其他AI模型要快得多,每两年就要增长275倍

目前,Transformer模型已包含数万亿个参数,导致训练时间极长。例如,Megatron Turing NLG(MT-NLG)模型需要2048个NVIDIA A100 GPU运行2个月才能完成训练。

但从结果上看,Transformer模型的优势是十分明显的。据了解,从去年开始,ViT已经在成为了SOTA(state-of-the-art,指目前最先进的)模型,并在今年逐渐成为行业主流研发方向。

在这种趋势下,英伟达今年最新推出的Hopper架构中,TensorCore提升至第四代,加入了专门针对Transformer模型计算的Transformer引擎,并联合英特尔、ARM推出了FP8精度格式

Transformer引擎是一种定制Hopper Tensor Core技术,能够应用混合的FP8和FP16精度格式,智能管理精度以保持计算准确性,同时从更小、更快的数值精度中提升计算性能,大幅加速Transformer训练的AI计算。

而FP8精度格式则是一种8比特位浮点(8-bit Floating Point)规格,与TF32、FP16等规格相比,由于只使用了8个比特位,因而节省了额外的计算周期。它的加入提升了大型语言模型的推理速度,与Transformer引擎一起让Hopper架构的性能提升高达安培架构的30倍。

DRIVE Thor便是基于Hopper架构的一款系统级芯片,基于台积电4N工艺,DRIVE Thor内建770亿个晶体管,算力达到了2000TOPS。如果它内建了一个完整的GH100 GPU核心的话,将具备144个SM(流式多处理器),也就是集成了多达576个第四代Tensor Core。

而计划中的Atlan,则是与Orin相同的Ampere架构,不支持第四代Tensor Core与Transformer引擎,这可能才是它被取消的最大原因。

智驾&娱乐&车控,整车一芯全包

2000 TOPS,Thor算力很强,但这不禁让人发问:我们真的需要这么高的算力吗?

而英伟达告诉我们,这2000 TOPS的算力,不仅可以用于智驾。

老黄表示,Thor可以将其2000 TOPS算力全部用于智能驾驶流,也可以将其配置为把一部分用于驾驶舱AI和信息娱乐,一部分用于辅助驾驶。

而这则得益于,英伟达不仅有专注于计算的Hopper架构,还有用于通用计算的Grace CPU架构以及用于图形计算的Ada Lovelace GPU架构,这三者或将同时存在于Thor的晶片上,可以各司其职,也可互为助力。

此外,Thor还支持多计算域隔离技术,可以生成多个互相隔离的计算单元,允许并发的、对时间敏感的多进程无中断且互不干扰地执行命令,同时支持Linux、QNX、Android等不同系统。

这才体现了英伟达的野心!

目前,车身上普遍存在诸多ECU或域控制器,例如门窗、车身、动力、制动、智驾等系统,往往都由独立系统控制,这被称为分布式电子电气架构。而现在的一个趋势是,电子电气架构由分布式向集中式演变。

以往,多是车企在推动,如特斯拉、蔚来、理想、小鹏等,已经在底盘、车身或智驾域上进行尝试。但这种全栈自研的开发模式,无疑会带来巨大的研发成本和时间成本,不是每个厂商都可以承担并且乐于承担的。

Thor的这项特性,则在硬件和系统的角度上为诸多厂商提供了一个可选项。在硬件方面,它能提供的不仅仅是智能驾驶的计算平台,而是一套可以支持全车控制、娱乐系统等在内的全栈解决方案,可以简化车辆设计开发;而在软件方面,则又提供了足够的自由度,允许车企在软件方面的自研需求,支持车辆系统和功能的快速迭代。

正如老黄所说:“目前,自主泊车、主动安全、驾驶员监控、摄像头镜像、集群和信息娱乐均由不同的计算设备控制,而未来是在Thor上运行并随时间推移不断改进的软件所提供。”

找准定位,跑在行业前沿

智能汽车时代,有两个论点常被人提起,一是“软件定义汽车”,二是“马力的比拼将变为算力的比拼”。

在无数事实面前,这两个论点的正确性被一次次的验证,英伟达也逐渐成为了诸多车企的核心供应商。

英伟达的今天,与他们在GPU上的积累固然脱不开关系,但更可贵的是,英伟达对自身清晰的定位,和保持在行业前沿的态度。

正如Atlan的“陨落”,它不够强吗?在1000 TOPS的单芯算力面前,没人能下这个判断。但对于英伟达来说,在Transformer模型已成SOTA的趋势面前,Atlan已经是还未推出,便已“落后”。

于是,Atlan消失了,取而代之的Thor更强。

这不是一件容易的事,可一旦成功,成果可能就是划时代的。无论2000 TOPS的算力还是“整车一芯全包”,以现在的眼光看都足够震撼。

唯一的问题在于:2025年,DRIVE Thor能否获得足够的信任并按时出货?

我们拭目以待。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部