2000T算力不是全部！英伟达DRIVE Thor芯片，还要抢高通的饭碗_

在GTC2022线上大会上，英伟达给汽车行业送上一份“大礼”——NVIDIA DRIVE Thor系统级芯片。这款芯片的算力高达2000 TOPS，是Orin芯片的8倍，同时还取代了去年发布的DRIVE Atlan。

Thor凭什么取代Atlan？

Atlan芯片发布于2021年4月，算力超过1000TOPS，曾被认为是Orin的“接班人”以及未来L4/5级量产车的主流计算平台。但一年多后，Atlan甚至还没真正上市，就宣布将被Thor取代，这在业内是不多见的。

Atlan“下马”，是因为算力吗？

对于英伟达来说，算力一直不是问题。目前车载AI芯片的顶流Orin算力为254 TOPS，双芯冗余配置的总算力已经高达508TOPS，是特斯拉FSD算力（144TOPS）的3.5倍，足以满足L3级甚至更高的自动驾驶的需求。

当然，如果觉得508 TOPS不够高，还可以像蔚来一样搭载四颗芯片，算力再次翻倍，达到1016 TOPS。

而Atlan，一颗就能达到这个数字，算力绝不是Atlan芯片被取消的核心原因。

Transformer才是！

在发布会上，英伟达CEO黄仁勋提到：Hopper架构令人惊叹的Transformer引擎以及Vision Transformer的快速变革都至关重要，必须纳入到下一代的机器人处理器。

Transformer是谷歌提出的一种神经网络模型，Vision Transformer（ViT）则是一种面向图像领域的Transformer模型。

简单来说，这种模型中引入了一个概念叫“注意力（Attention）”，通过SE、CBAM等注意力模块，可以把握到较远距离像素之间的联系，而传统的CNN（卷积）算法往往只能注意到相邻像素点之间的关系。因此，Transformer模型往往能带来更高的准确度。

但与CNN、RNN相比，Transformer模型的结构复杂、参数量多，导致其规模呈指数级增长。在过去五年中，Transformer模型的计算量增长比大多数其他AI模型要快得多，每两年就要增长275倍。

目前，Transformer模型已包含数万亿个参数，导致训练时间极长。例如，Megatron Turing NLG(MT-NLG)模型需要2048个NVIDIA A100 GPU运行2个月才能完成训练。

但从结果上看，Transformer模型的优势是十分明显的。据了解，从去年开始，ViT已经在成为了SOTA（state-of-the-art，指目前最先进的）模型，并在今年逐渐成为行业主流研发方向。

在这种趋势下，英伟达今年最新推出的Hopper架构中，TensorCore提升至第四代，加入了专门针对Transformer模型计算的Transformer引擎，并联合英特尔、ARM推出了FP8精度格式。

Transformer引擎是一种定制Hopper Tensor Core技术，能够应用混合的FP8和FP16精度格式，智能管理精度以保持计算准确性，同时从更小、更快的数值精度中提升计算性能，大幅加速Transformer训练的AI计算。

而FP8精度格式则是一种8比特位浮点（8-bit Floating Point）规格，与TF32、FP16等规格相比，由于只使用了8个比特位，因而节省了额外的计算周期。它的加入提升了大型语言模型的推理速度，与Transformer引擎一起让Hopper架构的性能提升高达安培架构的30倍。

DRIVE Thor便是基于Hopper架构的一款系统级芯片，基于台积电4N工艺，DRIVE Thor内建770亿个晶体管，算力达到了2000TOPS。如果它内建了一个完整的GH100 GPU核心的话，将具备144个SM（流式多处理器），也就是集成了多达576个第四代Tensor Core。

而计划中的Atlan，则是与Orin相同的Ampere架构，不支持第四代Tensor Core与Transformer引擎，这可能才是它被取消的最大原因。

智驾＆娱乐＆车控，整车一芯全包

2000 TOPS，Thor算力很强，但这不禁让人发问：我们真的需要这么高的算力吗？

而英伟达告诉我们，这2000 TOPS的算力，不仅可以用于智驾。

老黄表示，Thor可以将其2000 TOPS算力全部用于智能驾驶流，也可以将其配置为把一部分用于驾驶舱AI和信息娱乐，一部分用于辅助驾驶。

而这则得益于，英伟达不仅有专注于计算的Hopper架构，还有用于通用计算的Grace CPU架构以及用于图形计算的Ada Lovelace GPU架构，这三者或将同时存在于Thor的晶片上，可以各司其职，也可互为助力。

此外，Thor还支持多计算域隔离技术，可以生成多个互相隔离的计算单元，允许并发的、对时间敏感的多进程无中断且互不干扰地执行命令，同时支持Linux、QNX、Android等不同系统。

这才体现了英伟达的野心！

目前，车身上普遍存在诸多ECU或域控制器，例如门窗、车身、动力、制动、智驾等系统，往往都由独立系统控制，这被称为分布式电子电气架构。而现在的一个趋势是，电子电气架构由分布式向集中式演变。

以往，多是车企在推动，如特斯拉、蔚来、理想、小鹏等，已经在底盘、车身或智驾域上进行尝试。但这种全栈自研的开发模式，无疑会带来巨大的研发成本和时间成本，不是每个厂商都可以承担并且乐于承担的。

Thor的这项特性，则在硬件和系统的角度上为诸多厂商提供了一个可选项。在硬件方面，它能提供的不仅仅是智能驾驶的计算平台，而是一套可以支持全车控制、娱乐系统等在内的全栈解决方案，可以简化车辆设计开发；而在软件方面，则又提供了足够的自由度，允许车企在软件方面的自研需求，支持车辆系统和功能的快速迭代。

正如老黄所说：“目前，自主泊车、主动安全、驾驶员监控、摄像头镜像、集群和信息娱乐均由不同的计算设备控制，而未来是在Thor上运行并随时间推移不断改进的软件所提供。”

找准定位，跑在行业前沿

智能汽车时代，有两个论点常被人提起，一是“软件定义汽车”，二是“马力的比拼将变为算力的比拼”。

在无数事实面前，这两个论点的正确性被一次次的验证，英伟达也逐渐成为了诸多车企的核心供应商。

英伟达的今天，与他们在GPU上的积累固然脱不开关系，但更可贵的是，英伟达对自身清晰的定位，和保持在行业前沿的态度。

正如Atlan的“陨落”，它不够强吗？在1000 TOPS的单芯算力面前，没人能下这个判断。但对于英伟达来说，在Transformer模型已成SOTA的趋势面前，Atlan已经是还未推出，便已“落后”。

于是，Atlan消失了，取而代之的Thor更强。

这不是一件容易的事，可一旦成功，成果可能就是划时代的。无论2000 TOPS的算力还是“整车一芯全包”，以现在的眼光看都足够震撼。

唯一的问题在于：2025年，DRIVE Thor能否获得足够的信任并按时出货？

我们拭目以待。

头条号入驻

电动知士运营小妹学知识涨姿势！一起玩转电动汽车！

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

4000520066 欢迎批评指正

2000T算力不是全部！英伟达DRIVE Thor芯片，还要抢高通的饭碗

头条号入驻

今年八月，岚图华为联合官宣打造全新梦想家，现在梦想家乾崑版终于来了…

明天就是广州车展了…

极致大空间，翼真L380：高端纯电MPV的又一诠释

财经自媒体联盟更多自媒体作者

热文排行榜