Nvidia 的 Jensen Huang 在今年 GTC 的问答环节中表示,依赖全栅 (GAA) 晶体管的下一代工艺技术可能会为该公司的处理器带来 20% 的性能提升。然而,Nvidia GPU 最显著的性能提升来自于公司的架构和软件创新。
当被问及未来一代 Nvidia GPU 架构(如预计将在两代之后(2028 年)推出的 Feynman)时,Huang 提到,如果 Nvidia 过渡到依赖 GAA 晶体管的工艺技术,应该会带来 20% 的性能提升。
我们自己的 Jarred Walton 也参加了问答环节,他表示 Huang 似乎淡化了工艺节点变化的重要性,强调摩尔定律的放缓意味着未来全新的工艺技术只会带来大约 20% 的改进——在密度、功率和/或效率方面。这并不是 Nvidia 打算使用哪个节点的明确声明,尽管答案是在回答一位分析师的问题,该分析师希望他对 Nvidia 特别使用三星代工厂的可能性发表看法。
黄仁勋还指出,虽然由尖端工艺技术带来的改进是受欢迎的,但它们不再具有变革性。“我们会接受它,”他说,但表示其他因素更为重要。随着人工智能系统的扩展,管理大量处理器的效率变得比每个处理器的原始性能更为重要。詹森说,数据中心越来越关注每瓦性能,而不是“我们处于物理极限”。
与苹果不同,苹果是台积电所有尖端节点的 alpha 客户,而 Nvidia 通常不是首先采用台积电最新工艺技术的公司。相反,它使用成熟的技术。 Nvidia 已使用台积电 4nm 级工艺技术的定制版本(4N 和 4NP)为客户端 PC 和数据中心生产 Ada Lovelace、Hopper 和 Blackwell GPU。台积电的 4nm 级生产节点属于该公司的 5nm 级工艺开发套件,本质上是该代工厂 5nm 技术的精炼版本。
该公司的下一代 AI GPU(代号 Rubin,带有定制的 Vera CPU)预计将于明年推出,预计将使用台积电的 3nm 级制造工艺(可能是 N3P,或“3NP”等定制版本)。为此,可以合理地预期 Nvidia 将为 Feynman 采用基于 GAA 的工艺技术,预计该技术将于 2028 年推出。
台积电本身预计其首款基于 GAA 的工艺技术 N2 将使性能提高 10% 至 15%与 N3E 相比,N3E 是该公司在 N3P 之前推出的第二代 3nm 级工艺技术。同样,Nvidia 的黄仁勋可能甚至没有提到台积电 N2 或三星的替代品,甚至英特尔的 18A,而只是暗示他预计总体上会有 20% 的提升。
值得注意的是,由于 Nvidia 不使用第一代工艺技术(或至少多年来没有使用过),我们预计 Feynman GPU 将采用 N2P(如果它继续使用台积电),它可以提高性能、降低阻力并稳定电力输送,甚至A16 会增加背面电力输送,并承诺与 N2 相比性能提升 8% 至 10%。 N2P 和 A16 预计都将在 2027 年实现量产。
如果 Nvidia 在其 2028 年产品中采用 N2P 或 A16,那么该公司有理由预期其 Feynman GPU 在 N2P 或 A16 上的每瓦性能将比 Rubin GPU 在 N3P 上的每瓦性能提高 20%。实际性能可能还会更高,不过考虑到目前对 AI 计算的巨大需求,Nvidia 似乎有时追求的是最高性能而不是最高效率。
虽然 Nvidia 是当今领先的处理器开发商之一,但黄仁勋多次强调,他的公司不再只是一家半导体公司。相反,他将公司描述为大型 AI 基础设施的提供商。他还将其描述为算法开发的领导者,尤其是在计算机图形学、机器人技术和计算光刻等领域。
然而,尽管 Nvidia 已逐渐从开发“单纯”计算 GPU 转向开发 AI 服务器,现在又转向开发服务器机架和集群,但黄仁勋认为 Nvidia 并不一定与自己的客户竞争。据他介绍,Nvidia 并不为最终用户构建实际的解决方案,而是提供基础技术。
黄仁勋的九大预测
一、他预计 GAA 晶体管将使性能提升约 20%
当被问及未来两代 Feynman GPU 是否会使用台积电 N3 以外的工艺,从而使用 GAA 晶体管时,黄仁勋表示,“如果我们使用新晶体管”,他预计性能提升将在 20% 左右。
“它不会改变世界,但我们会接受它——我们会接受一切,”他说。
虽然每个处理器 20% 的性能提升当然很重要,但在黄仁勋设想的 AI 部署规模中,管理所有处理器的开销成为最重要的事情,他说。
二、他预计贸易关税对 Nvidia 的业务影响不大
“我们有一个敏捷的供应商网络,他们不只在中国台湾、墨西哥或越南,”黄仁勋说。“这涉及很多方程式,这取决于哪个国家或地区征收关税。在短期内,我们预计 [潜在关税] 不会对我们的前景或财务产生重大影响。”
从长远来看,如果 Nvidia 能够在今年年底前增加更多的本土制造能力,那么该公司将处于“相当不错的状态”,他补充道。
三、他重视美国的中国工程人才
黄仁勋被反复问及中国的情况,特别是关于美国出口管制限制了 Nvidia 在该地区的市场。
他说,虽然人工智能常常看起来像是魔法,但它实际上只是软件,每个国家都有能力以某种方式运行它。
“在可能的范围内,我们希望能够用美国的技术和美国标准来支持每个国家,”他说。“我认为这对需要获得社会所需计算能力的国家和美国都有好处。”
在回答后来关于出口管制和中国市场的问题时,他的回答不那么圆滑。
“我们有基本义务遵守法律,尽最大努力竞争和服务客户,”他说,并指出 Nvidia 在这方面并不是独一无二的。 “随着世界变得越来越复杂,这些都不是我们的公司应该考虑的问题。我们只是明智地确保我们始终遵守法律,并尽最大努力为我们的客户和市场服务……这是我们在这件事上需要做到的最周到的。”
黄还指出,世界上 50% 的人工智能研究人员最初来自中国,“迄今为止,中国是最大的人工智能研究人员群体”,他说道。“因此,中国将对人工智能研究做出巨大贡献,这是有道理的,因为美国的每个人工智能实验室都有许多优秀的中国研究人员,无一例外。”
“不管中国如何培养出这么多优秀的计算机科学家,不管你们怎么做,请继续这样做”,他补充道。
四、他不认为 Nvidia 是一家芯片公司
黄仁勋曾多次将自己曾经是一家芯片公司的经历比作“过去的美好时光”,他表示,Nvidia 实际上是一家基础设施公司。
“我们现在所做的是构建 AI 基础设施,每次部署都要花费数十亿美元,”他说。
在回答有关 Nvidia 软件员工的另一个问题时,黄仁勋再次表示,Nvidia 不是一家芯片公司。
“Nvidia 制造芯片,但我们不是一家芯片公司,我们实际上是一家算法公司,”他说。“我们是当今世界领先的计算机图形算法创造者。”
他指出,Nvidia 为机器人和计算光刻技术开发了基于物理的 AI 模型,并拥有数百名 AI 研究人员。
“我们在技术传播之前就已经开始研究,你可能已经看到了 Nvidia 最早的渐进式 GAN 或变分自动编码器,”他说。“芯片 CEO 不会谈论这些事情。”
他补充说,以算法为中心体现在 Nvidia 的全系统能力中,并指出 Nvidia 硬件和系统创新的快速步伐是可能的,“因为我们首先了解算法。”
“我认为芯片设计几乎是次要的,”他补充道。“我们对此感到非常自豪,我们制造非常复杂的芯片,但我们擅长解决算法。”
关于 Nvidia 是或不是什么类型的公司的进一步澄清来自后来的一个问题,即全系统公司如何避免与客户竞争。他说,Nvidia 不是一家解决方案公司。
“我们制造一切,但我们以他们想要的方式将其提供给世界,”他说。“原因是我们不是一家解决方案公司……我们建立原始技术,并与我们的生态系统合作创造解决方案。”
“我们毫不费力地与任何以他们的方式合作,”他说。 “如果 [客户] 决定做更多,从我们这里拿走更少,我不会介意。这就是为什么我们将我们的技术构建在多个堆栈中 — 只有芯片、只有系统、只有软件、只有算法 — 您来决定。”
“我们的理念是:购买您想从我们这里购买的任何东西,但请务必从我们这里购买,”他笑着说。
五、他认为推理与训练是不同的问题
黄仁勋的主题演讲主要集中在未来的 AI 工厂 — 大规模制造tokens。
“工厂帮助客户赚钱 — 我们的工厂直接转化为客户的收入,”他说。“这不仅仅是一个芯片和这个和那个……整个工厂非常复杂,处于物理极限。我们所做的一切都被扩大到最大。”
随着市场转向竞争性tokens生成(推理而不是训练),性能与客户功率限制的重要性从未如此重要。
“AI 工厂的最大收益取决于每瓦特的最佳性能——性能可以直接转化为每秒tokens数量,”他说。“对于我们所有的客户来说,业务门槛比以前高得多,竞争门槛也高得多,风险承受能力也比以前低得多。”
六、争夺市场份额不是 Nvidia 的风格
“我们不会争夺竞争,这不是 Nvidia 的风格,”他说。“请注意,当你来找我们谈话时,没有一个员工会说我们争夺市场份额——为什么要争夺市场份额?为了做什么?创造新的东西!”
他说,为了用相对较小的员工队伍(按大型科技公司的标准)创造新的东西,Nvidia 依靠其合作伙伴的卓越表现。
“如果他们开发出非常棒的产品,我们就会使用,我不在乎是哪家公司,”他说,并指出 Nvidia 在某些领域与其竞争的公司合作,包括 AMD、英特尔、博通、Marvell、联发科等。
“我们试图与每家公司合作,这样我们就可以把非常稀缺的精力集中在开发世界上没有的东西上,”他说。
七、关于 Nvidia 收购英特尔的传言被大大夸大了
黄仁勋直接驳斥了最近有关 Nvidia 是财团成员的报道,该财团曾组建一个竞标小组来收购陷入困境的芯片制造商英特尔。
“我不知道这个传言是从哪里来的,但没有人邀请我们加入财团,”他说。“没有人邀请我……也许还有其他人参与其中,我不知道。也许有一个我没有被邀请参加的聚会。”
八、他认为谁先实现 AGI 并不重要
当被问及他是否认为投资最多的人会首先实现 AGI,考虑到最近美国、欧盟和中国对人工智能的投资公告,黄仁勋说这并不重要。
“你知道世界上最聪明的人是谁吗?你在乎吗?”他说。“我相信我们需要实现 AGI,这样我们才能让人工智能解决我刚才描述的问题 [可以应用推理和使用工具的人工智能]。最聪明的 AGI 可能并不那么重要。”
他说,比拥有最聪明的 AGI 或首先实现 AGI 更重要的是战略——赋予人工智能正确的使命和目的。
九、他认为tokens生成的重要性与制造相当
“人工智能不仅仅是数据中心,人工智能就是制造业,”黄仁勋说。“你在制造一种叫做智能的东西,如果你重构它,它就会变成文字、故事、法律文件、分析师报告……音乐、电影、影片、广告活动。如果你以不同的方式重构它,它就会变成机器人动作或方向盘激活。”
黄仁勋将人工智能与电力基础设施和能源行业进行了比较,后者又彻底改变了所有其他行业。他说,全球 GDP 的“很大一部分”应该用于制造智能。“这是我的希望,也是我的信念,”他说。
“我希望这会发生,因为我相信,当一个叫智能制造的行业出现时,我们所有人都会过得更好,”他补充道。
参考链接
https://www.tomshardware.com/tech-industry/nvidias-jesnen-huang-expects-gaa-based-technologies-to-bring-a-20-percent-performance-uplift


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有