采访 | 周长贤 张祥威撰文 | 张祥威 编辑|马青竹
王晓刚与沈邵劼、周光等偶爆“金句”的友商技术高管不同,这位商汤绝影一号位,言辞朴实。做过香港中文大学电子工程系教授的他,被人称作王老师。
2017年,在智能驾驶还比较蛮荒的时代,王老师曾带队拿下本田长达5年的智驾合作。仅依赖摄像头,且未搭载激光雷达和高精地图。
之后几年,自动驾驶领域大事不断,但智驾公司的商业化战绩并不突出。商汤绝影也埋头前行,与母公司商汤科技业务上协同推进。
现在,商汤科技在上海临港建立的AI智算中心,云端算力已从700P增至25000P,商汤绝影则基于丰沛的算力,2022年底,推出感知决策一体化的自动驾驶端到端通用模型UniAD。
OpenAI带火ChatGPT后,商汤科技推出流式多模态“日日新5o”,商汤绝影基于此推出一系列智能座舱人交互方案。
近两年,商汤绝影才进入量产期,与超30家国内外车企达成合作,覆盖100余款车型。
其中,智驾方案分别在广汽、合众、一汽等共6款车型量产上车。
智能座舱大模型产品,主要在小米SU7、吉利翼真L380、蔚来乐道L60上搭载,累计交付40多款车型,量产规模约120万辆。
王晓刚预计,今年底量产交付将突破350万辆。商汤绝影团队约1000人规模,智驾是重心。
但在高阶智驾一战中,时下热门的端到端赋能方案,商汤绝影量产略慢。规划中,基于端到端的智驾方案,明年四季度量产。这比华为等头部大概晚一年。
于是就在11月27日,商汤绝影带来全新一代产品。“2024绝影实力AI DAY”上,王晓刚一口气发布三款产品:
一段式端到端智驾UniAD量产解决方案、“开悟”世界模型、以及面向车端的情感AI引擎——"A New Member For U",中文名为“你的家庭成员”。
在华为、Momenta等各路合围下,商汤绝影能顺利杀出吗?听惯了端到端,商汤绝影会有什么不同?世界模型能否为下阶段的自动驾驶带来新气象?
近日,《出行百人会/AutocarMax》专访商汤绝影王晓刚,谈及对技术、量产、合作模式的见解。
智驾敢开白盒
提及量产,表达一直内敛的王晓刚,用了“战斗”一词。
“中低阶,我们要快速结束战斗。现在,中低阶智驾方案的市场在迅速增长,我们要能够抓住时间窗口,有较好的市场份额。”
王晓刚说,之后商汤绝影会将重心放在端到端量产。
“过去两年,绝影经历了一个痛苦的过程,因为第一批量产项目交付过程中,工程化能力是不足的,缺少量产意识、交付意识。”王晓刚不避讳问题,直言基于地平线J5芯片的方案最终未能量产。
他解释,这和主机厂规划有关,基于地平线J5研发时,可以先熟悉计算平台、工具链,某种意义上是为J6做准备。
这一过程,让商汤绝影推动了组织架构的调整,接下来将面向量产交付,更加聚焦。与此同时,还积累了车企的信任,不止有上面提到的广汽、合众、一汽三家,还有后面的大客户——奇瑞大卓、东风。
今年10月,奇瑞尹同跃喊出“智能化不客气了”,同日,奇瑞旗下大卓智能与商汤绝影达成战略合作。
商汤绝影与大卓的合作,正是缘起地平线的新一代芯片平台J6。彼时,基于J6,大卓的感知团队与商汤绝影均在进行研发,双方接触后,看到各自资源和能力上的短板,决定合作。
来自技术、体系、文化等维度的挑战,是大多AI公司要面临的挑战。曾有智驾高管直言,跟着项目驻场开发时,由于工程化问题,挨骂是常态。
与大卓合作,王晓刚基本上每周会去一趟芜湖,到了先试车,再和客户开会。
王晓刚说,“自动驾驶对质量的要求非常高,量产交付后,车企会做压力测试,偶尔出现一个BUG,我们就要全力找原因,反复做各种测试,没日没夜。”
与主机厂合作,中后期重点在于体验。商汤绝影建立了体验群,各条线研发负责人都会亲身上车体验,看实车表现究竟如何,而不单是解决数据集的问题,或看看性能曲线。
王晓刚准备迅速结束中低阶的战斗,他认为,“中低阶方案,接下来半年左右是关键窗口期。”由于中低阶方案对体验的要求已经明确,商汤绝影将基于地平线J6平台,降低成本,形成快速复制的能力。
双方的合作模式也颇为大胆,许多智驾公司将算法视为至宝,商汤绝影却敢于白盒交付。
“大卓类似广汽研究院的角色。我们帮奇瑞建立自有的智驾能力,会交付白盒方案。”一位商汤绝影人士向《出行百人会/AutocarMax》透露。
白盒交付,相当于算法团队直接供车企调用。智驾公司通常担心团队被挖,核心算法被车企学去。据了解,一些如卓驭级别的头部智驾供应商,甚至因拒绝车企的白盒交付需求,错失大客户定点。
但上述商汤绝影人士认为,“开白盒,可以让车企感到供应链可控,不担心被卡脖子。相当于教给了车企方法,车企掌握后,可以基于方案开发一些定制化的功能。”
商汤绝影不担心白盒交付的风险。
“敢于交付白盒的核心原因是,双方合作基于算力。我们可以向车企提供全栈算法,最终目的是建立数据闭环体系,把云端算力用起来,模型的能力就会越来越强。”上述商汤绝影人士称。
与擅长算法的自动驾驶公司相比,商汤绝影长于算力,母公司商汤拥有20000P算力,也就是20E FLOPS。虽然商汤的算力并非专为汽车而设,但资源充足。
王晓刚说,“将来AI公司跟主机厂合作,是一个趋势,不再是标准化黑盒的交付,更多的是研发体系对齐、共创共建的过程。”
如今,商汤绝影和大卓的合作也跳出具体项目,扩展至中低阶、高阶、端到端方案等多维度。
绝影实力AI Day上,王晓刚公布高阶智驾量产节点,全场景高阶智驾方案将在2025年Q2量产;基于UniAD的端到端方案于2025年Q4量产。
全场景高阶智驾,包含两种方案:
AD Pro,基于地平线J6 E(80 TOPS),搭载7VnR,最高可实现城市记忆行车;
以及AD Max,基于地平线J6 M(128 TOPS),搭载11VnR,最高实现城区领航。
此外,基于UniAD的端到端方案,又被称为AD Ultra,将基于NVIDIA Orin/Thor(200+TOPS),搭载11VnR,最高实现端到端城区领航。
上述产品和节点,基本上可以理解为给大卓的量产定制方案,以及量产承诺。
若能按时推进,奇瑞百万级新车的大门将为其打开。更重要的是,商汤的云端基础设施,将有用武之地,赶赴端到端、大模型的下一站。
量产端到端,商汤绝影的硬仗
抛开蔚小理等全栈自研派,自动驾驶生态圈如今呈现一种格局:车企掌握数据,智驾供应商掌握算法、算力。
这就意味着,算法能力,车企难以短时间具备。算力,由于投入巨大,车企也会谨慎投入。
所以,双方彼此需要合作。
如前文所说,商汤绝影愿意白盒交付。更深远的意义,是为与车企建立背靠背信任关系,获取数据,从而基于自身算力等基础设施,完善自动驾驶大模型,比如绝影实力AI Day上发布的「开悟」世界模型。
世界模型,图灵奖得主杨立昆是最早提出这一概念的专家之一,后被特斯拉、毫末智行、蔚小理、华为等引用。
当下,车企、自动驾驶公司推出的端到端,远非终点,业内研发人士习惯称其为端到端1.0时代。下一代演进方向,指向更好地理解物理世界。
商汤绝影的“开悟”世界模型,文艺点的说法是,在云端为端到端智驾再造时空,给机器呈现一个“赛博世界”。可以用于端到端模型的训练,也可以满足仿真需求。
王晓刚解释,“端到端类似人的小脑,接到信号以后,自然反射做出驾驶行为。多模态大模型类似人的大脑,能够做出分析。今天的量产数据是不够的,可以依靠世界模型去生成各种视频,比如特定的Corner Case,做好模拟数据的仿真。”
据悉,“开悟”世界模型,可生成150秒时长的Clips级数据,以及1024类场景。这将用于仿真、泛化,对理解真实世界,以及理解车辆运动规律和交通规则发挥重要作用。
对于主流的11V方案,“开悟”世界模型则做到了视角时空对齐,以及克服鱼眼视角畸变、可灵活满足行泊场景需求。
于世界模型,各家用法类似,就看能否顺利落地,以及愿意买单。
“随着高阶自动驾驶和无人驾驶的到来,智能辅助驾驶技术不可能以单一软件功能的方式售卖,智驾会带来高昂的数据费用,在大模型领域里面甚至很难有Tier 1。”何小鹏认为。
他提到,“原来的⾃动驾驶,可以⽤Tier1和整⻋⼚合作的方式进⾏PK。但是,在从⼩脑到⼤脑到整⻋,全部躯体都可以⽤AI驱动的情况下,Tier1不可能全域AI都做。所以,Tier1在未来的3-4年会迅速有变化。”
王晓刚承认,一体化趋势对Tier1和主机厂原有的合作模式提出挑战。
“严格来说,商汤并不是传统意义上的Tier1。系统分成各个模块,不同供应商完成其中一块,Tier1负责最终的系统集成和兜底。AI大模型出现后,各模块之间的边界逐渐模糊,甚至消失。自动驾驶大模型,需要将各个模块都串起来,需要Tier1有更强的AI能力。”
同时,他也提出反问,主机厂是否要把所有的事儿都做了?
“既然所有的东西都是在一起的,是不是主机厂要做所有的事情?从算法、软件一直到芯片,什么都自己做完。我觉得也不是。这样的话,主机厂负担就会变得非常的重,因为投入还是非常大的。”
不是所有车企都有全栈自研的决心和能力,但也有车企已经开启自研之路。在正确答案尘埃落定前,商汤绝影等智驾供应商们要尽快完成自证。
结语
最近,王晓刚被问到平时有什么爱好,他直言,“爱好比较少了。这几年在业务上投入的精力非常多,跟以前当老师时就非常不一样。”
量产关键期,带队打仗压缩了个人生活空间,应该是常态。
本田、一汽等项目之后,奇瑞的大卓等将是商汤绝影的新试卷,成了就是样板,能带来更多客户,留在牌桌。王晓刚也知道,越往后竞争会更激烈,时间稀缺。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有