文丨李安琪
编辑丨李勤
从美国试驾完特斯拉FSD回来,小鹏智能驾驶负责人李力耘有两大感受。其一是,特斯拉FSD在北美地区的确是独一档,但他也意识到,需要对特斯拉祛魅。
“中美路况非常不一样,我们更懂中国路况,更懂国人的驾驶习惯,特斯拉可能更懂美国人的驾驶习惯,很难说谁更强。”李力耘说。
角逐和较量在智驾圈里已经不新鲜。过去一年里,小鹏等车企迅速卷入了“全国都能开”“端到端”的智能驾驶竞争。
在今年12月末,小鹏还计划交付“车位到车位”智驾驾驶功能,技术模型也升级为“一段式端到端”,可实现全场景覆盖,包括园区低速行驶,未来会覆盖泊车、高速场景,甚至海外智驾。
“车位到车位”是当下车企智能驾驶竞争的技术高地。如字面含义,车企希望用户在车位就能启动智驾,车辆低速巡航、自主过闸机、上高速,在城市道路通行,最后泊入目的车位。
12月初,特斯拉向部分测试用户推送的特斯拉FSD v13.2更新版本,就包含了从停车状态启动的FSD,也就是“车位到车位”功能。前不久理想汽车也宣布突出该功能,华为和小米汽车的类似功能,同样即将推出。
智能驾驶走向自动驾驶的过程不是一蹴而就,而是车企们通过技术攻坚,不断完成高速、城区、泊车、园区等场景拼图。如今,这一步即将完成。
李力耘也表示,现在小鹏处于“无人化(驾驶)前夜”,明年在能力上会有更大突破,“可能先在Max车型上,小鹏智驾逐步提供类似无人驾驶的能力。”
这几乎是最早给出无人驾驶节点的国内车企。
小鹏的确是国内最早贴上“智驾”标签的车企之一。2019年,小鹏就在轿跑车型P7上开发了高速NGP功能,对标特斯拉NOA。
但因为起步早,小鹏几乎走过所有技术路线,从依赖高精地图,转向无图方案,随后进化到端到端。2023年8月,小鹏智驾还经历了灵魂人物吴新宙离职、团队动荡等。小鹏智驾由此进入守城阶段。
同一时期,行业有玩家迅速进入了高阶智驾量产状态。比如压强式投入的华为,率先推出了“全国都能开”智驾功能;理想汽车则由于轻包袱,果断切入“端到端”技术,甚至直接更换到激进的“一段式端到端”方案。
从今年中以来,小鹏智驾试图回归与反击。
近日,小鹏智驾负责人李力耘接受了36氪的采访,他分享了小鹏如何将AI融入智驾,以及标配纯视觉智驾后,如何实现科技平权与商业闭环。
李力耘告诉36氪,小鹏对于端到端的研发始于2023年4月,当时主要是想用AI的认路能力,摆脱对高精地图的依赖。
结果小鹏发现,“一段式端到端”大模型上线之后,原来需要花很长时间打磨的场景,如特殊分流、右转或掉头等问题,很快就被解决了。
今年5月,小鹏正式推出“端到端”智驾大模型,包含神经网络XNet、规控大模型XPlanner、大语言模型XBrain三大部分。
端到端智驾依赖的核心资源之一就是数据,小鹏宣称,其端到端大模型训练数据量已经达到2000万clips。理想汽车也公开过其端到端的训练数据,目前大约在800万clips。
对于2000万clips的数据起点,李力耘告诉36氪,这得益于过去基于规则的智驾经验积累,小鹏当前的数据采集和训练效率很高,例如通过车端规则经验实时标注,精准采集训练所需片段,从而针对目标场景进行精准密集训练。
他同时认为,在海量数据、不断提升的云端和车端算力下,自动驾驶的Scaling Law还有很大红利。
Scaling Law是大模型行业的一个定律,通常表示模型参数越大、数据集越大和计算资源增多,模型性能更好。
小鹏推出“端到端”大模型智驾方案的标志性成果,就是更果断摆脱对激光雷达的依赖,将纯视觉作为智驾技术路线。例如在新车P7+上,小鹏就标配了纯视觉智驾AI鹰眼方案。
但在行业中,未来数年的主流选择还是以视觉+激光雷达作为主要传感器。对此,李力耘向36氪汽车表示,走纯视觉路线其实是出于第一性原理。
在他看来,人们生活的交通环境,包括路牌、路标、红绿灯,整个道路甚至车的造型都是为人设计的,“人最重要的传感器是眼睛,所以纯视觉一定是最直接、最高效的解决方案。”
小鹏也宣称,其基于AI鹰眼的纯视觉方案,能做到比人眼视觉更好的效果,可以很好应对大光差、逆光场景。
在纯视觉智驾之路上,小鹏汽车决定走到底,李力耘告诉36氪,从P7+车型开始,不再有Max和Pro的版本区分,而是“全系标配Max,也就是小鹏 AI 图灵智驾(NGP),都会用纯视觉方案。”
这背后蕴含着一套清晰的智驾商业化策略,“我们会用一段式端到端放大我们的车型优势,不仅标配所有车型,更希望覆盖所有功能,实现点到点,包括赋能海外的智驾。”纯视觉智驾方案,无疑在成本上拥有先天优势。
实际上,凭借在同级车型中做出“智能差异化”的赛马策略,小鹏已经在两款新车 MONA M03和P7+上,尝到了甜头。
M03自9月上市以来连续3个月销量破万,P7+上市3小时也获得了超3万大定。这两款车的售价都在20万元以下,这个价格带是比亚迪等老牌车企的优势领域。
“智驾是小鹏P7+用户购车的 top 理由。”李力耘说,当下热销款M03的泊车体验也与Max版智驾同级。
智能驾驶技术在车企的商业体系里已经越嵌越深,同时,也在承接整个AI技术的发展红利,快速迭代。这是资源和效率交织的产物。
李力耘说,如果把端到端的技术趋势看作智能驾驶驾领域的一场“工业革命”,能真正实现转型升级的企业其实是少数,大部分人还是会面临更残酷的竞争。
因为,端到端不是让事情变得更简单,而是让整个迭代链条变得更长,更加不可控,某种程度上需要投入更多的资源,包括更大算力,更加精英的AI研究人员。
“我更愿意相信是车企,而不是供应商,能够率先从辅助驾驶突破到无人驾驶。”
以下是36氪汽车与小鹏智驾负责人李力耘的对话,内容略经编辑:
「谈体验:“车位到车位”之争,用户会为更好的体验买单」
36氪汽车:听说你刚从美国回来,有体验特斯拉的FSD v13吗?
李力耘:但很遗憾,因为v13还没有量产推给用户,我没机会试FSD v13,但开了一个星期v12.5。有两点可以总结,第一是祛魅,第二特斯拉在北美是独一档的存在,很多值得学习的地方,包括停车场激活、开进停车场,这些是用户非常喜欢的功能。
去魅的话,我觉得中美路况非常不一样,无论是我们XNGP 5.4.0还是即将发布的5.5.0 版本,智驾都和特斯拉不相伯仲。我们更懂中国路况,更懂国人的驾驶习惯,特斯拉可能更懂美国人的驾驶习惯,很难说谁更强,我非常期待FSD进入中国之后的表现。
36氪汽车:行业会说特斯拉技术领先国内半年到一年,您觉得这种技术领先现在还有多少?
李力耘:从技术方法论上,小鹏和特斯拉、OpenAI 这样的全球AI企业不谋而合,我们强调云端大模型,参数量是车端80倍以上。我们云端大模型的训练数据量达到2000 万以上clips。每个clips可以理解成大约一分钟的小电影。每个模型都基于大量数据、在云端训练。我们有个说法叫“云上一天,地上三五年”。
我们希望把云端能力通过蒸馏下放到不同芯片平台,甚至未来换芯片后也能把云端模型下放。
36氪汽车:您觉得特斯拉FSD v13上的“车位到车位”跟国内的“车位到车位”有区别吗?
李力耘:我们即将推给用户的XOS 5.5.0版本上,用“一段式端到端”给用户提供了一个完整的“车位到车位”体验。其实在停车场和地库,2021 年我们就推出了VPA(记忆泊车)功能,但用户体验并不好,用户渗透率没有城区智驾那么高。
所以,我们用“一段式端到端”实现所有车型标配后,现在去实现全场景覆盖,包括“车位到车位”低速行驶、园区行驶,未来还会覆盖泊车、高速,甚至海外智驾。我们希望给用户带来更加连贯、丝滑的体验,而不是有割裂感、类似于VPA+NOA的组合体验。
36氪汽车:用户第一次开到新的地库,需要先记忆一遍才能实现点到点吗?
李力耘:第一次肯定没有地图,很难,如果有园区内导航指引会好一些。就像你第一次去一个地库,也需要一些指引或者借助他人的记忆,我们可以做到无感学习和记忆。第二次去就可以有丝滑的“车位到车位”能力。
36氪汽车:小鹏之前也有记忆行车,比如记忆10条路线,这跟“车位到车位”的本质区别是什么?
李力耘:最大区别还是体验层面。小鹏智驾在2024年最大的两个变化,第一是 AI化,面向AI进行组织变革,进行AI能力提升,另一个变化是,我们觉得用户不会为更好的科技买单,但一定会为更好的体验买单。
用端到端大模型赋能“车位到车位”后,用户体验会大大提升,虽然有时候可能需要学习、参考先验信息,但学习感会很弱。
「谈AI:智驾Scaling Law还没到尽头」
36氪汽车:今年智驾行业变化很大,年初卷“全国都能开”,后来变成端到端,现在是“车位到车位”,您怎么看这种竞争?明年的竞争重点是什么?
李力耘:原来小鹏智驾是孤勇者,现在是百舸争流,明年的竞争一定会更加激烈和有趣。
今年从“全国能开”逐步走向端到端,比拼的是博弈能力、比拼拟人化。到“车位到车位”之后,我觉得我们处在“无人化的前夜”阶段,小鹏智驾会笃定地走向无人驾驶。
我们希望,明年在能力上有所突破,可能先在Max车型上,小鹏智驾逐步提供类似无人驾驶的能力,接管次数无限降低。随着法规推进,或者新车型推出,我们一定会做出走向无人化的能力。小鹏的最终目标是解放驾驶员的双手、解放精力。
36氪汽车:怎么做到?Scaling Law在智驾领域有效吗?
李力耘:小鹏是Scaling Law的忠实信徒。虽然最近很多AI前沿工作说Scaling Law、预训练遇到了瓶颈。但从算力、数据量来看,我觉得自动驾驶的Scaling Law还有很大红利。
数据方面,互联网优质数据大概600-700T之后就会有瓶颈。但智驾大部分企业今年才逐步转向端到端,自动驾驶大量优质驾驶数据积累还没有到尽头。
另外,无论车端还是云端算力,都会有着更显著的增长,模型参数也会进一步扩大。我觉得自动驾驶的Scaling Law还没有到尽头。
36氪汽车:行业会有些做法,比如将端到端大模型跟视觉语言模型融合,您认同这种观点吗?
李力耘:我不反对。这些观点在以不同的视角来描述端到端,在我看来可能殊途同归。无论是视觉语言大模型,还是视觉动作大模型,本质是通过大量数据输入,有一定推理能力,很好地实现类人驾驶的模型。
小鹏以视觉为主,我们实现了“光子进、控制出”。当然,从多模态输入角度来看,视觉只是一个传感器,本身还有各种车道、GPS或者是各种各样多模态输入。
网上的海量数据会让模型有更强的认知能力,识字认路。但是我们认为,拥有高质量的、丰富驾驶数据可以更好解决车辆驾驶的小脑问题,这跟大模型不冲突。
很多驾驶是相对本能的动作,就像人类的小脑,当然也需要大脑的能力。所以在我们的一段式端到端大模型中,Xbrian可以认路识字,做一些简单推理,但更多时候还是对加减速控制、变道时机选择,或者绕行处理,更偏本能的小脑行为。
我们是既希望有聪明的大脑,能够推理思考,还是一个比较灵敏的、肌肉记忆很好的老司机。
36氪汽车:小鹏是从什么时候开始做端到端大模型?
李力耘:2023年4月份,我们开始布局整个“端到端”技术栈。那时候我们希望用端到端来解决对高精地图的依赖问题,做到全国都能开,所以当时智驾AI化,更注重识路、找路。2023年底,我们意识到需要把端到端的能力进一步扩大,做成一段式端到端。
36氪汽车:2023年4月您和团队当时是怎样的状态?
李力耘:当时主要在开城,状态很难,因为把高精地图的拐杖扔掉之后,尝试用实时算法去认全国各种各样的路况,并且让车能够配合好行驶,是非常困难的。唯一能够彻底解决这件事就是靠AI,用类人的方法把路认好、把路选好,让车开好。
36氪汽车:那时候就定下了整个端到端、AI模型的框架吗?
李力耘:方向是笃定的,但我觉得技术变化会非常快。今年以来,我们也看到了类似于Sora、ChatGPT非常强的AI能力涌现。我们也升级了AI的战略,包括对云端模型Scaling Law的认知,紧跟AI最前沿,然后应用在自动驾驶领域。
36氪汽车:小鹏智驾起步非常早,经历了很多个版本,在端到端进化这条路上你们甩掉了哪些包袱?
李力耘:端到端模型的建立是个非常缓慢的过程。系统工作方式从原来多技术模块变成AI中台。我们会着重建设数据采集能力、数据清洗,模型快速训练、部署、调试,确保模型高效解决问题。
规则还是很重要的兜底能力,一方面是为安全兜底,第二,原来规则积累的工程基础,可以让我们把整个数据闭环、飞轮非常高效地建立起来。
36氪汽车:从2023年到现在,如果要选取比较重大的转折点,您觉得会是什么时刻?
李力耘:重大转折是今年四五月,小鹏一段式端到端大模型上线之后,我们发现,原来需要花很长时间打磨的一些问题,比如花几个月去打磨一些特殊的分流、右转或者是掉头等场景,解决得特别快,我们很惊讶。
原来的方案是小模块AI驱动,然后做路径规划、速度规划,整个链条非常长,遇到的问题很多。但我们用了AI能力后,环岛掉头、小路、很难的右转场景都有很大的能力提升,效率比原来高很多。
36氪汽车:华为没有把纯视觉当成主流方案,小鹏为什么会这么坚决地要做纯视觉?
李力耘:其实就是第一性原理。我们生活的交通环境,包括路牌、路标、红绿灯,整个道路甚至车的造型都是为人来设计的,人最重要的传感器是眼睛,所以纯视觉一定是最直接、最高效的解决方案。特斯拉也分享过观点,认为激光雷达+纯视觉1+1并不大于或等于2,而是小于2。
小鹏的AI鹰眼视觉做到了比人的视觉更好的效果。在很多大光差、逆光的情况下会比人眼有更好的识别效果,这也是我们LOFIC架构的特点。当然我们也没有放弃主动的传感器,也会通过多模态跟毫米波雷达,超声波雷达去做融合。
36氪汽车:在高速道路上或者一些特殊天气,激光雷达还是有很好感知效果,小鹏纯视觉有没有解决这种特殊天气场景下的方案?
李力耘:我恰恰觉得,这些情况下,第一性原理是更好的。再好的激光雷达在远处的点云也是比较稀疏的。激光雷达不是完美的,在一些雨水天气情况下它也有问题。小鹏AI 鹰眼视觉是通过更大算力,看得更清楚、更远、反应更快,车辆反应速度提升了百分之四十几,对场景做出很好的响应。
36氪汽车:后续像在 X9 这些车型上,还是会保留激光雷达和纯视觉两种不同的方案吗?
李力耘:我们会全系标配Max,也就是小鹏 AI 图灵智驾(NGP),都会用纯视觉方案。
36氪汽车:那方案配置方面,还会分Max 、Pro 吗?
李力耘: 我们会标配Max,从P7+开始。
36氪汽车:小鹏自研的智驾芯片,结合你们的软件方案后,可以发挥出什么样的效果?
李力耘:小鹏自研芯片的初衷就是实现软硬件一体,最大效能地发挥软件的威力。但更重要的是在云端模型的赋能下,我们会对芯片做针对性优化,给用户提供最好的体验。
36氪汽车:小鹏智驾下一个转折点会是什么时候?
李力耘:2025年小鹏智驾转折点会在年中,智驾能力会有更大飞跃,可能会从一段式端到端,跨越到全新的 AI 迭代模式。
36氪汽车:智驾行业密集迭代,公司创始人何小鹏怎么保持对智驾前沿的认知?
李力耘:小鹏智驾真正的一号位和灵魂就是何小鹏。因为他笃定AI,笃定智能驾驶到自动驾驶,才有小鹏智驾的自我变革。他非常从用户视角来看智驾,会去开智驾的中间过程版本和量产版本,感受变化,反馈问题。
所以对行业态势的感知一定是多模态的。现在我们特别注重用户反馈的NPS,智驾每个版本都会去做用户调研。当然也会和顶尖AI企业保持紧密接触,包括去美国开车、取经等,兼听则明。
36氪汽车:何小鹏上一次给你反馈智驾问题是什么时候?
李力耘:不久前,我们把XOS 5.5.0 过程版也推给了他,他觉得我们又解决了30%-40%的问题。
36氪汽车:端到端方案依赖海量数据,小鹏达成了2000万clips的训练数据,在这方面小鹏有没有什么心得?
李力耘:得益于两方面,一方面是AI智驾铁军,车端积累多年的规则和严谨算法,很多事情在车端做是事半功倍的。
另一方面,得益于小鹏AI的进展,我们需要大量、高效敏捷地去挖掘数据,训练模型。所以我们既做车端模型、云端模型,也做了非常好的AI工具来挖掘数据。
这背后是组织方式的改变,我们有个AI效能部门,今年年中面向AI成立的新部门,专门训练各种各样的AI提效工具,包括用AI写代码、检查代码、自动挖掘数据。
36氪汽车:小鹏智驾2000万clips的数据是如何达成的?
李力耘:我们大约在2022年底,就开始预研如何引入AI大模型,已经有了几年的积累。而且我们地把规则时代积累的经验移植到当前的数据采集和训练里,例如通过车端规则经验实时标注,精准采集训练所需片段,从而针对目标场景进行精准密集训练,能够大幅地提升采集和训练效率。
「谈竞争:智驾工业革命,转型成功的是少数」
36氪汽车:友商通过端到端快速实现了高阶智驾量产。端到端会是行业其他人弯道超车的方案吗?
李力耘:如果把端到端技术趋势看作智驾领域的一场“工业革命”,每一次工业革命中,真正实现转型升级是少数,大部分人还是面临更残酷的竞争。
端到端不是让事情变得更简单了,组织架构的确跟原来不一样,原来每个技术模块都要基于规则的工程师,比如定感知、定位、规划、融合、地图、控制,现在就变成了数据闭环的问题。
数据采集、模型训练、模型部署,模型调试,它让整个迭代链条变得更长,更加不可控,某种程度上需要投入更多的资源,包括更大算力,更加精英的AI的研究人员。
36氪汽车:智驾供应商跟传统车企如果保持比较深度的绑定,能继续参与这场游戏吗?
李力耘:第一,智驾真正从辅助驾驶走到无人驾驶一定是满足第一性原理的。我更愿意相信是主机厂,而不是供应商,能够率先从辅助驾驶突破到无人驾驶。
第二,主机厂在软硬件方面的配合、数据和中后台的配合,可能是事半功倍;对非主机厂而言,可能更不容易,数据背后的闭环是更隐形的挑战。
36氪汽车:小鹏智驾成为标配,要从哪些角度去评估智驾技术的商业价值?会有指标吗?
李力耘:现在智驾就像当年的手机行业,我们一定要把智驾价格打下来,未来的车型都会标配高阶智驾。其实,智驾是小鹏P7+用户购车的 top 理由。我们不会用智驾能力再做二次收费。
在小鹏X9 上,73%的车主都选择了Max车型。我们也会持续关注用户对智驾的反馈,比如他们喜欢的一些亮点或者不喜欢的槽点;在标配智驾后,我们会看用户的渗透率,比如在能开智驾的地方,用户是不是都开。
36氪汽车:市场上会有观点说,小鹏现在车卖得好不是靠智驾,比如MONA M03。您会反驳这种观点吗?
李力耘:在MONA M03,智驾也起到了很重要的作用。同样价位上,小鹏MONA M03 的智驾仍然领先,比如MONA M03率先推出断头路泊车,体验上和主销车型Max版泊车能力一样。春节之后,MONA M03的 Max版本也会上AI鹰眼视觉方案,实现高阶智驾的普惠跟平权。
36氪汽车:CEO何小鹏对明年的智驾提出了哪些考核和要求?
李力耘:我们希望2025年,在拟人感、安全感、舒适和效率上,做到更不一样的台阶和层次,与行业明显拉开代际差距。
更重要的是,我们会用一段式端到端放大我们的车型优势,不仅标配所有车型,更希望覆盖所有功能,实现点到点,包括赋能海外的智驾。
36氪汽车:海外市场智驾会是你们明年发力的重点吗?
李力耘:对,小鹏非常坚定国际化,未来10年海外销量要占全部销量一半。2024年小鹏的出海非常不错,但我觉得智驾还可以更好。明年,小鹏会根据海外当地的驾驶习惯和法规,把智驾体验按照当地用户喜欢的方向去做,提供给当地用户。
36氪汽车:除小鹏本身之外,智驾团队还要支持别的项目吗,比如参与大众的项目?
李力耘:我们一直跟大众配合很好,无论是在车型上,还是电子电气架构上,或者智驾上,双方都是紧密合作。智驾会有专门的虚拟团队和项目组去跟进,和大众合作的车型会很快和大家见面。
36氪汽车:在大众项目之后,小鹏的智驾还会有单独商业化的可能吗?
李力耘:小鹏是非常笃定地把辅助驾驶推向极致,走向无人驾驶的。在AI辅助驾驶的理念下,我们会更看重像AI鹰眼视觉带来的智能驾驶体验平权。至于真正的商业化,可以关注小鹏在2026年无人驾驶的进展。
36氪汽车:你们会对 L3 有更多探索吗?还是会直接进入到L4?哪个更快?
李力耘:我们一定会推进 L3 和 L4。哪个更快,这个取决于法规进展,我们一定紧跟着法规进展。在明年的Q1、Q2某个时候,随着我们体验和能力更进一步的提升,大家会看到更多可能。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有