从激光雷达路线转型到视觉路线,感知能力反而大幅提升,小鹏视觉智驾进化的秘诀就在于云端大模型和LOFIC架构的落地。而随着造车成本的下降,性价比优势显然会推动更多的主机厂跟随加入,视觉智能有没有可能超越雷视融合方案成为市场主流,小鹏P7+的市场表现十分关键。
文丨智驾网 金山、李木鱼
编辑 | 浪浪山与明知山
尽管路上配备激光雷达的车辆越来越多,但加入视觉感知路线的玩家阵营正在更具规模化。
今年夏天何小鹏在美国体验了一轮特斯拉的FSD之后,宣布将小鹏的雷视融合智驾方案全面切换到视觉感知路线。
所谓全面,即是未来小鹏新推出的车型都不再配备激光雷达。
这与部分品牌将视觉智驾做为智驾的低配方案完全不同。
01.
视觉智驾的阵营正空前强大
做为小鹏未来十年的开山之作,小鹏P7+成为小鹏AI鹰眼视觉方案落地的首款车型。
小鹏汽车成为继特斯拉、极越之后,第三个高调宣布仅采用视觉感知智驾的智能汽车品牌。
而在此之前,蔚来乐道品牌的首款车型L60,以及智界S7、新问界M5、深蓝S07都推出了基于华为乾崑ADS SE系统的视觉感知智驾系统。
而在供应商层面,华为乾崑、百度阿波罗、大疆车载、商汤绝影、智驾科技MAXIEYE、Nullmax都是视觉感知智驾技术的供应商。
而在10月11日特斯拉发布的无人驾驶出租车Cybercab也是一款“不需要激光雷达做感知冗余”的L4级无人驾驶车辆。
尽管多家智驾科技公司曾向智驾网表示,视觉感知就是无人驾驶的终极解决方案,但激光雷达做为感知冗余配置在L4、L5级无人驾驶车辆上的配置还是不可取代的,但马斯克对于Robotaxi上能过视觉方案实现完全自动驾驶的路线非常有信心:“使用AI和计算视觉,不需要昂贵的设备,就可以在无监督的情况下实现FSD。”
这无疑进一步提振了视觉感知派的信心。
那么视觉感知路线真的能实现其所宣称的能力吗?鉴于特斯拉的FSD尚没有明确的入华时间表,国内能验证视觉智驾天花板的就是小鹏P7+。
当下无论是乐道L60还是鸿蒙智行系的智界S7、新问界M7在城市高阶智驾方面宣称的皆是快速路NOA,小鹏P7+则是直接面向城市所有场景的NOA。
日前智驾网在广州市区,特别是在夜间场景体验了小鹏P7+,这款车在掉头、无保护左转、紧急避让逆行车辆、临时变道等场景表现出极强的超越人类驾驶员的能力。
在夜间模式下,小鹏P7+对目标物的识别,道路状况的分析做到了与白天几无差别的自动行驶。
广州做为小鹏汽车的大本营,可以想象小鹏汽车对这座城市的道路信息十分熟悉,但即便如此,这样的惊艳表现依然让人相信,视觉感知智驾的上限对于激光雷达已没有不得已的依赖。
那么小鹏视觉智驾是如何克服传统的摄像头对阴暗、逆光、静态物场景等的应对,实现全场景、随时随地开启的?
综合来看,小鹏的视觉智驾能力是新技术应用的结果。
1、在硬件上保证算力和感知冗余:2颗英伟达Orin-X智驾芯片,算力为508TOPS,摄像头达到了11颗,多于传统的7颗;
2、端到端的云端大模型,依托强大的云端算力,增强了智驾系统对道路场景的理解能力,判断时间更短,更能应对突发状况;
3、新技术架构LOFIC架构大大提升了摄像头的全场景感知能力,让智驾看得更清晰、更准确。
小鹏P7+的技术工程师向智驾网表示,视觉感知路线不仅省掉了激光雷达的成本,在决策效率上也要更快,因为省去了激光雷达感知信息的融合过程。而从人类驾驶的形式来看,也不需要雷达来辅助,所以在技术上只要拥有了足够强大的视觉感知能力,就可以实现高阶智驾,级别甚至可以达到L4级。
在10月24日的小鹏的“1024科技日”,小鹏汽车的智驾团队详细解释了AI鹰眼视觉方案的两大核心技术,云端大模型和LOFIC架构方案。
02.
云端大模型加持,视觉感知能力进化
按照小鹏官方的说法,在采用了云端大模型之后,训练效率已提升了2.6倍,2025年小鹏云端的算力将会达到10EFlops以上。
基于这个表现,小鹏高层判断:自动驾驶的新一轮竞争正在云端展开。
小鹏汽车副总裁、自动驾驶负责人李力耘表示,目前行业有三种主流的端到端发展路线:
一种是通过大量规则小模型堆叠的 “大模型”,其需要大量的优秀规则工程师;
一种是“车端大模型”,即直接将端到端模型部署于车辆上,虽然见效快,但受限于车端算力,且随着后期训练数据量的增加,容易陷入瓶颈;
最后一种便是云端大模型,其参数量是车端模型的几十倍甚至数百倍,这是单纯的车端大模型所不可企及的。
李力耘表示,前两种端到端的技术路线都能带来一定成效,但云端大模型才是制胜关键,小鹏云端大模型的参数量将多达车端参数量的80倍,云端大模型能够全面吸纳智驾数据,不遗漏重点信息细节。通过大参数量的训练,能够尽可能地穷尽智能驾驶中的长尾问题,以覆盖更多驾驶场景,使XNGP实现L3级的智驾体验。
李力耘提到的所谓“长尾问题”,就是指在自动驾驶过程中那些发生概率较低、但种类繁多的特殊场景所带来的潜在风险。
当下,目前自动驾驶的底层架构和大部分技术问题已解决,但剩下的约5%的长尾问题成了关键。
这些问题涵盖各种零碎、极端的情况和难以预测的人类行为,例如:带有凸出货物的卡车、打伞的行人、倒在路中央的树木,以及异形车辆、乱穿马路的行人和自行车、雨雪等极端天气、极暗的行车环境等。
自动驾驶依靠摄像头、激光雷达、毫米波雷达等传感器感知环境并做出决策但这些传感器在某些情况下存在局限。例如:
在恶劣天气中可见光摄像头可能衰减直至失效,
超声波雷达在远距离探测精度较差,
激光雷达在雪天和风沙天易受影响,在对向眩光、阳光及信号干扰、黑夜无灯路段等情况下也会出现不同程度的问题。
导致长尾问题的本质其实是信息不足,解决方法就是从补充信息的角度去处理。
根据官方数据,小鹏云端大模型可极致发挥摄像头高信息量输入,8倍提升有效视觉信息量。相较于激光雷达方案,AI鹰眼视觉方案的摄像头信息量是前者的80倍,而摄像头能够感知的语义和颜色信息是其100倍,摄像头的反应速度也是其3倍。
这些数据表明,在拥有云端大模型加持之后,其视觉感知能力已经远远超越了激光雷达,因此也就不再需要它的辅助。
系统通过视觉感知方案获得了更多的信息量,长尾问题的解决也就更加高效和可靠。
可以说,这正是现阶段视觉感知技术开始呈现超越激光雷达感知能力的基础。
李力耘表示,对于轻雷达、轻地图的智驾方案而言,高算力大模型既是基础也是门槛。
他表示,小鹏的云端大模型是国内首个泛机器人领域的基础大模型,不仅可以应用在自动驾驶领域,机器人、飞行汽车等领域均适用。它让小鹏成为了全球唯二能做到不依赖高精度地图、激光雷达,实现用一套软件适配全车系的车企。
按照官方公布的规划,小鹏P7+及后续车型也因此不再区分Max和Pro版本,全系都能标配AI智驾。
03.
LOFIC架构落地,AI鹰眼视觉方案实力倍增
在谈及由小鹏P7+首发搭载的AI鹰眼视觉方案时,官方特别强调了其采用了行业首个单像素LOFIC架构方案。
这一技术的优势,是在逆光、大光差、暗光等环境下的信息采集能力更强。并且该架构方案的视觉感知范围也更大,达到了1.8个标准足球场,甚至能够清晰分辨颜色、文字等语义信息。
LOFIC技术的全称是“Lateral overflow integrated capacitor”,即横向溢出集成式电容技术,这项技术的诞生是为了满足CMOS图像传感器对高动态范围的需求。
CMOS图像传感器的动态范围越高,视觉感知系统就能“看得更准更清晰”。
CMOS的成像原理主要是通过把光线转换成电荷,进而形成画面,如果我们用一个“桶”来承载单个像素所转换出来的电荷,那这个桶能容纳电荷的多少就决定了这个像素成像的明暗细节程度。如果桶里是空的,那此时的画面就是全黑的,也就是曝光不足;如果桶里的电荷数量多到溢出了桶外,那这时的画面就是一片白色,也就是曝光过度。
在LOFIC技术出现之前,要提高动态范围有许多方式,例如多次曝光或大小像素等。
据小鹏工程师介绍,之前的视觉技术是同步记录两张图像,一个曝光比较亮的,一个曝光比较暗的,之后通过算法将二者进行合成,从而构成完整的感知图像。这样做的缺点,是遇到运动速度比较快的目标物时会有延迟,并且有色彩串扰和产生闪烁等问题。
▲图片来自:3d tof的《HDR技术详细解析》
LOFIC技术的原理,就是对承载电荷的“桶”进行扩容,LOFIC电容用于收集横向溢出的电荷。当电荷数量超过像素CFD原本能承载的最大限度,多余的电荷就不会溢出损失掉,而是会流到相邻的“桶”里。之后通过读取“桶”里的电荷,再结合数字算法技术,就能够获得更高的动态范围,成像也就更加细腻、清晰。
而这也是小鹏宣称LOFIC架构方案信息采集能力更强、感知范围更大,能够清晰分辨语义信息的原因。
04.
视觉智驾的更大优势是降低了造成成本
在有了云端大模型和LOFIC架构加持之后,智驾网在实际路测过程中,真实感受到了AI天玑5.4.0系统的智驾能力。
当然试驾车辆和量产落地车辆的技术表现可能存在一定的变化。
在小鹏汽车发布的数据显示,AI天玑5.4.0系统的“拟人性”提升了4倍,变道成功率提升了53%,绕行成功率提升了155%。
但我们的真实感受是,这一系统与当下众多采用雷视融合方案的城市高阶智驾相比没有短板,甚至超过不少一线阵营的体验。
而这一系统的另一优势,在于大大降低了造车成本,让小鹏汽车在市场上更有性价比优势。
这让何小鹏敢于在这款车上全系标配这一功能,而不再区分所谓的Pro、Max等版本。
据了解,小鹏P7+是小鹏汽车首款实现技术成本降低25%目标的车型,预计其利润率将达到两位数。而此前何小鹏曾透露:“投资人希望这款车的毛利率到20%。”
而随着造车成本的下降,其强大的性价比优势显然会推动更多的主机厂跟随加入,视觉智驾有没有可能超越雷视融合方案成为市场主流,小鹏P7+的市场表现十分关键。
【关注智能驾驶,关注智驾视频号】
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有