2022年4月,特斯拉公司首席执行官埃隆·马斯克宣布,预计到2024年将实现无方向盘和踏板的新型“Robotaxi”的量产。
这表明以特斯拉为代表的自动驾驶“渐进式”发展路径,率先看到了无人驾驶大规模量产的曙光。
自动驾驶领域“渐进式”路径为什么能够被更多机构看好?“渐进式”技术的发展路径是什么?自动驾驶量产的难点在哪里?而距离我们的生活又还有多远?
关于自动驾驶“渐进式”路径的发展与实现,易航智能CEO陈禹行在「量子位·视点」直播中分享了他的从业经验和观点。
以下根据分享内容进行整理:
自动驾驶领域是目前各个方面都关注度很高的行业。我今天的主题是“渐进式”路径迎来无人驾驶量产的曙光。
2022年4月特斯拉宣布预计到2024年将取消方向盘和脚踏板,虽然说的还有点过于激进,但是也侧面看出了渐进式路径率先迎来了无人驾驶大规模量产的曙光。
易航智能一直沿着渐进式的发展路径,也是国内最早拿到量产订单的自动驾驶创业公司。
今天我希望与大家分享以下几个问题:第一,以场景为核心的渐进式路径做对了什么?第二,抛开自动驾驶分级,渐进式路径的技术路线图是什么样的?第三,为什么我们看到很多酷炫的自动驾驶Demo迟迟无法量产?第四,自动驾驶的量产需要哪些关键技术?
首先我们来看一下渐进式路径的核心价值到底是什么。
说到渐进式发展,大家第一反应往往是自动驾驶分级,就是L0到L5安全性分级,但是当我们以自动驾驶的分级为核心来界定自动驾驶技术的时候,就会面临一个问题:虽然安全性比较严格,但是场景极为有限,就像有的做到L3、L4级别的车型,在高速公路上仅有小部分路段可以开启相关功能,需要车辆时速不超过60公里每小时,而且必须要能看到隔离带最内侧的护栏,然后也得在最内侧的车道行驶。
这种所谓的高级别自动驾驶,用户的感知不强,启用的时间也不多,最终的结果就是它的价值是非常有限的。
所以这几年来越来越多的企业开始围绕场景来做自动驾驶,通过打开场景来创造更多的价值。我们以上下班通勤为例,整个车程可能要两个小时,路上我们有可能途经一个环境极为复杂的菜市场,这个菜市场我们可能只需要5分钟就能通过,但是菜市场的场景非常复杂,比如说地上有很多垃圾,里边的人非常多,还有运货的三轮车等等。
面对这种情况,做场景的思路就是,我们先解决95%的时间,就是我们在没有经过菜市场的时候能实现自动驾驶;那么剩下这5%路过菜市场的时间我们给它当成Corner Case,这种Corner Case就由人来监控,后续通过升级迭代,我们逐步解决这些非常复杂的场景里面的自动驾驶。这样的方案在分级上并不是L4,但是它能在更广泛的时空里边切切实实地给终端用户创造价值。
我们认为一项创新技术的普及核心是要创造价值,自动驾驶也是只有打开更多的场景才能创造更多的价值。
讲到这里大家可能会问我们:抛开分级,谈自动驾驶的渐进的路线,这样的渐进式路线有没有非常清晰的发展路径?
这张图就是以场景为核心的渐进式自动驾驶技术发展的趋势图,我们觉得自动驾驶的发展大体是一个这样的过程:首先是ADAS,主要是在一条车道上提供一些碎片化的辅助驾驶的功能,这是一个比较早期的阶段;之后我们就到达了NOA(领航辅助驾驶)的阶段,NOA就是实现了在典型场景下面点对点的这种自动驾驶能力,它也是真正意义上的 “人机共驾”;再往后上升一个台阶之后,我们就到了FSD(全场景)的自动驾驶功能,当FSD成熟之后,我们觉得行业就会迎来一个拐点——因为所有跟自动驾驶相关的功能已经基本都开发出来了,它已经能够覆盖日常生活绝大部分的场景,已经可以创造出巨大的使用价值。
它只剩下一些非常少的、非常复杂场景下的Corner Case还不能应对,未来我们要着力解决的就是剩下的这些Corner Case,这也会是自动驾驶之后发展比较稳定、比较漫长的阶段。
就像手机从塞班,然后Windows过渡到安卓和苹果以后,手机的硬件形态和软件形态也已经固定了,手机目前只是性能上会有所提升,但是手机这种形态已经比较固定了,现在我们用的智能机和10年前用的智能机可能已经没有什么本质的区别了,而只是摄像头像素更高,芯片算力更大。
下面我就展开讲一讲这三个发展阶段,让大家了解渐进式路径的场景是如何一步一步地打开的。
那么先来看一下ADAS,ADAS实际上是行业的过渡阶段,它由传统的汽车电子过渡到自动驾驶,所以它是汽车电子和自动驾驶技术交叉的一个产品。传统的汽车电子架构上,是以分离式为主,比如说一个智能摄像头,再加上一些毫米波的雷达,里面可能是分别做一些算法上的处理,但很难进行数据的整合和融合。
所以在做ADAS的时候,汽车电子以功能实现为研发核心,做一些相对来讲比较简单的辅助驾驶功能。这样做出来的功能,驾驶体验往往会觉得比较僵硬顿挫。
比如说制动功能的汽车电子方案,它可能比较重视刹停的效果和结果,至于驾驶者的感受可能考虑的并不是很多,而自动驾驶的方案会更重视驾驶员的感受。同时,自动驾驶的架构上也采用了专门的自动驾驶域的形式,在自动驾驶域上就会把所有的传感器的数据统一处理,比如来自画面、来自雷达等等,这些所有的数据融合在一起,然后统一地处理,最后再进行决策规划控制的开发。
而且自动驾驶方案也会通过引入像我们所说的驾驶员模型,来尽量模拟人类的驾驶行为。这样实现的功能,它的理念就和人的预期是非常一样的,那么人在这个跟他自己的预期一样的自动驾驶车里乘坐的时候,他就会感受到非常的舒适和安全,这样就优化了自动驾驶体验。
过了ADAS的阶段之后,就来到了NOA行泊一体的阶段,我们说NOA行泊一体的方案是自动驾驶量产的一个新阶段。
因为在这个功能的基础上, NOA开启了一个人机共驾的时代,这也是迈向自动驾驶终局的一个新阶段。在体验上,我们传统的这些ADAS是一个碎片化的功能,主要还是人来驾驶,在满足辅助驾驶条件的时候再开启辅助驾驶,开启的时间可能也并不是很长,马上就会到达下一个需要“人来介入”的时候,所以它是一个相对来讲比较碎片化的功能。在理念上NOA 就打破了这种碎片化的功能,创造了典型场景下(比如,高速公路、城市环线、城市快速路等)沉浸式的自动驾驶体验,这种是消费者接触到自动驾驶的一个核心需求点。
以前做ADAS功能的时候,这个车的驾驶员主要还是人,只是在一个碎片化的阶段里面,让这个系统来介入一下,到了人机共驾的时代,可能就真是“人”和“机”一起来驾驶了。
还有就是在技术上我们觉得数据是自动驾驶的核心, NOA 的方案实现了人机共驾,能够快速地积累高价值的自动驾驶数据。
因此一个比较好的NOA 方案要具备基于量产数据回传和OTA升级的能力,就是我们让这个车更加智能。我们可以随着经历的场景更多、更复杂,来回传更多的数据,然后我们会把这样的数据进行不停的迭代,解决不同的复杂场景下的Corner Case。
最后我们觉得其实一个好的NOA 方案也要具备足够的商业竞争力,就是NOA 系统虽然已经到达新的阶段,但是如果我们想让更多的终端用户能使用这个功能的话,那就必须把成本控制好,最终的车型能覆盖更广泛的价位。
比如说易航智能的方案覆盖到15万以内的车型,这也是我们国内汽车市场目前占比最大的一个价格区间,只有这样,我们觉得才能实现一个大规模的量产。再往后一个台阶那就是FSD了。
FSD在功能和原理上其实已经和人类驾驶高度接近了,尤其是在感知端,我们采用了这种BEV的方法, BEV可以让自动驾驶系统获得一个俯视视角。简单来讲就是BEV NET通过神经网络从各个相机提取特征后,在网络中将特征转换到BEV视角下,进而对各个相机的特征进行空间尺度的融合,得到BEV视角下的特征,同时在时间尺度上,融合之前若干帧的特征,最后解析得到BEV视角下的结果。
通俗点来说,我们就是把车辆四周安装的摄像头所看到的图像,变成了一整个周围局部的小地图,那么这个小地图不但包含这个道路信息,也包含我们车周围的像车和人这些目标的信息。
这种其实就已经和人类驾驶车辆的情况非常一致了。就像我们人在驾驶车辆的时候,也会用手机进行导航,有一个全局的路径,比如说我们从家怎么去单位,要在哪条街左转,哪条街右转,而在车的近处,我们也会观察周围的车和人,包括周围的这种路沿隔离带、车道线,然后去避让这些车人,行驶在我们可以行驶的道路上。所以我们说使用BEV的FSD方案会带来一个行业发展的拐点。
前面讲了通过场景的拓展来实现自动驾驶功能的不断完善。而自动驾驶大规模的应用,我们觉得也不能停留在Demo或者小范围的试验,它必须得走向量产,而量产又恰恰是渐进式路径解决的又一个难题。
我们现在其实很多人都说量产难,我正好在这里介绍一下量产究竟难在哪里。我们说自动驾驶量产非常符合冰山理论:因为有一部分是可以展示出来的功能,还有一部分是展示不出来的功能。
所以我们说这个Demo是什么?
Demo显示的是自动驾驶系统在最佳状态时候的一个表现,比如说在特定的路段、特定的天气或者是特定的驾驶员,然后给比较熟悉自动驾驶车辆的人展示这套系统。但量产,关注的是系统在极端条件下它最差的表现。
比如说我们做一辆量产车,那么这辆车可能要在全国的4S店卖,天气如何、谁来开,我们都不知道,所以这就对系统提出了非常高的要求。这个体现到我们自动驾驶系统的研发工作上面,就是说我们让车上路做演示的这部分,其实可能只占我们全部工作量的10%;那么第二步,我们要完成更完善的功能开发,比如说我们解决驾驶员违规操作的这些问题。这些都解决了之后,我们大概可能完成了20%-30%的工作量,剩余的大部分的工作量其实都是一些我们产品级的算法,包括一些工程Case的解决,还可能有一些功能诊断。
我举个例子就是我们公司成立了两三个月之后,我们就可以让车在路上沿着车道线自动来行驶了,但是我们把自动驾驶实现到量产,最终还用了大概2-3年的时间。
再举个例子,我们很多人都知道自动驾驶有一个拨杆并线的功能,就是我们打转向灯,然后就能并到旁边的车道里。这么一个简单的功能,我们可能就要做大量的工作,因为有的转向灯可能是机械的,里边会有一些频繁的震荡,我们需要解决它到底是开还是关的震荡。
还有比如说我们有的驾驶员拨转向灯的时候,分不清左右,他可能想往左侧并线,但拨的是向右的转向,车行驶了一半,又发现他拨错了,需要从右边直接拨到左边。这种情况是非常复杂的,我们要解决自动驾驶量产,就必须把这里边所有可能遇到的问题都解决掉。
所以,我们觉得以场景为核心的自动驾驶技术,从ADAS到NOA再到FSD的量产,它不但是能力的提升,它也解决了自动驾驶量产难题,积累了宝贵的量产经验。就像刚才说到,做量产会遇到很多意想不到的情况,整个周期也会比较长。
那么怎么加速这个过程,怎么样能让自动驾驶快速地落地量产呢?我们觉得全栈自研是必须要具备的能力,主要是有这么几个原因:首先我们觉得目前自动驾驶系统是一个软件和硬件高度耦合的系统,在研发过程中,我们遇到的问题其实很难简单地归因于是软件的问题还是硬件的问题,而是需要软硬件系统相互配合,来最终达到功能的实现。
全栈自研就能提升我们软硬件匹配包括集成的效率,来加速实现量产。
举个例子,我们研发域控制器的时候会进行振动实验,过程中会把振动的强度放到比国标、包括比客户要求的指标更严苛的状态下。在这种非常剧烈震动的时候就会发现,摄像头和控制器中间的连线,包括接插件可能有一些闪断,那么这个就会导致这套系统里面的图像传输发生停滞,停滞以后图像有可能就回不来,后边很多的处理就会出现问题。
对于这样的一个问题,如果说软件和硬件是分离开来开发的话,软件的工程师可能会觉得这是接插件的问题,需要硬件的工程师去找一个可以满足这种震动实验条件下、不发生脱离的接插件;而硬件的工程师觉得,现在行业里边找不到一种在任何条件下都不会有闪断的接插件,需要软件来解决。
在很多情况下,软件和硬件工程师因为角度不一样,就会遇到这种现实的问题,所以我们必须得让软件工程师和硬件工程师在一起讨论这个问题,只有在系统的层面把这个问题解决,我们才能更好地开发出一套自动驾驶的控制器。
第二,为了实现更好的驾驶体验,感知和规划控制也需要高度耦合。感知和规控共同决定着自动驾驶的用户体验,所以我们要实现这种“1+1>2”的效果,也需要两个算法在一起持续地优化,而不是只侧重于某一方面。比如,非常远距离的感知,一辆车离我们很远的时候,测距测速不可避免的误差会变大。
那么对于这种情况,我们如果想让最终的感受比较好的话,我们就需要感知和决策控制所有这些算法的环节,一起优化这个问题。即使测量的精度有一些变化,我们还需要最终的控制把这个问题给解决掉,让人坐在车里面感受不到误差。
最后,我们觉得全栈自研也是服务客户的一个需要,因为自动驾驶它其实是一个系统工程,那么我们只有整个技术都“趟”过一遍才能掌握系统工程能力,我们也才能根据用户的需求提供定制化的解决方案。
比如说有的车型对成本控制要求很高,它安装的这些传感器精度可能就会相对低一些,然后误差、噪音可能会比较大,这个时候我们就得做很多信号上的处理,让最终我们拿到的信号不要有精度上的问题。
再比如有的车厂选择了中小算力的计算平台,那么就要求我们软硬件必须深度地进行优化和匹配,才能充分地激发算力,实现这些高级功能。
像我们现在用的这种苹果手机,其实它的算力要比安卓手机或者高通的芯片低一些,但是苹果手机使用却更加流畅,是因为它是软件硬件在一起进行优化、调试,它才能最终达到一个更好的结果。
我们易航智能也是一直坚持构建全栈自研的能力,像我们已经能涵盖感知、决策规划控制,包括软硬件开发、测试标定等等这些的能力。
讲完全栈自研能力对于量产的重要性,我们再来看一下全栈自研这个过程中到底有哪些关键的技术和能力。这里我们从以下几个方面,就是感知、规划控制和AEB主动安全这三个方面展开讲讲。
首先来看这种感知的算法,自动驾驶要感知比较多的路面信息,包括检测像车辆、行人这些目标,还有对这些目标进行测距测速等等。同时我们也要检测像车道线这些道路信息。这个工作其实有很多难点,比如说我们在刚刚进入隧道的时候,尤其是天气特别好的时候,人眼都会因为突然的明暗变化,而瞬间看不清路。对于自动驾驶来讲,我们的摄像头也会由于这种非常明显的明暗变化、由于曝光看不清道路,这个是非常危险的,所以我们就会对曝光提出更强的要求。我们目前要求进隧道的时候,从特别亮到特别暗的时候,必须在100毫秒之内达到我们最终的曝光要求,可以看到隧道里非常黑的路况。其实在夜晚当对面有这种远光灯照过来的时候,我们也是一样的状况,所以这些场景和路况就会有很多难点。
再比如说我们在道路上行驶的时候,有的车尤其是货车,它可能就是在运送很长的墩子或者管子,它比这个车要更长,会伸出这个车。那么这个车距离我的位置在哪里,是按照管子来算,还是按照车来算?上面盖住的布被风刮开之后是什么样的情况?又是不一样的处理方式。这些都对感知提出了很多挑战。
除了检测的问题,还有比如说到路口的时候,有的人站在路边打电话但是并不想过马路,我们也要对他的行为进行一些预测和判断,你要知道他在干什么,有没有过马路的意图;比如有的车他可能在道路上打了转向灯,但是他并不想并线,他只是忘关了。这些情况下,我们都要对这些目标的行为做出一些预测和判断,这个就是我们现在在感知端遇到的一些难点。
那么大家可以看到感知方面,我们又要检测很多的目标,又有很多的功能,所以它对算力有很大的需求。
但算力不是无限的,所以我们就要在特定的算力下,放入更多的功能,这对算法提出了进一步的要求,我们必须要用有限的算力消耗或者是特定的算力消耗,达到更好的效果和更多的功能。
我们目前是采用了算法优化和算力优化两个部分来解决这个问题。
算法优化上主要是用像算法剪枝、知识蒸馏。算法剪枝就是在对模型有一个比较深刻的理解的基础上,我们用自己创新的Scalpel剪枝方法论进行模型压缩,这样就可以提升模型的运转效率。知识蒸馏这边,我们自研了一套领先的大模型,功能算法模型通过知识蒸馏的手段,向大模型来学习,充分继承大模型的优秀基因,最终提升算法的精度。
算力优化这边我们主要是共享Backbone,我们在这条路径上打通了计算平台和高精度多任务训练之间的隔阂。障碍物检测包括图像分割、交通标志检测等实现网络共享,这样也可以极大降低算力的消耗。
再来讲一下决策规划控制。不同的司机对感知是一样的,路面有车、有人都是可以看到的,但是最终我们的驾驶能力是不一样的,这就是说人的决策规划和控制的能力是不一样的,对于自动驾驶来讲同理,我们决策规划控制在自动驾驶里面一样是非常重要的。
怎么样来评价一个自动驾驶的驾驶水平?我们觉得可以类比人的驾驶能力,比如说有的职业驾驶员可以驾车做出很多非常专业的动作,像漂移,我们可以基于这一点认为他的驾驶能力好,因为他对车的理解更强,知道车的极限在哪里,也知道怎么样来控制这个车。我们的决策规划控制算法,使用了这种驾驶员行为建模,我们也对驾驶员的行为有非常深入的理解。
为了验证规划控制能力,我们基于我们的驾驶员模型做出了整车漂移的算法,就像视频里演示的这种。现在全世界能在真实场地上实现自动驾驶漂移的公司非常少。视频里也可以看到我们的方向盘非常稳,比职业驾驶员的方向盘还要稳;右下角的路径也非常圆,而且两圈能完全地重合在一起,就说明我们的控制都是在一个非常高的水准上面,可能都超出了一些职业驾驶员的能力。
最后我来介绍一下AEB。AEB其实它主要是提升车辆的一个主动安全能力,然后也是自动驾驶里面一个核心的功能。降低交通事故的发生,也是我们做自动驾驶技术的一个初心,也是自动驾驶走向大规模应用的必要条件。AEB最严格的要求就是欧洲的相关法规,这是全球对安全性要求最高的标准。
虽然AEB功能看起来不是特别复杂,但是是自动驾驶算法里面难度极高的算法,因为它要求基本达到零误触发,所以这是对我们能力非常大的挑战。
比如说有的人在路上突然探头,而且可能是小孩,这种场景是非常难处理的,要求我们的感知必须要非常的准、非常的快,而且在这种情形下控制也要非常及时。在这个方面我们做到了仅靠单视觉的系统就能实现欧洲的E-NCAP五星评级,所以搭载我们自动驾驶系统的车型,已经出口到了欧洲。
最后,简单介绍一下我们易航智能的情况和我们业务的情况。
我们公司成立于2015年,是中国最早成立的自动驾驶创业公司之一,在2016年的时候,我们和主机厂达成战略合作,成为了国内第一个获得自动驾驶量产订单的创业公司。目前我们已经有10万辆整车的量产经验,就是有10万辆使用我们自动驾驶系统的车在路上,我们也积累了超过10亿公里的驾驶数据,覆盖了中国除了港澳台之外的全部省份,以及像法国、德国、意大利、比利时、荷兰、西班牙、瑞典等西欧国家和北欧国家。
在业务上,我们构建了场景为核心的4大产品线,有低成本的辅助驾驶ADAS系统,然后有行泊一体+记忆泊车的高级辅助驾驶系统,还有领航辅助驾驶NOA系统,以及全场景的自动驾驶FSD系统,目前前三个都已经量产了。今年搭载我们NOA功能的车型将陆续的批量上市,城市的全场景FSD主要就是像地库、小区里,然后城区道路、高速公路上等所有的场景都会打通,实现任意场景的点对点的方案,我们会在今年年底到明年初量产。
量子位发起的CEO/CTO系列分享活动,不定期邀请前沿科技领域创业公司CEO/CTO,分享企业最新战略、最新技术、最新产品,与广大从业者、爱好者探讨前沿技术理论与产业实践。欢迎大家多多关注 ~
— 完 —
量子位 QbitAI
关注我们,第一时间获知前沿科技动态
“