(本文由知乎答主“张抗抗”撰文,腾讯科技整理,作者系清华大学动力工程与工程热物理博士)
特斯拉自动驾驶又“翻车”了。近日,一辆开启了AutoPilo功能的特斯拉Model 3又撞上了侧翻、静止的大货车,再次引发了广大用户对自动驾驶是否靠谱的质疑,以及对自动驾驶安全的担忧。
在不少人看来,真正的自动驾驶、无人驾驶是可以完全解放人类司机的。但特斯拉的几起事故却让我们发现,如今的自动驾驶连路上静止的车都绕不开,这样的也算得上自动驾驶吗?
只能说,许多人对自动驾驶技术还有诸多不解和误解。今天我们就先为大家科普一下什么是自动驾驶,攻破自动驾驶有哪些难点。
知乎答主张抗抗认为,自动驾驶是分等级的,而这取决于这一技术替代驾驶员的感知、决策与执行的程度。特斯拉的自动驾驶等级仅处在L2.5的阶段。而自动驾驶等级从L2到L3:“这是一个质变的阶跃点。L2到L3的界限是非常明显的,需要驾驶员时刻保持警惕的,就只能是L2。”看来,特斯拉自动驾驶目前仅处在一个“从无到有”的等级,要想躲开静止货车等障碍还有很长的路要走。
在乎答主张抗抗看来,自动驾驶L2→L3:真正意义自动驾驶的“从无到有”;L3→L4:从“不全面到全面”;L4→L5:从“不完美到完美”。
以下是知乎答主张抗抗的回答全文,腾讯科技稍作整理:
自动驾驶攻破的难点在哪里? 这个问题可以分解成两个维度:
1、纵向维度:L0→L1→L2→L3→L4→L5,哪一步是最难/最关键的?
2、横向维度:自动驾驶技术范式的三大方面:感知(眼耳鼻) 、决策(大脑)、执行(神经、肌肉、四肢),哪一方面是最难、最关键的?
一、从横、纵两个维度认识自动驾驶
在非自动驾驶的情况下:
感知:驾驶员的眼耳鼻等各个传感器,在接收着外界的信息,承担着感知的功能;
决策:驾驶员的大脑根据感知的信息,决定进行加减速、转向等操作,承担着决策的功能;
执行:驾驶员的神经、四肢,以油门刹车与方向盘作为人车交互的两大媒介,与整个汽车系统一起承担着执行的功能。
什么是自动驾驶?就是全部或部分地替代驾驶员的感知、决策与执行功能,而替代的程度,就决定了自动驾驶的等级。目前,普通公认的自动驾驶等级标准是SAE J3016,最新版本是2016年9月。
英文+术语对阅读来说可能不太友好,我来用通俗的语言翻译一下:
L0-无自动辅助功能
L1-转向或者加减速实现一条,驾驶员要时刻关注驾驶过程
L2-转向和加减速都实现,驾驶员要时刻关注驾驶过程
L3-不需要驾驶员监督,但在出问题时需要驾驶员介入
L4-不需要驾驶员监督,但仍然有一定局限,在出问题时能够自动靠边
L5-全自动驾驶,只要在地球上有地图的地方,全部都能自动驾驶
(L6)-展望一下,在火星上也能开?
是不是还不太友好?我再用粗俗的语言来翻译一下:
L0– 驾驶员同学:你来开,我不参与。
L1&L2– 驾驶员同学:我能感知到周围环境,也有一定的决策能力,所以我可以帮你踩油门刹车或帮你打方向盘(L1),甚至这俩活我都帮你做了(L2)。但是,我开归我开,这属于帮忙,你得盯着,因为丑话说在前面:出了紧急情况我也不一定能辨识出来,所以我也一概不负责。发生在特斯拉身上的、谁来负责的一个生动案例:还原特斯拉致命事故现场,美国交通局是如何「断案」的?
L3–驾驶员同学:我帮你开,你不用盯,我都能辨识,能处理的也就帮你处理了;我辨识不出来的,我的责任,你或你的家人可以找我来索赔;但是,我辨识出来的紧急情况超出我的处理能力/伦理道德权限的时候,就会提醒你开,我提醒之后,责任就是你的了,我不负责。
L4–驾驶员同学:我辨识,我开,你该干嘛就干嘛去,放心,我不会打扰你的;如果实在出了状况,我至少是帮你停路边,保你一条小命。
L5– 驾驶员同学:这个车,就是我开,没你什么事;说难听点,就你这水平实在是不配开车,让你开就是危害公共安全,如果说我是专业九段,你最多是业余二段;你非要开?对不起,方向盘与油门我已经卸了,你想开也没法开。如果你犯了开车瘾了,出门右拐200米的旅行社,有内蒙古呼伦贝尔草原三日游,特色项目可以骑马与开车二选一。
二、纵向的L0→L5,哪一步最关键/最难?
L0→L1:
汽车从仅有执行的功能,进化成具备感知与决策的能力,这是从0到1的过程,当然很重要,而这已经人类目前已经走过的历史了,不是当下最关键的了。把自动驾驶比喻成一个人的话,这是婴儿从呱呱落地到认识这个世界、学会语言的过程。
L1→L2:
只是纵向控制和横向控制的区别,相当于我做了一个功能再去做另外一个功能,这个难度并不大。当然,涉及到量产就要考虑到系统工程,汽车还要考虑成本,要做的工作还是不少的。这是高中生学文、学理,还是文理兼修的区别。
现在能达到L2的车型已经挺多了,各大品牌的中高端车型,例如JEEP自由光、沃尔沃等等,当然也包括大名鼎鼎的Tesla。正因为L2没那么稀奇了,所以才有动力要搞出L2.5这样的概念。
L2→L3:
敲黑板了,这是一个质变的阶跃点,也是一个有很多猫腻的点。L2与L3关键就在于:自动驾驶是否有足够的自信,来确保自己的感知与决策能力是与人类相当的、至少是满足法律要求的、做出承诺不会使企业倒闭的。
假如一辆车的整个生命周期,会遇到10000次危险情况,L2会声称自己可以辨识出9900个、9990个、9999个,但就是不敢承诺可以到100%——否则就是L3了。
这是学霸与学神的区别:学霸考了99分,学神考了100分,并不是因为学霸与学神差距不大:学霸考了99分说明实力只有99分,而学神考100分是因为满分只有100分。
99%与100%之间的鸿沟是如此之大,难以跨越,使得不安分的公司开始搞点猫腻,L2.5啊、L2.X啊这些概念都出来了。我想说的是,只要未到L3,L2.9999都可以说是厂家自己在往自己脸上贴金,L2到L3的界限是非常明显的,需要驾驶员时刻保持警惕的,就只能是L2。
所有L3以下的自动驾驶(例如特斯拉一直引以为傲的L2.5)一般是下面这个画风,这位大叔手脚都很轻松,但是眼睛目视前方,神情有些紧张,不敢太过放松。在这种情况下,王者荣耀只能打快速战斗,不能打排位,否则要么分分钟掉到青铜,要么太专注了小命不保。
这是真正的自动驾驶吗?从个人感受来说,我不这么认为。所以我认为L2→L3是一个“从无到有”的过程。
而到了Level3,就是下面这种画风。比如在L3的全新奥迪A8上,一家之主可以享受着自己带家人出游的乐趣,同时还可以拿着笔记本完成一些简单工作,可以同时享受带着全家人出游的乐趣,同时还能处理工作事物。
目前来说,量产版发布L3的,只有全新奥迪A8,这辆车也是目前量产车所能达到自动驾驶的最高水平。但是L3所存在的问题是,如果一旦系统出现无法hold的情况,需要驾驶员接管,所以在开车时只能进行一些简单的工作,比如处理个流水邮件,给知乎上的妹子点个赞之类,是没问题的。但深入思考某个投资问题,或者打王者荣耀要冲最强王者,那还是不太现实的。
L3→L4:
L4和L3的区别在于,L3在系统出问题时需要人接管,而L4可以自己handle所有特殊情况。
换句话说,从乌镇到上海俩小时,L3的自动驾驶可能中间10分钟需要驾驶员接管,而其他时候可以忙一些工作上的事情或者休息,即使不接管也没事,最多给你抗议一下停到路边。也就是说,L2到L3解决的是“从无到有”的问题,而L3到L4是“从不全面到全面的问题”。
到了L4,就变成了下面这种画风。这张图曾经作为百度的“罪证”而被广泛流传,李彦宏一个人坐在副驾驶打电话,百度无人车在五环上实线变道(看来他们还没有开发出交通规则识别功能)。在这个级别,驾驶员无需关注任何驾驶工况,车辆可以自行控制。
L4→L5:
那么从L4到L5又有哪些变化呢?还是以引子中的乌镇—上海中环某地为例。这一路,申嘉湖最开阔,路况好没有车;G60车比较多,但灵活变道的话,还是可以开得比较顺畅;而沪闵高架就比较拥堵了,尤其是几个出口入口的地方,动不动有插队现象(Level 5的插队水平可能比驾驶员还强,也许会有:360汽车,超强插队能力的汽车);到了中环,又是车多但基本畅通的情况。对于一个不认真开车的老司机来说,申嘉湖很简单,中环G60还凑合,沪闵高架比较难,可见这是一个评判司机好坏的标准。
对于自动驾驶来说,路况的复杂程度也是考量自动驾驶深度的一个很重要维度。这就是Level4和Level5的区分。在J3016中,Level 4的描述特地举了个例子,比如去固定的地方接人,通过固定的路径。
做个概括:
如果说L2是学霸,L3是学神;那么L4就是大师,能识别出所有危急情况,而且知道自己以及行业内的能力边界——哪些事情是目前能力还做不到的,或者是因为法律、伦理因素自己不适合做的(譬如是撞死一个人还是撞伤五个人的抉择),交给驾驶员;
而L5就是爱因斯坦+Alpha Go,已经是驾驶领域的神,在面临危急情况的时候,会做出一些莫名其妙的举动,就像围棋中Alpha Go走出的人类无法理解的神来之笔,但就是完成了人类完成不了的动作,避免了事故;甚至平时去夹塞,都比人夹得好。
如果一个人能成长为大师,L2→L3是最难的,相当于是模拟考试徘徊在985与211之间的高中生,冲击一下想考上清华北大,而全新奥迪A8率先实现了量产Level3,相当于是高二竞赛提前录取了,占据了先机。如果是沿着现有的理论框架走到L5,L2→L3和L4→L5是最重要的。也不排除,为了达到L5,要突破现有的Level体系才能实现。
总之:L2→L3:真正意义自动驾驶的“从无到有”;L3→L4:从“不全面到全面”;L4→L5:从“不完美到完美”。
笔者认为,L4→L5的意义大于L1→L2与L3→L4,但小于L2→L3。
三、横向维度:感知、决策与执行,哪一步最难、最关键?
横向维度的讨论就不在此展开,只简要写写其中一个点:从技术范式来看,自动驾驶主攻的是感知与决策,执行不就是油门刹车与方向盘两个输入信号吗,为什么也会成为一个难点、甚至成为传统车企狙击互联网车企的护城河呢?
原因在于:
在L0→L5的过程中,由于自动驾驶的加入,系统变得越来越复杂,而且大部分是与安全强相关。这就要求系统的安全性提出了更高的要求,如果仅通过提高可靠性的方法来实现,则成本会急剧增高,这时候就需要通过功能安全(function safety)的方式,在成本可控的情况下来保障安全性。
与自动驾驶等级相似,功能安全也分ASIL A→D 4个等级,有论文甚至提出由于自动驾驶太危险了,出了事儿不仅自己完蛋,周围人也完蛋,建议给自动驾驶功能新出一个ASIL E等级。这是什么概念? 要知道,目前还没有任何一家汽车公司可以达到ASIL D的水平(2015年的信息),那达到ASIL E是何其难?
也就是说,自动驾驶虽然重点在感知与决策,但由于强安全性与高系统复杂度,使得执行控制也成了一个技术难点,而这一点是传统车企的优势。