特斯拉自动驾驶要想不再“翻车”，还得踩完这些坑

2020-06-04 09:56来源: 互联网

（本文由知乎答主“张抗抗”撰文，腾讯科技整理，作者系清华大学动力工程与工程热物理博士）

特斯拉自动驾驶又“翻车”了。近日，一辆开启了AutoPilo功能的特斯拉Model 3又撞上了侧翻、静止的大货车，再次引发了广大用户对自动驾驶是否靠谱的质疑，以及对自动驾驶安全的担忧。

在不少人看来，真正的自动驾驶、无人驾驶是可以完全解放人类司机的。但特斯拉的几起事故却让我们发现，如今的自动驾驶连路上静止的车都绕不开，这样的也算得上自动驾驶吗？

只能说，许多人对自动驾驶技术还有诸多不解和误解。今天我们就先为大家科普一下什么是自动驾驶，攻破自动驾驶有哪些难点。

知乎答主张抗抗认为，自动驾驶是分等级的，而这取决于这一技术替代驾驶员的感知、决策与执行的程度。特斯拉的自动驾驶等级仅处在L2.5的阶段。而自动驾驶等级从L2到L3：“这是一个质变的阶跃点。L2到L3的界限是非常明显的，需要驾驶员时刻保持警惕的，就只能是L2。”看来，特斯拉自动驾驶目前仅处在一个“从无到有”的等级，要想躲开静止货车等障碍还有很长的路要走。

在乎答主张抗抗看来，自动驾驶L2→L3：真正意义自动驾驶的“从无到有”；L3→L4：从“不全面到全面”；L4→L5：从“不完美到完美”。

以下是知乎答主张抗抗的回答全文，腾讯科技稍作整理：

自动驾驶攻破的难点在哪里？这个问题可以分解成两个维度：

1、纵向维度：L0→L1→L2→L3→L4→L5，哪一步是最难/最关键的？

2、横向维度：自动驾驶技术范式的三大方面：感知(眼耳鼻) 、决策(大脑)、执行(神经、肌肉、四肢)，哪一方面是最难、最关键的？

一、从横、纵两个维度认识自动驾驶

在非自动驾驶的情况下：

感知：驾驶员的眼耳鼻等各个传感器，在接收着外界的信息，承担着感知的功能；

决策：驾驶员的大脑根据感知的信息，决定进行加减速、转向等操作，承担着决策的功能；

执行：驾驶员的神经、四肢，以油门刹车与方向盘作为人车交互的两大媒介，与整个汽车系统一起承担着执行的功能。

什么是自动驾驶？就是全部或部分地替代驾驶员的感知、决策与执行功能，而替代的程度，就决定了自动驾驶的等级。目前，普通公认的自动驾驶等级标准是SAE J3016，最新版本是2016年9月。

英文+术语对阅读来说可能不太友好，我来用通俗的语言翻译一下：

L0-无自动辅助功能

L1-转向或者加减速实现一条，驾驶员要时刻关注驾驶过程

L2-转向和加减速都实现，驾驶员要时刻关注驾驶过程

L3-不需要驾驶员监督，但在出问题时需要驾驶员介入

L4-不需要驾驶员监督，但仍然有一定局限，在出问题时能够自动靠边

L5-全自动驾驶，只要在地球上有地图的地方，全部都能自动驾驶

(L6)-展望一下，在火星上也能开？

是不是还不太友好？我再用粗俗的语言来翻译一下：

L0– 驾驶员同学：你来开，我不参与。

L1&L2– 驾驶员同学：我能感知到周围环境，也有一定的决策能力，所以我可以帮你踩油门刹车或帮你打方向盘(L1)，甚至这俩活我都帮你做了(L2)。但是，我开归我开，这属于帮忙，你得盯着，因为丑话说在前面：出了紧急情况我也不一定能辨识出来，所以我也一概不负责。发生在特斯拉身上的、谁来负责的一个生动案例：还原特斯拉致命事故现场，美国交通局是如何「断案」的？

L3–驾驶员同学：我帮你开，你不用盯，我都能辨识，能处理的也就帮你处理了；我辨识不出来的，我的责任，你或你的家人可以找我来索赔；但是，我辨识出来的紧急情况超出我的处理能力/伦理道德权限的时候，就会提醒你开，我提醒之后，责任就是你的了，我不负责。

L4–驾驶员同学：我辨识，我开，你该干嘛就干嘛去，放心，我不会打扰你的；如果实在出了状况，我至少是帮你停路边，保你一条小命。

L5– 驾驶员同学：这个车，就是我开，没你什么事；说难听点，就你这水平实在是不配开车，让你开就是危害公共安全，如果说我是专业九段，你最多是业余二段；你非要开？对不起，方向盘与油门我已经卸了，你想开也没法开。如果你犯了开车瘾了，出门右拐200米的旅行社，有内蒙古呼伦贝尔草原三日游，特色项目可以骑马与开车二选一。

二、纵向的L0→L5，哪一步最关键/最难？

L0→L1：

汽车从仅有执行的功能，进化成具备感知与决策的能力，这是从0到1的过程，当然很重要，而这已经人类目前已经走过的历史了，不是当下最关键的了。把自动驾驶比喻成一个人的话，这是婴儿从呱呱落地到认识这个世界、学会语言的过程。

L1→L2：

只是纵向控制和横向控制的区别，相当于我做了一个功能再去做另外一个功能，这个难度并不大。当然，涉及到量产就要考虑到系统工程，汽车还要考虑成本，要做的工作还是不少的。这是高中生学文、学理，还是文理兼修的区别。

现在能达到L2的车型已经挺多了，各大品牌的中高端车型，例如JEEP自由光、沃尔沃等等，当然也包括大名鼎鼎的Tesla。正因为L2没那么稀奇了，所以才有动力要搞出L2.5这样的概念。

L2→L3：

敲黑板了，这是一个质变的阶跃点，也是一个有很多猫腻的点。L2与L3关键就在于：自动驾驶是否有足够的自信，来确保自己的感知与决策能力是与人类相当的、至少是满足法律要求的、做出承诺不会使企业倒闭的。

假如一辆车的整个生命周期，会遇到10000次危险情况，L2会声称自己可以辨识出9900个、9990个、9999个，但就是不敢承诺可以到100%——否则就是L3了。

这是学霸与学神的区别：学霸考了99分，学神考了100分，并不是因为学霸与学神差距不大：学霸考了99分说明实力只有99分，而学神考100分是因为满分只有100分。

99%与100%之间的鸿沟是如此之大，难以跨越，使得不安分的公司开始搞点猫腻，L2.5啊、L2.X啊这些概念都出来了。我想说的是，只要未到L3，L2.9999都可以说是厂家自己在往自己脸上贴金，L2到L3的界限是非常明显的，需要驾驶员时刻保持警惕的，就只能是L2。

所有L3以下的自动驾驶（例如特斯拉一直引以为傲的L2.5）一般是下面这个画风，这位大叔手脚都很轻松，但是眼睛目视前方，神情有些紧张，不敢太过放松。在这种情况下，王者荣耀只能打快速战斗，不能打排位，否则要么分分钟掉到青铜，要么太专注了小命不保。

这是真正的自动驾驶吗？从个人感受来说，我不这么认为。所以我认为L2→L3是一个“从无到有”的过程。

而到了Level3，就是下面这种画风。比如在L3的全新奥迪A8上，一家之主可以享受着自己带家人出游的乐趣，同时还可以拿着笔记本完成一些简单工作，可以同时享受带着全家人出游的乐趣，同时还能处理工作事物。

目前来说，量产版发布L3的，只有全新奥迪A8，这辆车也是目前量产车所能达到自动驾驶的最高水平。但是L3所存在的问题是，如果一旦系统出现无法hold的情况，需要驾驶员接管，所以在开车时只能进行一些简单的工作，比如处理个流水邮件，给知乎上的妹子点个赞之类，是没问题的。但深入思考某个投资问题，或者打王者荣耀要冲最强王者，那还是不太现实的。

L3→L4：

L4和L3的区别在于，L3在系统出问题时需要人接管，而L4可以自己handle所有特殊情况。

换句话说，从乌镇到上海俩小时，L3的自动驾驶可能中间10分钟需要驾驶员接管，而其他时候可以忙一些工作上的事情或者休息，即使不接管也没事，最多给你抗议一下停到路边。也就是说，L2到L3解决的是“从无到有”的问题，而L3到L4是“从不全面到全面的问题”。

到了L4，就变成了下面这种画风。这张图曾经作为百度的“罪证”而被广泛流传，李彦宏一个人坐在副驾驶打电话，百度无人车在五环上实线变道（看来他们还没有开发出交通规则识别功能）。在这个级别，驾驶员无需关注任何驾驶工况，车辆可以自行控制。

L4→L5：

那么从L4到L5又有哪些变化呢？还是以引子中的乌镇—上海中环某地为例。这一路，申嘉湖最开阔，路况好没有车；G60车比较多，但灵活变道的话，还是可以开得比较顺畅；而沪闵高架就比较拥堵了，尤其是几个出口入口的地方，动不动有插队现象(Level 5的插队水平可能比驾驶员还强，也许会有：360汽车，超强插队能力的汽车)；到了中环，又是车多但基本畅通的情况。对于一个不认真开车的老司机来说，申嘉湖很简单，中环G60还凑合，沪闵高架比较难，可见这是一个评判司机好坏的标准。

对于自动驾驶来说，路况的复杂程度也是考量自动驾驶深度的一个很重要维度。这就是Level4和Level5的区分。在J3016中，Level 4的描述特地举了个例子，比如去固定的地方接人，通过固定的路径。

做个概括：

如果说L2是学霸，L3是学神；那么L4就是大师，能识别出所有危急情况，而且知道自己以及行业内的能力边界——哪些事情是目前能力还做不到的，或者是因为法律、伦理因素自己不适合做的(譬如是撞死一个人还是撞伤五个人的抉择)，交给驾驶员；

而L5就是爱因斯坦+Alpha Go，已经是驾驶领域的神，在面临危急情况的时候，会做出一些莫名其妙的举动，就像围棋中Alpha Go走出的人类无法理解的神来之笔，但就是完成了人类完成不了的动作，避免了事故；甚至平时去夹塞，都比人夹得好。

如果一个人能成长为大师，L2→L3是最难的，相当于是模拟考试徘徊在985与211之间的高中生，冲击一下想考上清华北大，而全新奥迪A8率先实现了量产Level3，相当于是高二竞赛提前录取了，占据了先机。如果是沿着现有的理论框架走到L5，L2→L3和L4→L5是最重要的。也不排除，为了达到L5，要突破现有的Level体系才能实现。

总之：L2→L3：真正意义自动驾驶的“从无到有”；L3→L4：从“不全面到全面”；L4→L5：从“不完美到完美”。

笔者认为，L4→L5的意义大于L1→L2与L3→L4，但小于L2→L3。

三、横向维度：感知、决策与执行，哪一步最难、最关键？

横向维度的讨论就不在此展开，只简要写写其中一个点：从技术范式来看，自动驾驶主攻的是感知与决策，执行不就是油门刹车与方向盘两个输入信号吗，为什么也会成为一个难点、甚至成为传统车企狙击互联网车企的护城河呢？

原因在于：

在L0→L5的过程中，由于自动驾驶的加入，系统变得越来越复杂，而且大部分是与安全强相关。这就要求系统的安全性提出了更高的要求，如果仅通过提高可靠性的方法来实现，则成本会急剧增高，这时候就需要通过功能安全(function safety)的方式，在成本可控的情况下来保障安全性。

与自动驾驶等级相似，功能安全也分ASIL A→D 4个等级，有论文甚至提出由于自动驾驶太危险了，出了事儿不仅自己完蛋，周围人也完蛋，建议给自动驾驶功能新出一个ASIL E等级。这是什么概念？要知道，目前还没有任何一家汽车公司可以达到ASIL D的水平(2015年的信息)，那达到ASIL E是何其难？

也就是说，自动驾驶虽然重点在感知与决策，但由于强安全性与高系统复杂度，使得执行控制也成了一个技术难点，而这一点是传统车企的优势。

免责声明：凡本站注明 “来源：XXX（非商务新闻网）”的新闻稿件和图片作品，系本站转载自其它媒体，转载目的在于信息传递，并不代表本站赞同其观点和对其真实性负责。