这是一辆蓝色的林肯,车顶有一块 LED 屏幕,几个黑色圆柱体围绕在 LED 屏幕周围,不停转动。车头前方也有一个黑色凸起。驾驶座旁是一个屏幕,上面显示密密麻麻的蓝色点和蓝色框,随着汽车行驶,点和线不断消失。副驾座位旁还配备一个小型灭火器。
我坐在这辆车上,在山景城兜了一圈。在这段 7.5 公里、20 分钟左右的车程,经过了 16 个红绿灯、有 stop sign(停止号志) 的十字路口、红色箭号的左转路口等。大部分时间的体验都很舒服,只有偶尔突然加速减速,和司机旁显示幕上科幻感极强的画面,在提醒我这是一辆无人驾驶车。
没错,我身旁的司机手并没有放在方向盘上,脚也离开油门和刹车。车顶的相机、激光雷达和雷达是汽车的眼睛,车厢后的电脑是汽车的大脑,一套基于深度学习的算法把我从路边接上车,又把我送回停车场。
这就是之前报导过的创业公司 Drive.ai 研发的自动驾驶汽车。这家神秘的自动驾驶汽车公司成立不到两年,但这已经是第四代自驾车,我也有幸成为它第一个外部乘客。机器人司机表现得非常自然,比我以往坐过的自驾车更像“人类”,比如当我们驶到一个路口,恰好遇上红灯转绿灯,车子并没有先停下来再启动,而是无比自然地减速加速切换,过了这个路口。
“虽然看起来很简单,但其中有一些很难的地方。”陪我一起体验的工程师说。比如某个左转路口是左转箭号绿灯亮起才能走,要让汽车明白在这个特定的路口,前行绿灯和左转箭号绿灯的差别,并不容易。“刚开始汽车不明白,我们就收集一些这样的路口资料来训练,它才学会。”
当然,这辆车还有很多可以做更好的地方,比如加减速的处理如何更平稳、怎么做到红灯合理右转及无保护左转等。但是整体来说,已经是很不错的驾驶体验。
联合创始人兼 CEO Sameep Tandon 告诉我们,目前他们的车队已具备 L4 级(部分状况下完全自动驾驶)的自动驾驶水准,接下来他们希望和更多伙伴合作,把他们的软硬件解决方案带到商务车队去。
经典机器人 vs. 深度学习,自动驾驶哪家强?
自动驾驶汽车公司这么多,Drive.ai 有什么不同?
在采访中,几位联合创始人一再强调,Drive.ai 是一个“深度学习技术为先”的公司。这也就意味着他们采用的技术和 Waymo(Google 无人驾驶车部门)、特斯拉等都不太一样,他们用的是深度学习技术来打造自动驾驶系统。
这意味着什么?
在自动驾驶领域,基本可以分成两个流派:一是经典机器人方向,基于规则的(rule-base)。工程师会为每个场域都写好固定的程式码,来告诉机器人该怎么做。这样的结果是,如果新场域出现、又没有对应程式码,那么机器可能不知道怎么应对,这限制了自驾车的可拓展性。
举一个例子,Waymo 的自动驾驶汽车,从总部山景城延伸到奥斯汀的时候,仅因为山景城的红绿灯是直向,奥斯汀则是横向,就没有办法顺利辨识红绿灯,不得不让式设计师重新写程式“教”它。
另外一个现在更受欢迎、包括 Drive.ai 也选择的方向,是基于深度学习技术。深度学习可模拟大脑辨识机制,对于非结构化资料(如影像语音等)更能辨识、判断和分类,让算法可从资料和训练中学习。这就像人脑,只需要工程师透过类似的场域不断训练机器,它就能自己判断,这样即使在全新场域里,车子也知道如何处理,更有利于适应和延伸。
比如同样辨识红绿灯,rule-base 的自动驾驶汽车会需要在高精确度地图上特别标注出所有红绿灯,让机器固定看到那个方向;但深度学习算法可直接从相机里辨识红绿灯的色彩,所以车辆就可以自己看懂红绿灯,以及整个路口的行车情况,以此决定是否前行。
Sameep Tandon 说,随着大家都意识到深度学习的优势,越来越多公司都号称自己的技术是基于深度学习基础,但事实上很少有人真正做到这点。“我们所有的技术,比如地图、行动规划、决策全都基于深度学习。我们是用深度学习来设计整个系统,这和其他公司走经典机器人方向,只把深度学习当做补充部分,有很大不同。”他说。
从资料处理到算法训练再到计算资源,利用深度学习打造一个自动驾驶公司
Drive.ai 的另一个创始人 Tao Wang 说,自动驾驶的困难之一是自动驾驶产生的资料量极大,在收集到资料后,怎么使用成了关键。第一步要做的事情就是标记它们,才能训练算法引擎。1 小时自动驾驶产生的资料,即使是大型互联网公司,也需要 800 个小时人工标记。
Drive.ai 自己打造了一个自订的资料标记工具,可不断最佳化整个资料工作流程,进行高品质的资料分类。他们使用深度学习让同一个工作可同时进行多个分类,把汇出结果整合后,就可以产生高品质的标记。他们现在资料标寄的速度已是大公司的 20 倍,这也就意味着有更多资料可以“喂”给算法引擎学习,进而让汽车快速处理新道路、学习新使用场域,随着训练资料的增加而持续提高效能。
Tao Wang 说,Drive.ai 的深度学习系统甚至比专门的人类标注者更准确。有一次算法显示某个号志灯是红灯,但是专门的标注员回忆说是绿灯,结果他们检视资料后,发现真的是红灯。“这也表明算法可训练得比人类更聪明。无论是决策、路线规划还是定位都可以做得很好。”
有一次,自驾车看到路上有一只狗在滑滑板,标注员很震惊地和工程师说:“请问这个要怎么分类?”然而汽车还能正常行驶。深度学习关键就在不需要辨识每样东西,而是知道怎样是安全驾驶,然后自己做决策。
另外一个重要部分是,Drive.ai 打造了一个模拟器,可以模拟各种场域,比如自行车抢道等,检查学习引擎怎么处理这些情况。这个模拟器是 7×24 小时运转,所以相当于车一直在虚拟世界的道路上进行各种测试。在真实世界里,身为最早拿到加州自动驾驶汽车上路测试许可证的创业公司之一,Drive.ai 也已让自家无人车在山景城城区上路测试 9 个月了,没有发生任何事故。
另一个关键点是,利用于深度学习的自动驾驶系统可以摆脱昂贵硬件。和特斯拉与 Waymo 的“天价”自订感测器不同, Drive.ai 使用商业化的低成本硬件,包括激光雷达、雷达和相机,深度学习系统会同步所有感测器资料,基于这些资讯做最明智的决策,避免单点导致的误判。这样即使其中一个失灵,别的感测器也可以正常工作。
正是感测器的多余设计,才让他们完成了雨夜开车的成就──即使雨水挡住相机,但其他感测器让汽车仍然安全地自动驾驶。
由于感测器会将资讯传给软件系统的人工智能神经网络,这些神经网络系统可在普通计算硬件上执行,所以这让他们的解决方案成本大大降低。
“我们的改装方案并不贵,且可以适应各类汽车,无论汽车、货车、卡车或高尔夫车都行。我们可以在一周内就登陆一个新的汽车平台。而且由于我们在为机器应用打造规模化神经网络的专长,只需要其他自动驾驶汽车计算资源的一部分,就能让自驾车执行。每台车需要的处理器资源差不多是一台家用电脑的 30% 而已。”Sameep Tandon 说。
大部分自驾车都需要精确到公分的高精确度地图,进行感知、搞清楚汽车开向哪里,这样做的结果就是需要持续更新地图,这非常昂贵且危险。深度学习让 Drive.ai 的自驾车比对地图上的物体和真实环境,像车道、人行道这类东西,所以即使环境改变了,汽车也能适应。
史丹佛整个人工智能实验室成员跑来创业
为什么 Drive.ai 可以做到这一点?这要从团队的成员背景开始说。虽然Drive.ai 才成立不到两年,但早在 4、5 年前,团队创始人就已在史丹佛的人工智能实验室,开始怎么把深度学习系统规模化的研究。
没错,团队核心成员都来自深度学习界鼎鼎大名的吴恩达实验室。两年前,由于发现深度学习在无人驾驶上的机会,实验室 6 个人全都暂停博士学业,一起成立这家公司。所以,在一些公司有一两位深度学习专才就很稀有时,这个团队已把史丹佛人工智能实验室都搬空了……
“自动驾驶非常难,如果只是一个人很难做好,所以我们决定大家一起做好了。”联合创始人兼 CEO Sameep Tandon 说。“我们那时和很多汽车公司聊过,发现自己有这么棒的技术,所以等不及毕业了。”
Tandon说,团队很早就开始做非常基础的研究,比如资料标记等,是最棒的深度学习团队之一。当他们还在史丹佛,就打造过世界最大的神经网络。当时 Google 用1,000 台机器在 Google Brain 专案里做了一个实验,结果他们只用 16 GPU 机器就重现了这个效果,只花十分之一的成本。所以 Tandon 很有底气的说,他不知道其他号称深度学习的公司有些什么核心技术,但他们绝对是世界最好的深度学习团队之一。
在低调研发两年后,Drive.ai 现在认为自家在 L4 级无人驾驶的研究上已到一定阶段,希望进一步搜寻合作伙伴,把技术带到更多汽车上。联合创始人 Carol Reiley 告诉我们,Drive.ai 和 OEM 商关系很亲密,也希望获得汽车制造商的支援。“我们不生产车和感测器,我们只提供解决方案。现在希望先从商务车队开始合作,包括包裹运送、食物运送、零售等。我们希望和伙伴一起先做到 L4 程度,提高定位准确性,一起收集资料,然后不断向外拓展,最终向消费者层级的 L5 级前进。”
“深度学习做为人工智能的一种领先方法,可以教机器如何像人类思考,这就是无人驾驶的关键。在这个基础上,打造一个可延伸、适用广泛、安全的平台,就是我们做的事。我们相信,无论安全性还是效率方面,自动驾驶会整个颠覆交通系统。”Sameep Tandon 说。
(本文由 PingWest 授权转载,首图来源:Drive.ai)
延伸阅读:
- 这家神秘的创业公司,选在“雨夜”挑战自动驾驶