摘要: 得益于深度学习和人工智能领域的进步,自动驾驶技术在过去十年中快速发展。本文调查研究了无人驾驶汽车领域使用的最新深度学习技术。我们首先介绍基于 AI 的无人驾驶汽车决策系统和卷积神经网络。这些方法构成了路径规划和行为仲裁算法的基础。本次调查研究提供的比较有助于深入了解深度学习和人工智能方法在自动驾驶方面的优势和局限性,有助于路径规划算法的设计选择。
列入沧州市科技技术局项目《基于深度学习的无人驾驶汽车路径规划研究》,项目编号:204102018
1 简介
在过去十年的过程中,深度学习和人工智能在计算机视觉、机器人技术和自然语言处理 (NLP) 等技术中得到了广泛应用。它们还对无人驾驶汽车产生了重大影响。无人驾驶汽车已开始从在实验室开发和测试转移到在公共道路上行驶和应用。无人驾驶汽车在实际场景中的应用减少了道路事故和交通拥堵,并改善了我们在过度拥挤的城市中的流动性。 无人驾驶将
驾驶的任务完全交给机器,也叫自动驾驶。“自动驾驶”这个名称看似不言自明,但实际上有五个 SAE Level 用于定义自动驾驶。 SAE J3016 标准 [1] 引入了从 0 到 5 的等级,用于对车辆自动化进行分级。较低的 SAE 级别具有基本的驾驶员辅助功能,而较高的 SAE 级别则适用于不需要任何人工交互的车辆。 5 级类别的汽车不需要人工输入,通常甚至没有方向盘或脚踏板。
虽然大多数驾驶场景可以通过经典的感知、路径规划和运动控制方法相对简单地解决,但其余未解决的场景是传统方法失败的极端情况。
1994 年,VaMP 无人驾驶汽车成功行驶 1,600 公里,其中 95% 是自动驾驶。自动驾驶的另一个重要里程碑是 2004 年和 2005 年的 DARPA 大挑战赛以及 2007 年的 DARPA 城市挑战赛。比赛的目标是让无人驾驶汽车在没有人工干预的情况下尽可能快地在越野路线上行驶。Stanley 是 2005 年比赛的获胜者,他利用机器学习技术在非结构化环境中导航。这是自动驾驶汽车发展的一个转折点,承认机器学习和人工智能是自动驾驶的核心组成部分。
在本论文中,我们研究了自动驾驶中使用的人工智能和深度学习技术,并提供了应用于自
动驾驶汽车的最先进的深度学习和人工智能方法。
2 基于深度学习的无人驾驶汽车决策架构
无人驾驶汽车是自主决策系统,可处理来自不同车载资源的观测流,例如摄像头、雷达、激光雷达、超声波传感器、GPS单元和/或惯性传感器。汽车的计算机使用这些观察结果来做出驾驶决定。驾驶决策可以通过模块化感知-规划-动作管道或端到端学习方式来计算,其中感官信息直接映射到控制输出。模块化管道的组件可以基于 AI 和深度学习方法进行设计,也可以使用经典的非学习方法进行设计。
这些组件是:
• 感知和定位;
• 高级路径规划;
• 行为仲裁,或低级路径规划;
• 运动控制器。
给定通过道路网络规划的路线,自动驾驶汽车的首要任务是在周围环境中了解和定位自己。基于这种表示,规划了一条连续的路径,并且汽车的未来动作由行为仲裁系统确定。最后,运动控制系统反应性地纠正在计划运动的执行中产生的错误。
在这四个高级组件,我们选取高级路径规划和行为仲裁两个组件作为本文的研究对象。我们将介绍无人驾驶中高级路径规划和行为仲裁两个组件使用的深度学习和人工智能技术。
3 深度卷积神经网络
卷积神经网络(Convolutional Neural Networks,CNN)主要用于处理空间信息,例如图像,可以看作是图像特征提取器和通用非线性函数逼近器。在深度学习兴起之前,计算机视觉系统过去常常基于人工设计的特征来实现,例如 HAAR [2]、局部二进制模式[3] 或定向梯度直方图 (HoG) [4]。与这些传统的人工设置的特征相比,卷积神经网络能够自动学习训练集中对特征空间的编码表示。
CNN 可以粗略地理解为对哺乳动物视觉皮层不同部分的非常近似的类比。在视网膜上形成的图像通过丘脑发送到视觉皮层。每个大脑半球都有自己的视觉皮层。视觉信息以交叉的
方式被视觉皮层接收:左视觉皮层接收来自右眼的信息,而右视觉皮层接收来自左眼的视觉数据。根据双通量理论处理信息 [5],该理论指出视觉流遵循两个主要通量:腹侧通量,负责视觉识别和对象识别,以及背侧通量,用于建立对象之间的空间关系。CNN 模拟腹侧通量的功能,其中大脑的不同区域对视野中的特定特征敏感。视觉皮层中较早的脑细胞被视野中的急剧转变激活,就像边缘检测器突出图像中相邻像素之间的急剧转变一样。这些边缘在大脑中进一步用于近似对象部分,并最终估计对象的抽象表示。
1.
用于路径规划和行为仲裁的深度学习
无人驾驶汽车在两点之间到路线的能力,即起始位置和期望位置,代表了路径规划。根据路径规划过程,无人驾驶汽车应考虑周围环境中存在的所有可能障碍物,并计算出沿无碰撞路线的轨迹。无人驾驶是一种多智能体设置,其中车辆在超车、让路、合并、左转和右转时必须与其他道路使用者应用复杂的谈判技巧,同时在非结构化的城市道路上行驶。
无人驾驶汽车的最优路径规划这一新兴主题应该以高计算速度运行,以获得较短的反应时
间,同时满足特定的优化标准。接下来,我们讨论两种最具代表性的路径规划深度学习范式,即模仿学习(Imitation Learning,IL)[6]和基于深度强化学习(Deep Reinforcement Learning,DRL)的规划 [7]。
模仿学习的目标是从记录的驾驶经验中学习人类驾驶员的行为。该策略暗示了人类示范性的车辆教学过程。例如,NeuroTrajectory [6] 是一个感知规划深度神经网络,它在有限的预测范围内学习 egovehicle 的期望状态轨迹。模仿学习也可以被定义为逆强化学习(IRL)问题,其目标是从人类驾驶员那里学习奖励函数。这种方法使用真实的驾驶员行为来学习奖励功能并生成类似人类的驾驶轨迹。
通用自动驾驶汽车用于路径规划的 DRL 主要处理在模拟器中学习驾驶轨迹。基于传输模型,将真实环境模型抽象并转换为虚拟环境。但此模型存在目标函数不能确保功能安全的同时不引起严重的偏差问题。针对这个问题提出的解决方案是构建一个由可学习部分和不可学习部分组成的策略函数。可学习策略试图最大化奖励功能(包括舒适、安全、超车机会等)。同时,不可学习的策略遵循功能安全的硬约束,同时保持可接受的舒适度。
用于路径规划的 IL 和 DRL 都有优点和缺点。 IL 的优势在于它可以使用从现实世界收集的
数据进行训练。然而,这些数据在极端情况下(例如驾驶偏离车道、车辆碰撞等)很少,这使得经过训练的网络在面对看不见的数据时的反应不确定。另一方面,尽管 DRL 系统能够在模拟世界中探索不同的驾驶情况,但这些模型在移植到现实世界时往往会出现偏差。
1.
结论
无人驾驶汽车技术在过去十年中取得了飞速发展,特别是由于人工智能和深度学习领域的进步。现在,在为无人驾驶汽车设计不同的组件时,要么使用要么考虑当前的 AI 方法。深度学习方法不仅影响了传统感知-规划-行动管道的设计,而且还启用了端到端学习系统,能够将感官信息直接映射到转向命令。
本文对无人驾驶汽车路径规划和行为仲裁中使用的深度学习技术进行了研究。所研究的结果为基于深度学习的无人驾驶汽车的系统级设计提供参考。
参考文献:
1.
SAE Committee, “Taxonomy and Definitions for Terms Related to On-road Motor Vehicle Automated Driving Systems,” 2014.
2.
P. A. Viola and M. J. Jones, “Rapid Object Detection using a Boosted Cascade of Simple Features,” in 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 2001), with CDROM, 8-14 December 2001, Kauai, HI, USA, 2001, pp. 511–518.
3.
T. Ojala, M. Pietik¨ainen, and D. Harwood, “A Comparative Study of Texture Measures with Classification Based on Featured Distributions,” Pattern Recognition, vol. 29, no. 1, pp. 51–59, Jan. 1996.
4.
N. Dalal and B. Triggs, “Histograms of Oriented Gradients for Human Detection,” in In CVPR, 2005, pp. 886–893.
发布评论