自动驾驶决策规划研究综述录标题
摘要
实时进行路径规划是车辆能够实现自动驾驶的重要功能之一,自动驾驶车辆面对的交通场景多而复杂,因此如何根据感知层得到的车辆周边的障碍物、车流、人流信息规划出一条安全、驾乘舒适、平滑的路径是自动驾驶领域的经典难题,而服务于自动驾驶的决策规划也在近年来受到了学术界和工业界越来越多的关注。本文对该领域主要研究进展进行了综述。首先,介绍自动驾驶决策规划模块的重要作用。其次介绍规划与决策分层次的结构,以及每个层次的重要算法。最后总结实际自动驾驶的决策规划模块的典型问题,并展望这个方向的研究趋势。
关键词:自动驾驶;感知决策;路径规划;层次结构
一、自动驾驶决策感知的介绍和重要意义
决策规划是自动驾驶的核心技术,决策感知的主要任务就是要基于感知模块感知到的车辆周边状态,找到一条安全的,乘客乘坐体验舒适的,平滑的的路径,交给控制模块执行。形象的讲,决策规划就是自动驾驶的大脑。大脑在接收到传感器的各种感知信息之后,对当前环境作出分析,然后对底层控制模块下达指令。
在现有的决策和规划框架中,有两种主要系统:基于规则的决策和基于学习的决策和计划方案。基于规则的决策利用驱动规则和专家知识来确定最优逻辑行为,其代表性方法是有限状态机(FSM)[6]和马尔可夫决策过程(MDP)[8],[9]。基于学习的方法利用不同的网络结构,根据环境生成具有最佳回报的最优策略。各种基于学习的方法,如强化学习都很受欢迎。
二、自动驾驶感知决策的层次结构
一般来说,决策规划模块可以分为三个层次结构:全局路径规划,行为决策,运动规划
1全局路径规划
全局路径规划(Route Planning)在接收到一个给定的行驶目的地之后,结合地图信息,生成一条全局的路径,作为为后续具体路径规划的参考;全局规划需要我们知道目的地,是一种长期的规划,更关心高层的信息,不太关心很细枝末节上的决策。全局规划的本质是一种搜索,在优化领域就是给定约束下的最小化问题。
全局路径规划是指在给定车辆当前位置与终点目标后,通过搜索选择一条最优的路径,这里的“最优”包括路径最短,或者到达时间最快等条件。这一过程类似于我们生活中经常用到的“导航”功能,区别在于自动驾驶中使用的高精地图与我们常见的地图不太一样,在高精地图中包含了每条车道在内的更多信息。常见的全局路径规划算法包括Dijkstra和A算法,以及在这两种算法基础上的多种改进。Dijkstra算法[3]和A算法[4]也是在许多规划问题中应用最为广泛的两种搜索算法。
解决全局优化常见的代表算法有:Dijkstra、A、MDP。Dijkstra是一种广度优先搜索,因为每个节点都要探寻,所以搜索会慢;而A*及其各种衍生算法是一种启发式算法,搜索过程会朝着目的点前进,避免了一些无谓的搜索;MDP是强化学习的思路,构建环境和奖励系统,让运动对象吃亏上当后,学会精致利己,沿着目标点前进。
1.1Dijkstra算法:
Dijkstra算法是由计算机科学家Edsger W. Dijkstra在1956年提出,用来寻找图形中节点之间的最短路径。在Dijkstra算法中,需要计算每一个节点距离起点的总移动代价。同时,还需要一个优先队列结构。对于所有待遍历的节点,放入优先队列中会按照代价进行排序。在算法运行的过程中,每次都从优先队列中选出代价最小的作为下一个遍历的节点。直到到达终点为止。
Dijkstra算法的优点是:给出的路径是最优的;缺点是计算时间复杂度比较高(O(N2)),因为是向周围进行探索,没有明确的方向。
1.2 A*算法
为了解决Dijkstra算法的搜索效率问题,1968年,A算法由Stanford研究院的Peter Hart, Nils Nilsson以及Bertram Raphael发表,其主要改进是借助一个启发函数来引导搜索的过程。具体来说,A算法通过下面这个函数来计算每个节点的优先级:
其中:
f(n) 是节点n的综合优先级。当我们选择下一个要遍历的节点时,我们总会选取综合优先级最高(值最小)的节点。
g(n)是节点n距离起点的代价。
h(n) 是节点n距离终点的预计代价,这也就是A*算法的启发函数。
1.3马尔科夫算法
马尔可夫过程(简称为马氏过程)是最经典、也是应用最为广泛的一类随机过程。关于马尔可夫性的严格定义是需要一定现代概率论的基础的,涉及到有关于事件域、流、条件数学期望、自然事件域等数学概念。一般而言,面向工科及应用数学专业的《应用随机过程》中也不会涉及马氏过程的严谨定义,只有在数学专业的《随机过程》中才能找到其严谨定义。在这里,我们不详细赘述马氏过程的严谨定义,而只是介绍其直观的含义:对于一个马氏过程, 的分布只和 的取值有关,和 前面发生过的事情无关。这也就是说, 。我们可以想象,初始值是
X
1
X_1
X1是一个随机变量,服从某个初始分布。而 的取值决定了 的分布, 的取值又决定了 的分布,以此类推, 的取值决定了 的分布……马氏过程就在这种一环扣一环的因果关系中形成了。
2行为决策(行为预测)
在确定全局路径之后,自动驾驶车辆需要根据具体的道路状况、交通规则、其他车辆与行人等情况作出合适的行为决策。
自动驾驶的场景是成千上万的,并且会受到周边车主的影响,不同的驾驶者相互影响,而为了进行路径规划就需要对环境中的其它参与者的行为进行预测;而且感知模块难以做到对周边环境的完全感知,所以对自动驾驶车辆周边环境进行预测是十分有必要的。
而行为决策(行为预测)的模型分为四类:
2.1有限状态机模型
自动驾驶车辆最开始的决策模型为有限状态机模型,车辆根据当前环境选择合适的驾驶行为,如停车、换道、超车、避让、缓慢行驶等模式,状态机模型通过构建有限的有向连通图来描述不同的驾驶状态以及状态之间的转移关系,从而根据驾驶状态的迁移反应式地生成驾驶动作。
有限状态机模型因为简单、易行,是无人驾驶领域目前最广泛的行为决策模型,但该类模型忽略了环境的动态性和不确定性,此外,当驾驶场景特征较多时,状态的划分和管理比较繁琐,多适用于简单场景下,很难胜任具有丰富结构化特征的城区道路环境下的行为决策任务。
2.2 决策树
决策/行为树模型和状态机模型类似,也是通过当前驾驶状态的属性值反应式地选择不同的驾驶动作,但不同的是该类模型将驾驶状态和控制逻辑固化到了树形结构中,通过自顶向下的“轮询”机制进行驾驶策略搜索。这类决策模型具备可视化的控制逻辑,并且控制节点可复用,但需要针对每个驾驶场景离线定义决策网路,当状态空间、行为空间较大时,控制逻辑将比较复杂。另外,该类模型同样无法考虑交通环境中存在的不确定性因素。
2.3基于知识的推理决策
基于知识的推理决策模型由“场景特征-驾驶动作”的映射关系来模仿人类驾驶员的行为决策过程,该类模型将驾驶知识存储在知识库或者神经网络中,这里的驾驶知识主要表现为规则、案例或场景特征到驾驶动作的映射关系。进而,通过“查询”机制从知识库或者训练过的网络结构中推理出驾驶动作。
该类模型主要包括:基于规则的推理系统、基于案例的推理系统和基于神经网络的映射模型。
该类模型对先验驾驶知识、训练数据的依赖性较大,需要对驾驶知识进行精心整理、管理和更新,虽然基于神经网络的映射模型可以省去数据标注和知识整合的过程,但是仍然存在以下缺点:
其“数据”驱动机制使得其对训练数据的依赖性较大,训练数据需要足够充分;
将映射关系固化到网络结构中,其解释性较差;
存在“黑箱”问题,透明性差,对于实际系统中出现的问题可追溯性较差,很难发现问题的根本原因。
2.4基于价值的决策模型
根据最大效用理论,基于效用/价值的决策模型的基本思想是依据选择准则在多个备选方案中选择出最优的驾驶策略/动作。
为了评估每个驾驶动作的好坏程度,该类模型定义了效用(utility)或价值(value)函数,根据某些准则属性定量地评估驾驶策略符合驾驶任务目标的程度,对于无人驾驶任务而言,这些准则属性可以是安全性、舒适度、行车效率等,效用和价值可以是由其中单个属性决定也可以是由多个属性决定。
澳大利亚格里菲斯大学的Furda和Vlacic提出了多准则决策方法从候选动作集中选择最优的驾驶动作;新加坡国立大学的Bandyopadhyay等人提出了基于POMDP的行为决策模型,用以解决存在感知不确定性的情况;卡内基梅隆大学的Wei J等人提出基于PCB(Prediction and-Cost-function Based)的行为决策模型,其侧重点在于如何构建恰当的代价函数来指导对环境的预测;为了解决在多智能体参与的复杂环境中的决策问题,许多基于博弈论的模型也被研究者用来推理车辆之间的交互行为,;此外,因为在特征提取方面的优势,深度强化学习技术也开始被广泛应用,以完成最优驾驶动作的生成。
3运动规划
在确定具体的驾驶行为之后,我们需要做的是将“行为”转化成一条更加具体的行驶“轨迹”,从而能够最终生成对车辆的一系列具体控制信号,实现车辆按照规划目标的行驶。这一过程称为运动规划(Motion Planning),运动规划的概念在机器人领域已经有较长时间的研究历史,我们可以从数学的角度将它看做如下的一个优化问题
在以机器人为代表的许多场景中,我们可以认为周围的环境是确定的。在这种情况下,所谓的路径规划,是指在给定的一个状态空间Χ,寻找一个满足一定约束条件的映射σ:[0,1]➞Χ,这些约束包括:
确定的起始状态以及目标点所在的区域
避免碰撞
对路径的微分约束(例如在实际问题中路径曲率不能太小,对应于其二阶导数的约束)
该优化问题的目标泛函定义为J(σ),其具体意义可以表示为路径长度、控制复杂度等衡量标准。
然而在自动驾驶问题中,车辆周围的环境是持续动态变化的,因此单纯的路径规划不能给出在行驶过程中一直有效的解,因此我们需要增加一个维度——时间T,相应的规划问题通常被称为轨迹规划。
时间维度的增加为规划问题带来了巨大的挑战。例如,对于一个在2D环境中移动一个抽象为单点的机器人,环境中的障碍物近似为多边形的问题。路径规划问题可以在多项式时间内求解,而加入时间维度的轨迹规划问题已经被证明是NP-hard问题。
在自动驾驶的实际场景中,无论是对车辆本身还是对周围环境,建立更为精确的模型意味着对优化问题更为复杂的约束,同时也意味着求解的更加困难。因此实际采用的算法都是建立在对实际场景的近似前提下,在模型精确性和求解效率二者之间寻求一个最佳的平衡点。
下文对自动驾驶领域目前常见的几类运动规划算法分别进行介绍,在实际中,往往是其中几类思想的结合才能最终达到比较好的规划结果,并满足更多的不同场景。
时间维度的增加为规划问题带来了巨大的挑战。例如,对于一个在2D环境中移动一个抽象为单点的机器人,环境中的障碍物近似为多边形的问题。路径规划问题可以在多项式时间内求解,而加入时间维度的轨迹规划问题已经被证明是NP-hard问题。
在自动驾驶的实际场景中,无论是对车辆本身还是对周围环境,建立更为精确的模型意味着对优化问题更为复杂的约束,同时也意味着求解的更加困难。因此实际采用的算法都是建立在对实际场景的近似前提下,在模型精确性和求解效率二者之间寻求一个最佳的平衡点。
下文对自动驾驶领域目前常见的几类运动规划算法分别进行介绍,在实际中,往往是其中几类思想的结合才能最终达到比较好的规划结果,并满足更多的不同场景。
3.1基于搜索的规划算法
解决运动规划问题的另一大类算法是启发性搜索算法,其基本思想是将状态空间通过确定的方式离散成一个图,然后利用各种启发式搜索算法搜索可行解甚至是最优解.这类算法具有解析完备性,甚至是解析最优性,该种类别算法现已比较成熟
基于搜索的算法的基础是状态格子,状态格子[21]是一种对状态空间离散化的手段,状态格子由结点(表示状态)和从该结点出发到达相邻结点的运动基元组成,一个状态结点可以通过其运动基元变换到另一个状态结点.这样,状态格子就将原来连续的状态空间转化为一个搜索图,运动规划问题就变成了在图中搜索出一系列将初始状态变换到目标状态的运动基元构建起状态格子后就可以使用图搜索算法来搜索最优轨迹
在将状态空间栅格化之后,我们就可以使用前文已经介绍的Dijkstra、A*搜索算法,完成最终的规划。然而在实际复杂环境中,栅格数目众多,并且环境随时间动态变化,会导致搜索结点过多,因此发展出了多种改进算法,用以处理不同的具体场景:
Dijkstra算法遍历整个构型空间,找出每两个格子之间的距离,最后选择出发点到目标点的最短路径,其广度优先的性质导致效率很低,在该算法的基础上加入启发式函数,即所搜索结点到目标节点的距离,并以此为基础再次进行搜索可避免全局搜索带来的效率低下,这即为A*算法
1) Hybrid A* 算法,
在A*算法的基础上考虑了车的最大转向问题,例如限定计算的路径上车最大转向不超过5°。该算法目前的应用场景有车掉头(Stanford 参加DARPA 挑战赛使用的Junior车采用了该算法进行uturn),泊车等等对方向盘控制要求较高的场景。
2)D、DLite算法
事先由终点向起点进行搜索,使用Dijkstra算法,存储路网中目标点到每个点的最短路径长度k, 和该节点到目标点的实际长度值h,开始情况下 kh, 并且存储每个节点的上一个节点,保证能够沿着链接走下去。
计算结束后,获取了一条当时最优路径。当车行驶到某个节点时,通过传感器发现该节点已经无法通行(有障碍物),则对已存储的路网信息一些相关点的h值进行修改(变大),选择一个邻居点满足仍然hk的,即仍然是最优路径上的点,作为下一个点。
然后走到终点。该类算法适用于在未知环境中的导航以及路径规划,广泛用于目前各种移动机器人和自主车辆载具,例如“机遇号”和“勇气号”火星车。
3.2基于采样的算法
通过对连续的状态空间进行采样,从而将原问题近似成一个离散序列的优化问题,这一思路也是在计算机科学中应用最为广泛的算法。在运动规划问题中,基于采样的基本算法包括概率路线图(PRM)和快速搜索随机树(RRT)算法。
1)基本算法:概率路线图(PRM)
预处理阶段:对状态空间内的安全区域均匀随机采样n个点,每个采样点分别与一定距离内的邻近采样点连接,并丢弃掉与障碍物发生碰撞的轨迹,最终得到一个连通图。
査询阶段:对于给定的一对初始和目标状态,分别将其连接到已经构建的图中,再使用搜索算法寻找满足要求的轨迹。
容易看出,一旦构建一个PRM之后,可以用于解决不同初始、目标状态的运动规划问题,但是这个特性对于自动驾驶运动规划而言是不必要的。另外PRM要求对状态之间作精确连接,这对于存在复杂微分约束的运动规划问题是十分困难的。
2) 基本算法:快速搜索随机树(RRT)
树的初始化:初始化树的结点集和边集,结点集只包含初始状态,边集为空。
树的生长:对状态空间随机采样,当采样点落在状态空间安全区域时,选择当前树中离采样点最近的结点,将其向采样点扩展(或连接)。若生成的轨迹不与障碍物发生碰撞,则将该轨迹加入树的边集,该轨迹的终点加人到树的结点集。
RRT是一种增量式采样的搜索方法,无须设置任何分辨率参数。在极限情况,该搜索树将稠密的布满整个空间,此时搜索树由很多较短曲线或路经构成,以实现充满整个空间的目的。
3.3直接优化方法
在绝大多数情况下,不考虑高度的变化,自动驾驶的轨迹规划问题是一个三维约束优化问题(2D空间+时间T),因此,我们可以采用解耦的策略,将原始问题分解为几个低维问题,从而大大降低求解难度。
3.4 参数化曲线构造法
人工势场法是受物理学中电磁场的启发,假设障碍物和目标位置分别产生斥力和引力,从而可以沿着势场的最速梯度下降去规划路径。这类方法的一个关键问题是如何选择合适的势场函数,例如:Stephen Waydo使用流函数进行平滑路径的规划[20],Robert Daily在高速车辆上提出谐波势场路径规划方法[21]。在简单场景下,人工势场法具有较高的求解效率,但其存在的最大问题是可能陷入局部最小值,在这种情况下,所获得的路径不是最优,甚至可能找不到路径。
3.5 人工势场法
人工势场法是受物理学中电磁场的启发,假设障碍物和目标位置分别产生斥力和引力,从而可以沿着势场的最速梯度下降去规划路径。这类方法的一个关键问题是如何选择合适的势场函数,例如:Stephen Waydo使用流函数进行平滑路径的规划[20],Robert Daily在高速车辆上提出谐波势场路径规划方法[21]。在简单场景下,人工势场法具有较高的求解效率,但其存在的最大问题是可能陷入局部最小值,在这种情况下,所获得的路径不是最优,甚至可能找不到路径。
4 决策规划现在存在的典型问题
1) 如何实现安全无碰撞的运动规划适用于高速环境中的车辆障碍;
2) 如何平衡长期之间的关系决策和短期规划,以改善效率
3) 如何制定决策和规划模块紧密集成以实现反应式规划和规划
4)最优化问题
全局最优是NP-hard问题[3],为了实时性,行业内多数采用横纵向解耦的规划方法。但是这么做会牺牲最优性,在一些工况下不能得到良好的车辆行为,比如超车[2]、对向来车、向心加速度约束处理、横向规划需要考虑纵向规划能力等。
例如,当自动驾驶主车(Autonomous Driving Car,ADC)前方有一个减速行驶的车辆时,横纵向解耦的方法一般只有当前方车辆车速降低到一定值时才会超车行驶。ADC的行为表现就是先减速甚至停车,然后再绕障行驶,这显然不是最优的行驶策略。
如果采用时空一体化规划方法,则可以避免减速或者停车行为。下图中左图是解耦方法的示例,在前方有减速停车车辆时,ADC会进行减速。右图是时空规划的示例,在前方车辆减速时ADC会进行超车。
5)认知推理问题
以Apollo为例,PNC Map模块从HD Map模块提取数据形成参考线,并且通过HD Map模块的API接口查询道路元素。但Motion Planning模块会忽略了一些道路的拓扑关系,例如汇入汇出路口,而这些特殊的道路拓扑是会影响到车辆的行为。
此外,在没有HD Map模块而单纯依靠视觉车道线的情况下,此时感知车道线会发生异常。在汇入汇出道路和十字路口道路中,其道路拓扑问题尤为凸显。
存在感知定位预测不确定性
5 自动驾驶研究展望
在工业界:
轻舟智航采用了时空联合规划解决最优性问题,提高规划性能,并且自研了非线性规划器高效求解[2]。
图森未来新一代框架中,感知模块在提供障碍物位置、速度等信息时,同时提供不确定性或者概率信息,以保证决策规划可以提前做出安全舒适的决策[13]。
特斯拉将planner用于交通参与者的其他车辆。但与其他车辆交互时,不能只为ADC规划,而是要为所有交通参与者共同规划,针对整体场景的交通流进行优化。为了做到这一点,会为场景中的每个参与对象都运行autopilot规划器。除此之外,针对停车场景,采用A搜索算法和神经网络结合策略,大大减少了A算法的节点探索[15]。
小鹏和特斯拉针对车道线缺失,道路拓扑变化问题做了优化[14]。
Waymo提出了ChauffeurNet用于提升决策性能[16],Apollo借鉴ChauffeurNet提出了自己的强化学习架构[17]。
本文的主要参考文章也提出来自己的思考:
1)与车辆动力学结合:将动力学参数评价指标和最优规划等结合,从最优控制角度进行规划是近年采用较多的方法,在这个过程中可以充分考虑车辆动力学因素,规划出的轨迹更加合理。例如采用模型预测控制理论(Model Predictive Control)。其不足在于:对车辆的约束越多,优化其轨迹的难度越大,较难实现在线的实时计算。
2)与状态参数估计结合:状态参数估计可以更加准确获得车辆参数,因此可以将状态估计器加入规划模块中,通过在线估计车辆状态并将其反馈给规划器,提高轨迹质量。例如:不同地面类型会引起车辆滑移特性的变化,进而影响车辆状态,通过结合估计参数实时重新规划轨迹,闭环规划从而提高轨迹安全性。
3)与机器学习结合:随着以神经网络为代表的人工智能的快速发展,许多传统的规划问题也带来了新的解决思路。在自动驾驶领域,其发展趋势包括:
端到端模型:使用一个深度神经网络,直接根据车辆状态和外部环境信息得出车辆的控制信号。尽管目前的端到端模型存在类似“黑箱”的不可解释性,但相信随着人类对深度神经网络理解的不断加深,这一方法因其突出的简洁高效优势而具有很强的发展潜力
4)决策与运动规划模块融合
6参考文献
1]李嘉嘉. 自动驾驶车辆自主变道决策与规划问题研究[D].吉林大学,2022.DOI:10.27162/d.cnki.gjlin.2022.004324.
[2]唱寰. 冰雪环境下智能驾驶汽车决策规划算法研究[D].吉林大学,2022.DOI:10.27162/d.cnki.gjlin.2022.006675.
[3]曹轩豪. 自动驾驶汽车跟驰换道运动控制与决策规划研究[D].吉林大学,2022.DOI:10.27162/d.cnki.gjlin.2022.001243.
[4]魏文博. 面向园区典型场景的自动驾驶决策规划方法研究与应用[D].电子科技大学,2022.DOI:10.27005/d.cnki.gdzku.2022.002135.
[5]彭涛,方锐,刘兴亮,王海玮,庞彦伟,许洪国,刘福聚,王涛.基于典型事故场景的雪天高速换道自动驾驶策略研究[J/OL].吉林大学学报(工学版):1-11[2022-10-23].DOI:10.13229/j.cnki.jdxbgxb20210267.
[6]段续庭,周宇康,田大新,郑坤贤,周建山,孙亚夫.深度学习在自动驾驶领域应用综述[J].无人系统技术,2021,4(06):1-27.DOI:10.19942/j.issn.2096-5915.2021.6.051.
[7]邢星宇,吴旭阳,刘力豪,陈君毅,余卓平.基于目标优化的自动驾驶决策规划系统自动化测试方法[J].同济大学学报(自然科学版),2021,49(08):1162-1169.
[8]周波波. 基于深度学习的自动驾驶汽车主动换道决策与轨迹规划研究[D].重庆大学,2021.DOI:10.27670/d.cnki.gcqdu.2021.001915.
[9]刘卅. 面向信任增强的智能驾驶决策算法优化[D].浙江大学,2021.DOI:10.27461/d.cnki.gzjdx.2021.001111.
[10]金浙. 非交叉路段智能车决策规划算法研究[D].吉林大学,2021.DOI:10.27162/d.cnki.gjlin.2021.006853.
[11]刘杰. 车联网中分布式智能决策研究[D].北京邮电大学,2021.DOI:10.26969/d.cnki.gbydu.2021.001163.
[12]周润发. 融合动态场景信息和DDPG算法的智能车决策规划方法研究与应用[D].电子科技大学,2021.DOI:10.27005/d.cnki.gdzku.2021.001853.
[13]黄辉. 基于驾驶员行为学习的自动驾驶车辆换道决策与轨迹规划研究[D].重庆交通大学,2021.DOI:10.27671/d.cnki.gcjtc.2021.000107.
[14]白正伟. 基于深度强化学习的网联自动驾驶车辆决策控制方法[D].北京交通大学,2020.DOI:10.26944/d.cnki.gbfju.2020.003150.
[15]汪晓. 动态交通环境下自动驾驶汽车换道决策与轨迹规划研究[D].重庆大学,2020.DOI:10.27670/d.cnki.gcqdu.2020.002436.
[16]吕维. 基于深度增强学习的智能车安全并道决策研究[D].电子科技大学,2019.
[17]张韬. 车载雷达局部路径基准预警算法研究[D].河北工业大学,2017.
[18]罗玉涛,石紫娴,梁伟强.基于改进人工势场的无人驾驶动态规划算法研究[J/OL].中国公路学报:1-21[2022-10-23].http://kns.cnki.net/kcms/detail/61.1313.U.20220905.1616.002.html
[19]刘延东. 基于自主学习的自动驾驶决策与控制研究[D].中国科学院大学(中国科学院深圳先进技术研究院),2022.DOI:10.27822/d.cnki.gszxj.2022.000022.
[20]彭涛,方锐,刘兴亮,王海玮,庞彦伟,许洪国,刘福聚,王涛.基于典型事故场景的雪天高速换道自动驾驶策略研究[J/OL].吉林大学学报(工学版):1-11[2022-10-23].DOI:10.13229/j.cnki.jdxbgxb20210267.
[21]梁艺潇. 智能汽车纵横向运动控制与决策-规划-控制集成方法研究[D].重庆大学,2021.DOI:10.27670/d.cnki.gcqdu.2021.000072.
[22]CSDN博主「傅一一」的原创文章 原文链接:https://blog.csdn.net/weixin_42317626/article/details/112097284
[23] 自动驾驶决策规划中的问题与挑战https://baijiahao.baidu.com/s?id=1745860357547883052&wfr=spider&for=pc
版权归原作者 天马云间 所有, 如有侵权,请联系我们删除。