基于采样的路径规划算法总结

路径规划算法大致可以分为两类,一类是基于搜索的规划,另一类就是本文将要涉及的基于采样的规划。一般而言,基于搜索的规划(如A*)通常是运行在栅格地图上的。当栅格的分辨率越高时,算法搜索的路径就会越优。

还有一类算法是基于采样的,主要就是RRT和它的变种算法。这类算法的核心在于随机采样,从父节点开始,随机在地图上生成子节点,连接父子节点并进行碰撞检测,若无碰撞,就扩展该子节点。就这样,不断地随机扩展样本点,直到生成一条连接起点和终点的路径。如下图所示,RRT算法的扩展图与盘根错节的树枝十分相似。

RRT算法是一种快速搜索算法,但是它却是以牺牲最优性为代价的。RRT算法搜索到的路径往往不是最优路径。为了解决这个问题,后来出现了RRT* ,使得RRT拥有了渐进最优的特性。如下图所示,随着节点数量的增加,RRT* 会不断地优化路径,最终趋近于最优。

虽然 RRT* 拥有了在理论上可以找到最优路径的能力,但这种向最优逼近的速度并不快。因此,为了提高 RRT* 的收敛速度,Informed-RRT* 出现了,提高了初始路径向最优路径的收敛速度。

Informed-RRT* 的主要思路是在于椭圆的一个特性:椭圆上的点到椭圆两个焦点的距离之和相同,而椭圆外的点到椭圆两个焦点的距离之和大于前者,内点则反之。

当Informed-RRT* 第一次找到一条可用路径时,就会根据该路径长度画出一个椭圆,该椭圆上的点到两焦点的距离就是该路径长度。因此,为了优化当前路径,算法只需要在该椭圆内扩展样本即可。每当找到一条更短路径,椭圆的范围也会随着变小,如下图所示。

本质上,Informed-RRT* 提供了一个向最优路径优化的方向,从而极大地提高它的收敛速度。这种优化方法使得RRT的样本不再是 均匀(uniform) 的随机扩展,而是 有偏向(bias) 的随机扩展。

下面是我会详细介绍RRT、RRT-CONNECT、RRT* 、Informed-RRT* 算法。算法是使用MATLAB实现的,程序源码放在这里。

1.RRT

关于RRT的编程实现比较简单,但我初次编程时仍然有很多需要注意的地方。首先理一理RRT的整体执行流程:

  1. 初始化节点扩展的步长stepstepstep。初始化VERTEX表格,该表格用于储存每次随机生成的且满足条件的节点,然后把起点加入到V表中;

  2. 以整张地图为范围,随机生成一组坐标,以此作为一个新节点vrandv_{rand}vrand​。然后根据V表,从中找到离vrandv_{rand}vrand​最近的节点作为它的父节点vnearestv_{nearest}vnearest​;

  3. 计算vrandv_{rand}vrand​与vnearestv_{nearest}vnearest​的距离,取与步长相比较后的最小值,防止两节点之间的距离过长;

    dist = min([norm(new_vertex-near_vertex),step_len]);  % 两节点之间的距离
    theta = atan2(new_node.ny-near_node.ny,new_node.nx-near_node.nx);  % 两节点之间的方向
    new_node.nx = near_node.nx + dist*cos(theta);
    new_node.ny = near_node.ny + dist*sin(theta);
    
  4. 对于edge(vrandv_{rand}vrand​, vnearestv_{nearest}vnearest​)进行碰撞检测,若满足要求,则将该节点加入到V表中。反之,则返回第二步;

  5. 判断vrandv_{rand}vrand​与终点的距离,若其小于步长并且之间无碰撞,则把终点加入到V表中,并设置vrandv_{rand}vrand​为终点的父节点,然后根据父节点提取出一条可行路径。反之,则返回第二步。

观察代码和可视化图像,可以发现,RRT算法并没有设置任何优化路径的程序。当RRT发现一条可连接起点与终点的可行路径时,就直接把这条路径作为最终解。也就是说,RRT只能找到一个可行解,但不保证该解就是最优解。

2.RRT-CONNECT

观察可视化图像,可以发现RRT的均匀采样(uniform sample)很没有效率,会把大部分的采样点放在无意义的区域。如果我们可以缩小这个区域,那么就可以极大提高算法寻径的效率,这也就是所谓的偏置采样(bias sample)。

RRT-CONNECT为了提高RRT算法的效率,做出了两点改进:

The method is based on two ideas: the Connect heuristic that attempts to move over a longer distance, and the growth of RRTs from both qinitq_{init}qinit​ and qgoalq_{goal}qgoal​.

  1. 采用贪婪策略进行采样,算法会尝试往距离更远的地方移动;
  2. 采用双向生长,即起点和终点均作为生长树的起点。

关于第一点可能比较难以理解。简单来说,因为该算法是双向生长的,当两个树的某两个节点之间存在可生长空间(即不会与障碍物碰撞)时,算法会优先在这两个节点之间扩展新节点。这样就可以让两个生长树快速相交。

这里主要说明RRT-CONNECT与RRT算法不同的地方。首先,由于前者是双向生长的,因此需要两个VERTEX表格,用于储存从起点和从终点扩展的节点。接下来,详细介绍RRT-CONNECT扩展节点的过程:

  1. 首先,在地图范围内随机确定一个节点vrandv_{rand}vrand​,然后找到新节点与V1表(从起点开始)中所有节点的最近节点作为vnearestv_{nearest}vnearest​;
  2. 由于刚开始V1表中只有起点,若两点之间无碰撞,则会从起点附近扩展出一个新节点vnewv_{new}vnew​(规范化距离后的vrandv_{rand}vrand​);
  3. 接下来,算法会从V2表(从终点开始)中找到与vnewv_{new}vnew​最近的节点vnew2v_{new2}vnew2​,同样V2表中只有终点,当两点无碰撞时,会从终点附近扩展出一个新节点vnew2v_{new2}vnew2​(规范化);
  4. 此时,算法判断节点vnewv_{new}vnew​与vnew2v_{new2}vnew2​之间存在可扩展的空间。于是不再随机扩展节点,而是从这两点之间扩展节点。具体操作就是以vnew2v_{new2}vnew2​为起点,朝vnewv_{new}vnew​的方向以一定步长扩展新节点vnew3v_{new3}vnew3​,若节点vnew2v_{new2}vnew2​与vnew3v_{new3}vnew3​之间仍然无碰撞,则继续扩展下一个节点,直到节点vnewv_{new}vnew​与vnewiv_{newi}vnewi​接触或与障碍物碰撞才结束这个贪婪扩展过程。

如下图,当节点扩展到vnew3v_{new3}vnew3​时,vnew3v_{new3}vnew3​与vnew2v_{new2}vnew2​之间与障碍物碰撞,故放弃节点vnew3v_{new3}vnew3​并结束贪婪扩展的过程。在第一次扩展结束后,交换两个V表的位置,即下一次扩展时把V1表的地方用V2表替换,把V2表的地方用V1表替换。如此反复,直到找到两个生长树相连。

3.RRT*

RRT-CONNECT通过贪婪生长和双向生长技术极大提高了RRT寻找可行路径的速度,但是仍然没有考虑如何去优化可行解。RRT* 弥补了这个问题,它使得RRT算法获得了渐进最优的能力,即随着采样点数量的增加,算法获得的路径会逐渐向最优路径靠拢。

RRT* 是如何实现这一功能的呢?

RRT* 考虑了每一个节点到起点的代价,代价越低就越可能被选择为路径节点。这种方式在基于搜索的路径规划中早已经被广泛使用了。RRT* 寻找初始路径的过程与RRT相同,区别在于前者找到初始路径后程序并没有结束,而是会继续生成采样点并不断更新初始路径。随着样本点的增加,初始路径会逐渐向最优路径靠近。

下面主要描述RRT* 优化初始路径的过程。

  1. 在地图上随机产生一个样本点vrandv_{rand}vrand​,找到最近点vnearestv_{nearest}vnearest​并经过碰撞检测后,算法会以vrandv_{rand}vrand​为圆心、以一定半径生成一个圆形区域,从V表中找到所有在该区域内的节点,若其通过碰撞检测,则将其作为vrandv_{rand}vrand​的相邻节点vnearv_{near}vnear​。关于半径的计算方式如下:
    r=min⁡(γRRT∗(ln⁡(card(V))card(V))1d,η)r = \min(\gamma_{RRT*} (\frac{\ln(card(V))}{card(V)})^{\frac{1}{d}}, \eta) r=min(γRRT∗​(card(V)ln(card(V))​)d1​,η)
    上式中,V表示节点集合,card(V)card(V)card(V)表示集合V的元素个数,也就是节点的数量。d表示构型空间的维数,由于路径规划是在二维空间寻径的,故d=2d=2d=2。η\etaη表示RRT的节点扩展步长,γRRT∗\gamma_{RRT*}γRRT∗​是一个系数。

  2. **从所有相邻节点中,为vrandv_{rand}vrand​找到一个父节点。**具体方式是先计算由相邻节点那条路径移动到vrandv_{rand}vrand​的代价,即从起点开始的代价(vstart→...→vnear→vrandv_{start} \rightarrow ... \rightarrow v_{near} \rightarrow v_{rand}vstart​→...→vnear​→vrand​)。然后,取最小代价的节点作为vrandv_{rand}vrand​的父节点,并且更新vrandv_{rand}vrand​的代价;

  3. **根据代价修剪(rewire)生长树。**仍然是对相邻节点操作,这次是从vrandv_{rand}vrand​开始。需要注意的是此时的vrandv_{rand}vrand​已经有父节点了,假设其父节点为vnear1v_{near1}vnear1​,那么与相邻点的路径应该是vstart→...→vnear1→vrand→vnearv_{start} \rightarrow ... \rightarrow v_{near1} \rightarrow v_{rand} \rightarrow v_{near}vstart​→...→vnear1​→vrand​→vnear​,若代价小于vnearv_{near}vnear​原来的代价,则更新vnearv_{near}vnear​的父节点为vrandv_{rand}vrand​并更新原代价值。

注:仅比较圆内节点的代价,而不是所有节点的代价,虽然可以减少计算代价,但是也可能会遗漏一些潜在的更好的路径。当然,这个问题只会出现在迭代次数不多时,随着样本点逐渐增多,算法仍然可以找到趋近于最佳路径的结果。

RRT* 在提取路径时与RRT不同,因为生成的路径不止一条,需要根据代价找到代价最小的那条路径作为结果。关键在于要找到代价最小的节点作为终点的父节点。具体寻找过程如下:

  1. 以终点为圆心、扩展步长为半径生成一个圆形区域,排除所有圆外节点和不通过碰撞检测的圆内节点;
  2. 计算剩余的所有节点代价,取最小代价的节点作为终点的父节点。

虽然RRT* 根据节点代价会逐渐更新路径,但是它在初始路径的生成和路径的更新过程中,仍然采用了uniform sample的方式进行采样。在实验过程中,我明显的感觉到RRT* 算法向最优路径的收敛速度太慢。虽然理论上,它可以找到最优路径,但是我们仍然希望它向最优路径的收敛速度可以更快一点。

4.Informed-RRT*

关于RRT* 虽然保证了其路径渐进最优的特性,但是当采样环境维数较大时,其向最优路径收敛的速度会变得很慢。这是因为RRT* 是对集合XXX(地图上的所有点的集合)进行采样的,但是集合XXX中的大部分点对于路径改善是不起作用的。

但是如果我们可以缩小采样集合的范围,那么是否就可以提高算法的收敛速度呢?

这就是Informed-RRT* 提高收敛速度的方法。它把采样范围缩小到了一个椭圆的范围,算法只要在这个椭圆中采样就可以了。

关于为什么可以这么做就需要先介绍一下启发函数(heuristic function)的作用。假设存在一个启发函数f(⋅)f(\cdot)f(⋅),它可以真实描述节点x的最低代价(从起点到终点且经过节点x的最优路径的代价)。但是通常我们是无法知道这个启发函数f(⋅)f(\cdot)f(⋅),故只能设计一个函数f^(⋅)\hat{f}(\cdot)f^​(⋅)来估计它。

当然,f^(⋅)\hat{f}(\cdot)f^​(⋅)并不是随便设置的,它存在一定的限制,必须满足下式:
∀x∈X,f^(x)≤f(x)\forall x \in X, \hat{f}(x)\le f(x) ∀x∈X,f^​(x)≤f(x)
也就是说,f^(⋅)\hat{f}(\cdot)f^​(⋅)估计的代价不能高于被估计路径的真实代价。这很好理解,假设当前存在一条路径ppp,其代价为ccc(该路径是已知的,故可以计算真实代价)。假设在所有可行路径中,代价比它低有m条路径。当我们使用f^(⋅)\hat{f}(\cdot)f^​(⋅)对路径估计代价时,由于不知道其真实代价,必然会导致两种情况:

  • 若f^(⋅)\hat{f}(\cdot)f^​(⋅)高估了真实代价,那么就有可能会把原本代价比路径ppp低的其它路径设置的比ppp更高了。也就是说在这种启发函数下,比当前路径更优的路径数量会小于m条,这就会存在漏掉最优路径的风险;
    Xf^⊆XfX_{\hat{f}} \subseteq X_f Xf^​​⊆Xf​

  • 若f^(⋅)\hat{f}(\cdot)f^​(⋅)低估了真实代价,那么就有可能会把原本代价比路径ppp高的其它路径设置的比ppp更低了。也就是说在这种启发函数下,比当前路径更优的路径数量会大于m条,虽然我们要搜索的范围变大了,但不会漏掉最优路径。
    Xf^⊇XfX_{\hat{f}} \supseteq X_f Xf^​​⊇Xf​
    注:XfX_fXf​表示可以改善当前路径代价的节点的集合,Xf^X_{\hat{f}}Xf^​​是对其的估计。

经过以上分析可知,第二种情况更好。因此,当启发函数满足第二种情况时,可以称启发函数是 “admissible”。满足第二种情况的启发函数很好找,直接用欧几里得距离描述就可以了,因为两点之间直线最短。

由上可知,可以改善当前路径的节点均存在于集合Xf^X_{\hat{f}}Xf^​​。Informed-RRT* 巧妙的设计了一种启发函数,可以直接从集合Xf^X_{\hat{f}}Xf^​​进行采样,故效率会远高于RRT* 。Informed-RRT* 在找到初始路径后,会根据初始路径的长度设置一个椭圆,如下图所示。
Xf^={x∈X∣∣∣xstart−x∣∣2+∣∣x−xgoal∣∣2≤cbest}X_{\hat{f}}=\{ x \in X \; | \; ||x_{start}-x||_2 + ||x-x_{goal}||_2 \le c_{best} \} Xf^​​={x∈X∣∣∣xstart​−x∣∣2​+∣∣x−xgoal​∣∣2​≤cbest​}

通过把椭圆的长轴设置为初始路径的长度,椭圆外的点到两焦点(起点和终点)的距离之和必然会大于初始路径长度。而若某点的最短路径长度都大于初始路径长度,那么这个点就没有采样的必要了。这样就可以把采样范围缩小到一个椭圆,Xf^X_{\hat{f}}Xf^​​就变成了椭圆内的点集,最优路径必然存在于椭圆内。

有了理论基础后,接下来需要解决的就是如何对一个椭圆实现均匀采样。关于这个问题,原论文有详细介绍,这里就不再赘述。

上图是Informed-RRT* 的伪代码,它是直接在RRT* 的基础上修改的,上图中红色标注的就是修改部分。可以发现,修改部分很少,基本上只是修改了采样的部分。

基于采样的路径规划算法总结相关推荐

  1. Apollo学习笔记(24)基于采样的路径规划算法

    之前的文章都是基于搜索的路径算法,这两天在又学习了一下基于采样的路径规划算法,这里做一下记录,最后会奉上大神的链接 基于采样的路径规划算法大致可以分为综合查询方法和单一查询方法两种. 前者首先构建路线 ...

  2. 【自动驾驶】基于采样的路径规划算法——PRM(含python实现)

    文章目录 参考资料 1. 基本概念 1.1 基于随机采样的路径规划算法 1.2 概率路图算法(Probabilistic Road Map, PRM) 1.3 PRM算法的优缺点 1.4 PRM算法伪 ...

  3. 基于采样的路径规划算法RRT和代码实现

    文章目录 前言 一.概率路图法 1.1 采样阶段 1.2 搜索阶段 1.3 Lazy collision-checking 二.快速扩展随机树 2.1 RRT算法流程 2.2 RRT 算法改进 2.3 ...

  4. 基于采样的路径规划算法总结:RRT-Matlab实现

    任务说明 在一张大小800*800具有障碍物的地图里实现RRT算法 算法流程 流程图 流程描述 Sample()函数在地图上随机采样一个点Xrand 遍历树T得到距离Xrand最近的点Xnear 扩展 ...

  5. 自动驾驶路径规划——基于概率采样的路径规划算法(RRT、RRT*)

    目录 1. RRT算法背景 1.1 RRT算法核心思想 1.2 RRT算法优缺点 2. 经典RRT算法 2.1 RRT算法流程 2.2 RRT伪代码 3. 基于目标概率采样 4. RRT*算法 4.1 ...

  6. 第3章 第1节-基于采样的路径规划-PRMRRT及其优化

    基于采样的路径规划(Sampling Based-Planners) 与基于search方法所不同的是,基于采样的路径规划不需要遍历空间所有点,而是通过在空间中随机撒点,通过线段连点构成路图/树(没有 ...

  7. 自动驾驶路径规划——基于概率采样的路径规划算法(PRM)

    目录 1. PRM算法流程 1.1 预处理 1.2 搜索 2. PRM算法案例 2.1 构型采样 2.2 邻域计算 2.3 图搜索(A*搜索) 3. 采样数量的影响 4. 采样策略 4.1 基于障碍物 ...

  8. 无人车路径规划算法—(3)基于搜索的路径规划算法 (BFS/DFS/Dijkstra)

    1.BFS(广度优先搜索) && DFS(深度优先搜索) 广度优先遍历图的方式为,一次性访问当前顶点的所有未访问状态相邻顶点,并依次对每个相邻顶点执行同样处理.因为要依次对每个相邻顶点 ...

  9. 无人车路径规划算法---(4)基于搜索的路径规划算法 II(贪心/Astar)

    上篇博客中介绍了一些基本的图搜索算法,其中也重点介绍了基于势场来实现的Dijkstra算法.本篇博客将介绍关于Heuristic Function的图搜索算法 开源了一个结合Dijkstra,Gree ...

  10. 机器人学习--路径规划算法

    参考网址:https://mp.weixin.qq.com/s?__biz=MzI5MDUyMDIxNA==&mid=2247520667&idx=3&sn=47ee67915 ...

最新文章

  1. 吴思教授:揭秘视觉信息处理的闭环
  2. anaconda更换镜像源
  3. 【剑指offer】用两个栈实现一个队列
  4. Helm 3 发布 | 云原生生态周报 Vol. 27
  5. Mysql 基础命令
  6. html5 函数大全,5 个强大的HTML5 API 函数推荐
  7. JavaGUI版本销售管理系统
  8. 高质量C编程00-汇总
  9. vscode 搭建SSM项目环境
  10. javascript学习笔记最全
  11. JAVA中关于if结构的相关的练习题
  12. YOLO v3源码详解
  13. WATCHMEN 守望者,好看。
  14. html win10虚拟键盘,Win10怎么调出虚拟键盘
  15. Arctic的湖仓一体践行之路
  16. docker虚拟化之订制python环境
  17. Pytorch训练速度更快的十七种方法
  18. 通用知识图谱VS行业知识图谱
  19. 电脑更新BIOS之后opencore消失,使用EasyUEFI重建opencore的引导
  20. 三菱M80系统服务器,三菱M80系统故障维修实例分享

热门文章

  1. 三层神经网络实现手写数字图像分类
  2. 集查询IP地址信息、查询手机号码信息、查询身份证号信息的一个小程序
  3. 吃鸡ios和android灵敏度,吃鸡手游pc版怎么调灵敏度参数教程 | 手游网游页游攻略大全...
  4. java实现简单QQ登录界面
  5. linux vi 文件查找,linux几种常见的文件内容查找和替换命令
  6. 使用Pytorch来拟合函数
  7. 电动牙刷无线充电解决方案
  8. java后端如何用正则表达式_Java 正则表达式详解
  9. GreenSock Animation Platform
  10. Android 开发即时聊天工具系列(8)