文章目录

  • 前言
  • 一、有限状态机
  • 二、决策树
  • 三、基于知识的推理决策
  • 四、 基于价值的决策模型

前言

在多智能体决策的复杂环境中(存在感知不确定性情况下)进行规划这一问题一直是L4、L5级自动驾驶技术的核心瓶颈之一。
文章转自自动驾驶中的决策规划算法概述。


一、有限状态机

自动驾驶车辆最开始的决策模型为有限状态机模型,车辆根据当前环境选择合适的驾驶行为,如停车、换道、超车、避让、缓慢行驶等模式,状态机模型通过构建有限的有向连通图来描述不同的驾驶状态以及状态之间的转移关系,从而根据驾驶状态的迁移反应式地生成驾驶动作。

有限状态机模型因为简单、易行,是无人驾驶领域目前最广泛的行为决策模型,但该类模型忽略了环境的动态性和不确定性,此外,当驾驶场景特征较多时,状态的划分和管理比较繁琐,多适用于简单场景下,很难胜任具有丰富结构化特征的城区道路环境下的行为决策任务。


二、决策树

决策/行为树模型和状态机模型类似,也是通过当前驾驶状态的属性值反应式地选择不同的驾驶动作,但不同的是该类模型将驾驶状态和控制逻辑固化到了树形结构中,通过自顶向下的“轮询”机制进行驾驶策略搜索。这类决策模型具备可视化的控制逻辑,并且控制节点可复用,但需要针对每个驾驶场景离线定义决策网路,当状态空间、行为空间较大时,控制逻辑将比较复杂。另外,该类模型同样无法考虑交通环境中存在的不确定性因素。


三、基于知识的推理决策

基于知识的推理决策模型由“场景特征-驾驶动作”的映射关系来模仿人类驾驶员的行为决策过程,该类模型将驾驶知识存储在知识库或者神经网络中,这里的驾驶知识主要表现为规则、案例或场景特征到驾驶动作的映射关系。进而,通过“查询”机制从知识库或者训练过的网络结构中推理出驾驶动作。

该类模型主要包括:基于规则的推理系统、基于案例的推理系统和基于神经网络的映射模型。

该类模型对先验驾驶知识、训练数据的依赖性较大,需要对驾驶知识进行精心整理、管理和更新,虽然基于神经网络的映射模型可以省去数据标注和知识整合的过程,但是仍然存在以下缺点:

  • 其“数据”驱动机制使得其对训练数据的依赖性较大,训练数据需要足够充分;

  • 将映射关系固化到网络结构中,其解释性较差;

  • 存在“黑箱”问题,透明性差,对于实际系统中出现的问题可追溯性较差,很难发现问题的根本原因。


四、 基于价值的决策模型

根据最大效用理论,基于效用/价值的决策模型的基本思想是依据选择准则在多个备选方案中选择出最优的驾驶策略/动作。

为了评估每个驾驶动作的好坏程度,该类模型定义了效用(utility)或价值(value)函数,根据某些准则属性定量地评估驾驶策略符合驾驶任务目标的程度,对于无人驾驶任务而言,这些准则属性可以是安全性、舒适度、行车效率等,效用和价值可以是由其中单个属性决定也可以是由多个属性决定。

澳大利亚格里菲斯大学的Furda和Vlacic提出了多准则决策方法从候选动作集中选择最优的驾驶动作;新加坡国立大学的Bandyopadhyay等人提出了基于POMDP的行为决策模型,用以解决存在感知不确定性的情况;卡内基梅隆大学的Wei J等人提出基于PCB(Prediction and-Cost-function Based)的行为决策模型,其侧重点在于如何构建恰当的代价函数来指导对环境的预测;为了解决在多智能体参与的复杂环境中的决策问题,许多基于博弈论的模型也被研究者用来推理车辆之间的交互行为,;此外,因为在特征提取方面的优势,深度强化学习技术也开始被广泛应用,以完成最优驾驶动作的生成。


[决策规划算法]自动驾驶中的行为决策相关推荐

  1. Bezier(贝塞尔)曲线的轨迹规划在自动驾驶中的应用(一)

    本文主要根据Path Generation and Tracking Based on a Bézier Curve for a Steering Rate Controller of Autonom ...

  2. Bezier(贝塞尔)曲线的轨迹规划在自动驾驶中的应用(二)

    根据(一)中的理论前提,我们通过matlab进行一次仿真验证: clcclear allp0 = [ 0, 0];p1 = [10,0.5];p2= [20,3.5];p3 = [30,4];%设置控 ...

  3. Bezier(贝塞尔)曲线(五阶)的轨迹规划在自动驾驶中的应用(五)

    提供动态轨迹的Bezier轨迹,计算cost minimization 后取cost最小值 clcclear allp0 = [ 0, 0]; % p1 = [7.5,7.5*4/30]; % p2= ...

  4. Bezier(贝塞尔)曲线(五阶)的轨迹规划在自动驾驶中的应用(六)

    本文介绍贝塞尔五阶曲线最为curve smoother的使用,分析关于时间的一阶和二阶导数的连续性,以及曲率的连续性,并给出一个smoother的实例进行效果展示. clcclear allp0 = ...

  5. Bezier(贝塞尔)曲线(三阶)的轨迹规划在自动驾驶中的应用(四)

    提供动态轨迹的Bezier轨迹,计算cost minimization 后取cost最小值 clcclear allp0 = [ 0, 0];for i = 1:10j =10;p3(i*j-9, 1 ...

  6. Bezier(贝塞尔)曲线的轨迹规划在自动驾驶中的应用(三)

    存储函数: BezierGeneration function p= BezierGeneration (xs,ys,xe,ye,Latoff) % x_start, and x_end means ...

  7. 知荐 | 自动驾驶的“大脑”:决策规划篇

    决策规划技术概述 决策规划是自动驾驶的关键部分之一,它首先融合多传感信息,然后根据驾驶需求进行任务决策,接着在能避开可能存在的障碍物前提下,通过一些特定的约束条件,规划出两点间多条可选安全路径,并在这 ...

  8. 边缘计算在自动驾驶中的应用场景丨边缘计算阅读周

    #边缘计算阅读周#  读书的人,有梦可做. 边缘计算社区联合6大出版社邀您一起阅读,一起做追梦人. 今天推荐的书是电子工业出版社 博文视点推出的边缘计算佳作<边缘计算 方法与工程实践>,这 ...

  9. 自动驾驶决策规划算法第一章笔记 忠厚老实的老王

    第一章 自动驾驶决策规划算法数学基础 第一节:决策规划算法的地位和作用 该笔记来自b站up主(偶像):憨厚老实的老王视频链接主页 第二节:为什么规划中经常见到五次多项式

最新文章

  1. html-webpack-plugin 多页面,html-webpack-plugin
  2. java网络编程面试题
  3. 接口 类型转换 try-catch(学习笔记)
  4. webpack devServer
  5. 实验9 根据材料编程
  6. 阿里云助力江苏省财政厅力推统一公共支付平台
  7. linux命令之which
  8. 2021年1月十大热门报告盘点(5天VIP会员免费送)
  9. adaptec SCSI卡管理和配置选项
  10. python培训班靠谱吗-python培训机构靠谱吗?python培训班
  11. python小程序_小会计的实用Python小程序(三):人民币大写金额转换器
  12. 知识图谱中的结构信息建模
  13. 【Windows 10】误删监视器?恢复方法
  14. 通达信波段王指标公式主图_通达信股票波段王+精准买卖提示主图指标源码公式_通达信指标公式_指标公式网...
  15. 关系代数题目小汇总——数据库
  16. Masked Image Modelling(MAE,iBOT,Data2vec,SimMIM,CAE,BEVT)
  17. 基础——树莓派3B配置
  18. 【Solr】之倒排索引算法【字典树】2
  19. Android仿同花顺自选股列表控件
  20. 【考研英语语法】一般现在时练习题

热门文章

  1. 流放之路进入服务器时显示,《流放之路》游戏快捷键和界面提示
  2. 读《平凡的世界》后感 (二)
  3. topik怎么读_韩语TOPIK的1-6级是个什么概念呢?
  4. 莱昂纳德:今年的决赛没有亚军,勇士比我们更配得上欢呼声
  5. mysql lambda查询_从NodeJS AWS Lambda函数查询MySQL数据库
  6. 维修计算机起名字,电脑维修店起名,电脑维修店起名大全
  7. C#中String转int问题
  8. DataBinder.Eval(Container.DataItem
  9. C语言——刚开始接触一些小项目,你需要知道的几个函数
  10. 熊猫烧香制造者李俊:5个小时完成专杀软件