概率机器人-贝叶斯滤波

贝叶斯状态迭代是概率机器人的基础,理解它对平面slam技术,如gmapping算法原理有很大的帮助。先掌握基础原来,以后再考虑如何进行创新。


文章目录

  • 概率机器人-贝叶斯滤波
  • 前言
  • 一、什么是贝叶斯滤波?
    • 1、置信度
    • 2、贝叶斯滤波算法
  • 二、贝叶斯滤波的推导
    • 1.基本概念
    • 2.公式推导
  • 总结

前言

书中介绍的概率机器人是基于隐马尔可夫模型,或者叫动态贝叶斯网络,即时刻ttt的状态随机地依赖t-1时刻的状态和控制输入utu_tut​,测量ztz_tzt​随机地依赖时刻t的状态。这就是贝叶斯滤波的基本假设了。看到这个假设,其实我们会想时刻ttt的状态是如何与前面的东西关联起来的,即那状态是如何更新的?大家可以带着问题进行思考。


一、什么是贝叶斯滤波?

1、置信度

首先介绍置信度的概念,贝叶斯滤波就是置信度的递归计算。

置信度的概念:
概率机器人通过条件概率分布表示置信度,是对给定所有过去的传感器测量和所有过去控制的环境状态的一个后验分布。比如bel(xt)=p(xt∣z1:t,u1:t)bel(x_t)=p(x_t|z_{1:t},u_{1:t})bel(xt​)=p(xt​∣z1:t​,u1:t​),表示状态变量xtx_txt​的置信度。

如何理解置信度?
机器人的状态是不能测量的,你说xtx_txt​发生的可能性是多少,给个概率吧!那不就是以过去测量z1:tz_{1:t}z1:t​和所有过去控制u1:tu_{1:t}u1:t​为条件,时刻t下状态xtx_txt​的概率分布。

有了bel(xt)bel(x_t)bel(xt​),据说刚执行完控制utu_tut​,用zt−1z_{t-1}zt−1​计算后验也是有用的。bel‾(xt)=p(xt∣z1:t−1,u1:t)\overline{bel}(x_t)=p(x_t|z_{1:t-1},u_{1:t})bel(xt​)=p(xt​∣z1:t−1​,u1:t​)。该概率被称为预测,是基于以前状态的后验。由bel‾(xt)\overline{bel}(x_t)bel(xt​)计算bel(xt)bel(x_t)bel(xt​)称为测量更新。理解了置信度的概念,那到底怎么进行更新?

2、贝叶斯滤波算法

贝叶斯滤波算法讲的就是测量更新的过程。

伪代码如下:

Algorithm Bayes filter
for all xtx_txt​ do
bel‾(xt−1)=∫p(xt∣ut,xt−1)bel(xt−1)dxt−1\quad \overline{bel}(x_{t-1}) =\int p(x_t \mid u_t,x_{t-1})bel(x_{t-1})dx_{t-1}bel(xt−1​)=∫p(xt​∣ut​,xt−1​)bel(xt−1​)dxt−1​
bel(xt)=ηp(zt∣xt)bel‾(xt)\quad bel(x_t)=\eta p(z_t\mid x_t)\overline{bel}(x_t)bel(xt​)=ηp(zt​∣xt​)bel(xt​)
end for
return bel(xt)bel(x_t)bel(xt​)

贝叶斯算法就是一个递归的过程,它分两个部分:第一部分,控制更新。通过基于xt−1x_{t-1}xt−1​的置信度和控制输入utu_tut​来计算状态xtx_txt​的置信度。第二部分,测量更新。用已经观测到的测量ztz_tzt​的概率乘以置信度bel‾(xt)\overline{bel}(x_t)bel(xt​)。但这样有个问题,对每个后验状态xtx_txt​都这样做,乘积结果常不是一个概率,它的和可能不为1,所以公式中乘了一个归一化系数。

那这公式写得到底可信度有多少?下面来推导一下。

二、贝叶斯滤波的推导

1.基本概念

条件概率:
p(x∣y)=p(x,y)p(y)=p(x)p(y)p(y)p(x\mid y)=\frac{p(x,y)}{p(y)}=\frac{p(x)p(y)}{p(y)}p(x∣y)=p(y)p(x,y)​=p(y)p(x)p(y)​

全概率公式:
p(x)=∑yp(x∣y)p(y)p(x)=\sum_y p(x\mid y)p(y)p(x)=y∑​p(x∣y)p(y)

贝斯准则:
p(x∣y)=p(y∣x)p(x)p(y)=p(y∣x)p(x)∑x′p(y∣x′)p(x′)p(x\mid y)=\frac{p(y\mid x)p(x)}{p(y)}=\frac{p(y\mid x)p(x)}{\sum_{x'}p(y\mid x')p(x')}p(x∣y)=p(y)p(y∣x)p(x)​=∑x′​p(y∣x′)p(x′)p(y∣x)p(x)​

2.公式推导

bel‾(xt−1)=p(xt∣z1:t−1,u1:t)=∫p(xt∣z1:t−1,xt−1,u1:t)p(xt−1∣z1:t−1,u1:t)dxt−1=∫p(xt∣xt−1,u1:t)p(xt−1∣z1:t−1,u1:t−1)dxt−1\begin{aligned} \overline{bel}(x_{t-1})&=p(x_t\mid z_{1:t-1},u_{1:t})\\ &=\int p(x_t\mid z_{1:t-1},x_{t-1},u_{1:t})p(x_{t-1}\mid z_{1:t-1},u_{1:t})dx_{t-1}\\ &=\int p(x_t\mid x_{t-1},u_{1:t})p(x_{t-1}\mid z_{1:t-1},u_{1:t-1})dx_{t-1} \end{aligned}bel(xt−1​)​=p(xt​∣z1:t−1​,u1:t​)=∫p(xt​∣z1:t−1​,xt−1​,u1:t​)p(xt−1​∣z1:t−1​,u1:t​)dxt−1​=∫p(xt​∣xt−1​,u1:t​)p(xt−1​∣z1:t−1​,u1:t−1​)dxt−1​​

因为状态是完整的,当条件中有xt−1x_{t-1}xt−1​时可以将z1:t−1z_{1:t-1}z1:t−1​去掉。又因为控制量utu_tut​不能发生在状态xt−1x_{t-1}xt−1​前,所以可以近似写成ut−1u_{t-1}ut−1​发生时,xt−1x_{t-1}xt−1​发生的概率。

用条件概率和贝叶斯准则对bel(xt)bel(x_t)bel(xt​)进行展开:
bel(xt)=p(xt∣z1:t,u1:t)=p(z1:t∣xt,z1:t−1,u1:t)p(xt∣z1:t−1,u1:t)p(z1:t∣z1:t−1,u1:t)=p(z1:t∣xt,u1:t)p(xt∣z1:t−1,u1:t)p(z1:t∣z1:t−1,u1:t)=ηp(z1:t∣xt)p(xt∣z1:t−1,u1:t)\begin{aligned} bel(x_t)&=p(x_t\mid z_{1:t}, u_{1:t})\\ &=\frac{p(z_{1:t}\mid x_t, z_{1:t-1}, u_{1:t}) p(x_t\mid z_{1:t-1}, u_{1:t})}{p(z_{1:t}\mid z_{1:t-1}, u_{1:t})}\\ &=\frac{p(z_{1:t}\mid x_t, u_{1:t}) p(x_t\mid z_{1:t-1}, u_{1:t})}{p(z_{1:t}\mid z_{1:t-1}, u_{1:t})}\\ &=\eta p(z_{1:t}\mid x_t) p(x_t\mid z_{1:t-1}, u_{1:t}) \end{aligned} bel(xt​)​=p(xt​∣z1:t​,u1:t​)=p(z1:t​∣z1:t−1​,u1:t​)p(z1:t​∣xt​,z1:t−1​,u1:t​)p(xt​∣z1:t−1​,u1:t​)​=p(z1:t​∣z1:t−1​,u1:t​)p(z1:t​∣xt​,u1:t​)p(xt​∣z1:t−1​,u1:t​)​=ηp(z1:t​∣xt​)p(xt​∣z1:t−1​,u1:t​)​
还是基于状态完整的假设,条件中状态xtx_txt​存在时可以将测量状态和控制输入去掉。

至此,公式就推完了。该算法的实现需要三个概率分布:初始置信度p(x0)p(x_0)p(x0​)、测量概率p(zt∣xt)p(z_t\mid x_t)p(zt​∣xt​)和状态转移概率p(xt∣ut,xt−1)p(x_t\mid u_t, x_{t-1})p(xt​∣ut​,xt−1​)。但是这些概率怎么求,或者如何设定,不在此讨论,本文仅对贝叶斯滤波进行介绍和推导。


总结

机器人及其环境的动态以两种概率法则,即状态转移分布测量分布的形式为特点。(需要初始置信度、测量概率和状态转移概率) 状态转移分布描述状态如何随时间变化的特征,可能作为机器人控制的效果。测量分布描述测量如何由状态控制的特征,两个分布都是概率性的,导致状态演变和检测固有的不确定性。

贝叶斯滤波是基于隐马尔可夫假设,即过去和未来数据都是独立的。但是未建模因素,概率的不精确性会影响位姿的估计。所以以此原理的位姿估计,在同一位置,估计结果应该会不一样。

概率机器人-贝叶斯滤波相关推荐

  1. 9 概率机器人 Probabilistic Robotics 二值贝叶斯滤波 占据栅格地图 occupancy grid mapping

    文章目录 1 前言 2 二值贝叶斯滤波 2.1 理论基础 2.2 算法流程 2.3 重要公式推导 3 实例:占据栅格地图(occupancy grid mapping) 4 参考文献 1 前言 如果通 ...

  2. 贝叶斯滤波算法(实例)

    基本的贝叶斯滤波算法 Algorithm Bayes_filter(bel(x[t-1], u[t], z[t])):for all x[t] do:bel_transition(x[t]) = ∫p ...

  3. 滤波估计理论(一)——贝叶斯滤波

    滤波估计理论(一)--贝叶斯滤波(Bayesian Filtering) 估计问题的建模 状态空间模型 概率模型 贝叶斯估计方法 批处理贝叶斯估计 预测,滤波还是平滑? 贝叶斯滤波 状态预测 量测更新 ...

  4. 细说贝叶斯滤波:Bayes filters

    原文链接: http://www.cnblogs.com/ycwang16/p/5995702.html 认知计算,还要从贝叶斯滤波的基本思想讲起.这一部分,我们先回顾贝叶斯公式的数学基础,然后再来介 ...

  5. 【学习记录】贝叶斯滤波详解

    贝叶斯滤波详解 贝叶斯滤波的用途(Bayesian Filtering): 贝叶斯滤波理论的应用可谓十分广泛.我们知道,在机器人运动过程中,有两个方面的信息来源,一个是通过我们实际控制机器人的运动路线 ...

  6. python实现排列组合公式算法_Python实现卡尔曼滤波算法之贝叶斯滤波

    Python实现卡尔曼滤波算法之贝叶斯滤波 作者:yangjian 卡尔曼滤波器属于贝叶斯滤波器的一种特例,本文主要讲解贝叶斯滤波原理及其算法的python实现. 先来看下贝叶斯公式 贝叶斯公式 :后 ...

  7. 【贝叶斯滤波与卡尔曼滤波】 第四讲 连续随机变量的贝叶斯公式

    声明:[贝叶斯滤波与卡尔曼滤波]系列是博主对B站up主:忠厚老实的老王所分享教学内容的学习笔记,并且该系列每篇博客都会将博主听课后总结的纸质版笔记附于文末,供大家参考. B站up主:忠厚老实的老王是一 ...

  8. 贝叶斯滤波(三)贝叶斯滤波算法推导

    一. 状态估计(state estimation) 状态估计根据可获取的量测数据估算动态系统内部状态的方法. 贝叶斯滤波也就是在已知观测和可选的控制输入的概率分布下,估计出的状态概率分布. 状态随着时 ...

  9. 从贝叶斯滤波理论到容积卡尔曼滤波算法(CKF)详细推导及编程实现常转弯率模型估计。(matlab)

    容积卡尔曼滤波(CKF)是由加拿大学者Arasaratnam和Haykin在2009年提出的.该算法的核心思想是针对非线性高斯系统,通过三阶球面径向容积准则来近似状态的后验均值和协方差,以保证在理论上 ...

  10. 贝叶斯滤波和贝叶斯平滑(Kalman滤波,RTS平滑)

    文章目录 贝叶斯滤波(*Bayesian filtering equations*) 贝叶斯滤波方程 Kalman滤波 贝叶斯平滑(*Bayesian smoothing*) 贝叶斯最优平滑方程 Ra ...

最新文章

  1. 变频电机转矩频率特性曲线_伟创变频器
  2. java定义一个盒子类box_定义一个Box(盒子)类,在该类定义中包括数据成员: length(长),width(宽)和height(...
  3. Oracle——distinct的用法
  4. 用c 语言写出五子棋的代码,C语言案例:控制台版本的五子棋游戏【代码】
  5. MySQL事务学习总结
  6. 各大IT公司技术架构一览
  7. QT 5.12和有道词典冲突
  8. 毕业四年年薪200万是怎样的一种体验?
  9. Apple MFi认证是什么意思?
  10. java jnlp_Java Web Start实践:动态生成JNLP
  11. 正则表达式应用——实例应用
  12. 乐高教育版45544零件---分类识别
  13. 文明大爆炸服务器维护,文明大爆炸
  14. 怎么将html发布到天猫,天猫商家商品发布到淘小铺后台流程
  15. seo优化需要c语言吗,SEO优化人员需要优化哪些代码?
  16. 论文篇 | 基于深度学习的机器翻译论文总汇
  17. 曙光服务器开机显示B9,曙光服务器配置
  18. Scrum 5.0(继4.0)
  19. 10个成功使用Node.js的公司、10个成功的NodeJS大项目。
  20. linux系统怎么访问u盘文件系统,linux如何挂载U盘及文件系统(或需要用到的).doc

热门文章

  1. Python解析JSON对象
  2. php课程设计学生信息管理系统,学生成绩管理系统/学生信息管理系统
  3. 清华计算机系超算团队,清华大学学生超算团队
  4. 教大家如何选购直播声卡
  5. 国内的健身房管理系统榜单-捷径系统
  6. html+css+js 实现鼠标拖尾效果(源码)
  7. lamp兄弟连java_LAMP兄弟连李明老师讲Linux视频教程下载
  8. 中国工业企业数据库(1998-2014年)
  9. IMO船舶材料防火安全规范
  10. linux下数学公式的编辑器,Linux下的公式编辑器——libreoffice math 使用快速入门