Dempster–Shafer theory

本文参考书Wikipedia中的 Dempster-Shafer thoery 原文链接:点击打开链接
同时还参考了浙江大学计算机学院人工智能系 徐从富 教授的《人工智能》课件。
在这里特别感谢!

一、 DS证据理论概述

核心: Dempster合成规则——将多个主体(可以是不同的人的预测、不同的传感器的数据、不同的分类器的输出结果等等)相融合
优点: 1、所需要的先验数据比概率推理理论中更直观、更容易获得 (不知道为什么);满足比Bayes概率理论更弱的条件,即 “不必满足概率可加性”
2、可以融合多种数据和知识(正如核心中所述)
3、具有直接表达 “不确定” 和 “不知道” 的能力,这些信息表示在mass函数中,并在证据合成过程中保留了这些信息(还没有理解感受到)。
缺点: 1、证据必须是独立的
2、证据合成规则没有非常坚固的理论支持,其合理性和有效性还存在较大的争议
3、计算上存在“指数爆炸问题”
4、在某些情况下得到的结果违背常理,如“Zadeh悖论”,具体见下面的例子

二、 DS证据理论基本概念

我们先来假设这样一个情景,有一个传感器探测一个很远处的一道光,这道光只能发出 {red, yellow, green}这三种中的一种光。传感器对所探测的光做出分析,形成了一些假设这道光可能是{Null, Red, Yellow, Green, Red or Yellow, Red or Green, Yellow or Green, Any},以及这些假设相应的可能性(也就是说Mass)。那么,DS证据理论是干啥呢,我感觉就是根据这个传感器提供的各个假设的信息,得到针对每一个假设的可信度区间。需要注意的是,这里的Red or Yellow并不是P(Red) + P(Yellow), 而是Red or Yellow 这一假设的概率(其实我也还没太搞懂这之间的区别,只是感觉上应该不一样)。
这里先给出这一场景的所有信息表:
Hypothesis Mass Belief Plausibility
Null 0 0 0
Red 0.35 0.35 0.56
Yellow 0.25 0.25 0.45
Green 0.15 0.15 0.34
Red or Yellow 0.06 0.66 0.85
Red or Green 0.05 0.55 0.75
Yellow or Green 0.04 0.44 0.65
Any 0.1 1.0 1.0
OK,根据上面的例子,我们就来定义一下DS证据理论中的基本概念。
1. 首先我们设X 全域(Universe):也就是指的上面那道光可能发出的颜色,即X = {Red, Yellow, Green}
  对于X 全域,我们一共可以有多少种假设呢?很显然,就是 个啦 (包括空集),这个叫做识别框架,或者是假设空间。
  
  比如说: 则 
  对于我们的例子X = {Red, Yellow, Green},={Null, Red, Yellow, Green, Red or Yellow, Red or Green, Yellow or Green, Any}
2. DS证据理论针对识别框架中的每一个假设都分配了概率,我们称为基本概率分配(BPA, Basic Probability Assignment)或者是基本置信分配     (BBA, Basic Belief Assignment )。这个分配函数我们称为mass函数
  
  1)公式为:,每个假设的mass函数值(概率(probability)或者是置信度(belief)值)都在0和1之间;
  
  2)同时,空集的mass函数值为 0,即另外其他的假设mass值得和为1,即,A 为所包含的假设。
  3)其中,使得mass值大于0的假设 A称为焦元(Focal element)
  
  在我们上面的例子中,Column 2 即为mass函数针对各个假设的值,m(Null) = 0, m(Red) + m(Yellow) + m(Green) + ... + m(Any) = 1 根据该列我们可以得到满足上面的定义。
3. 下面我们要根据mass函数来计算每一个假设的 信度函数 (Belief function) 以及 似然函数 (Plausibility function)
  
  得到的信度函数和似然函数就是这个假设A 的概率范围了:
  1)信度函数的定义如下:
  该公式表示,对于假设A ,它的信度函数为所有真属于 A 的假设,即 B ,的mass值的和。
  以上面的例子来讲,A假设为 Red,那么它的 Bel 函数值就是0.35, 因为只有它本身是属于假设 A
  但是,如果假设A 为 Red or Yellow, 那么它的 Bel 函数值就不是0.06了, 而是 m(Null) + m(Red) + m(Yellow) + m(Red or Yellow) = 0 +   0.35 + 0.25 + 0.06 = 0.66
  2) 似然函数的定义如下:
                       
  该公式表示,对于假设A , 它的似然函数为所有与 A 相交不为空的假设 B 的mass值的和。
  以上面的例子来讲, 还是 A假设为 Red,那么它的 pl 函数值为 m(Red) + m(Red or Yellow) + m(Red or Green) + m(Any) = 0.35 + 0.06 + 0.05 + 0.1 =0.56
  3) 信任区间
  根据上面的信度函数和似然函数,对于一个识别框架中的某个假设A , 我们可以根据其基本概率分配的mass函数来计算 ABel(A)Pl(A)。那么,由信任函数与似然函数组成的闭区间[Bel(A),Pl(A)]则为假设 A 的信任区间,表示对假设 A 的确认程度。
                      

三、 Dempster合成规则

前面所述的都是只有一个主体(subject)对一个识别框架预测。而Dempster合成规则正是用来将多个主体的输出结果相结合的关键步骤。
两个主体的mass函数 m1m2 有:
其中
  
等价于                  
合成规则为两个mass函数 m1m2, 对于假设A的合成结果等于两个主体的假设中,所有相交为 A 的假设的mass函数值的乘积的和,再除以一个归一化系数 1-K。归一化系数 1-K 中的 K 的含义是证据之间的冲突(the conflict between the evidences, called conflict probability)(并不太明白为何能够表现证据之间的冲突,从公式上来看就是两个主体提供的证据不同的时候(B与C相交为了空集)的mass函数值乘积)
举个“栗子”:
一宗谋杀案有三个犯罪嫌疑人 U = {Peter, Paul, Mary}, 两个目击证人分别指证犯罪嫌疑人,得到两个mass函数 m1m2.
1)根据上述公式,为了求得合成规则 m12 ,我们先求归一化系数 1-K
然后再求合成之后的每个假设的mass函数值
2)Peter的组合mass函数值
3)Paul的组合mass函数值
4)Mary的组合mass函数值

由此,我们得到了如上表所示的组合函数 m12

根据得到的合成的mass函数,我们同样能计算对于组合mass函数对于各个假设的信度函数以及似然函数。
  
但是这一结果却有悖于我们的常识,因为在两个目击证人指证的证据中,Paul是凶手的概率都不大,但是最终的结果却直接指向了Paul。该例子就是“Zadeh悖论”。
若修改“Zadeh悖论”中的部分数据,如下表:
重新计算新的组合mass函数
1)还是先计算归一化系数 1-K
这次计算采用简便方法,用相交为空的公式来做(及上面的等价公式)
2)计算Peter的组合mass函数
3)计算Paul的组合mass函数
4)计算Mary的组合mass函数
5)计算{Peter, Paul, Mary}的组合mass函数
根据这次的结果,我们同样可以计算组合函数对每个假设的信度函数值以及似然函数值
以上就是Dempster-shafer 的基本概念和理论知识了。

Dempster-Shafer Evidence Theory相关推荐

  1. 字符和文档识别的四十年研究

    字符和文档识别的四十年研究 ---工业前景的瞻望 文档来源:http://www.sciencedirect.com/science/article/pii/S0031320308000964 文章历 ...

  2. 英文好词好句[论文向]

    1. ### is an extension of ###   ...是...的扩展(推广) 例句:Rough set theory is an extension of conventional s ...

  3. 空间数据挖掘常用方法及举例

    转载自:http://alex-1949-c.blog.163.com/blog/static/380295120100145142337/ 问题1:空间数据挖掘有哪些常用方法,举例说明一种方法的原理 ...

  4. 从DBSCAN算法谈谈聚类算法

    DBSCAN算法 前言 最近看了一篇关于电子商务防欺诈的相关论文,其中在构建信用卡的个人行为证书中用到了DBSCAN算法. 具体内容请参看论文: Credit card fraud detection ...

  5. D-S证据理论基本概念

    证据理论是Dempster于1967年首先提出,由他的学生Shafer于1976年进一步发展起来的一种不精确推理理论,也称为Dempster/Shafer 证据理论(D-S证据理论).主要是基于&qu ...

  6. 吉林大学计算机专业研究生导师,吉林大学计算机科学与技术学院导师教师简介-张晋东...

    吉林大学计算机科学与技术学院导师教师简介-张晋东本站小编 Free考研网/2020-03-11 基本情况 姓名:张晋东 性别:男 职称:副教授 最高学位:博士 Email: 备注:微信zhangjin ...

  7. 合工大计算机考研导师,合肥工业大学计算机与信息学院导师介绍:胡东辉

    合肥工业大学计算机与信息学院导师介绍:胡东辉 2012-07-21 姓名:胡东辉 性别:男 出生年月:1973/12 职称:副教授 学院:计算机与信息学院 研究方向: 目前研究方向有隐写分析.数字图像 ...

  8. 论文研读-多目标优化中的多源选择迁移框架

    论文研读-多目标优化中的多源选择迁移框架 Multisource Selective Transfer Framework in Multiobjective Optimization Problem ...

  9. D-S证据理论的简要介绍

    D-S证据理论属于不确定性推理方法,证据理论是Dempster于1967年首先提出,由他的学生Shafer于1976年进一步发展起来的一种不精确推理理论,也称为Dempster/Shafer 证据理论 ...

  10. 故障诊断1—基础理论

    1. 故障诊断概念 故障诊断主要研究如何对系统中出现的故障进行检测.分离和辨识 , 即判断故障是否发生 , 定位故障发生的部位和种类 , 以及确定故障的大小和发生的时间等 . 2. 故障诊断方法 故障 ...

最新文章

  1. 设置VSCode快速切换多个项目窗口的快捷键Alt+E
  2. 新手教程:用.htaccess实现二级域名功能
  3. Lazy Load, 延迟加载图片的 jQuery 插件 - NeoEase
  4. python安装numba_python – 在OS X上安装Numba时出错
  5. 图像识别 标注(annotation)的反向优化策略
  6. 倍数应用题后面需要带单位吗_数学应用题解答思路解析(附例题)
  7. 【2018.5.12】模拟赛之二-ssl2414 简写单词【字符串】
  8. 3_V1-类和对象 -- 默认成员函数
  9. 【TensorFlow】TensorFlow是什么?
  10. 【Linux入门学习之】vi/vim编辑器必知必会
  11. Python测试程序用时时长(运行时间测试)
  12. sublime安装mysql_ubuntu安装mysql pycharm sublime
  13. Selenium模拟JQuery滑动解锁
  14. 拼题a答案c语言计算整数各位数字之和,这是小白刷的基础题,跪求大佬帮忙!!!题目:读入一个自然数n...
  15. 每日一模式之数据库模式
  16. excel转置怎么操作_Excel如何快速将一行转置成一列,一列转置成一行?
  17. 文本比较算法--Needleman/Wunsch算法
  18. raw data convert and play
  19. MediaCodec进行音频合成
  20. 微服务拆分:业务横向拆分和纵向拆分

热门文章

  1. 暗黑3 外挂开发资料
  2. 怎么在Linux上抓包分析
  3. 熵权法求权重python代码
  4. 旁站,子域名,C段的含义
  5. mysql官网 源码下载_mysql官网源码包下载
  6. 【外文文献检索与下载方法】
  7. 【数学建模】python建模专用数据清洗代码(本人实践)
  8. 计算机系统三员试题,2013年计算机软考程序员试题及答案3
  9. f分布表完整图a=0.01_图 python 实现
  10. 制作windows7虚拟机镜像并配置网络