粗糙集

什么是粗糙集

1982年波兰学者Z. Pawlak 提出了粗糙集理论——它是一种刻画不完整性和不确定性的数学工具，能有效地分析不精确，不一致（inconsistent)、不完整（incomplete) 等各种不完备的信息，还可以对数据进行分析和推理，从中发现隐含的知识，揭示潜在的规律。已被广泛应用于知识发现、机器学习、决策支持、模式识别、专家系统及归纳推理等领域。

从数学的角度看，粗糙集是研究集合的；从编程的角度看，粗糙集的研究对象是矩阵,只不过是一些特殊的矩阵；从人工智能的角度来看，粗糙集研究的是决策表。

举一个例子

学生	食堂饭钱	超市花销	其他佐证	贫困
s1	高	高	无	否
s2	高	高	有	否
s3	高	低	无	存疑
s4	高	低	有	存疑
s5	低	高	无	存疑
s6	低	高	有	存疑
s7	低	低	无	是
s8	低	低	有	是

论域（记作U）：病人，比如在这个表格中，就是从s1到s8

属性：分为条件属性和决策属性（记作C）。

其中，条件属性又有食堂属性、教超属性以及证明属性。

这些条件属性又被称为论域上的知识。

我们把这个记作信息系统S

以决策属性C分类的论域S，记作

U / C= { {s1s_1s1, s2s_2s2}, {s3,s4,s5,s6s_3, s_4, s_5, s_6s3,s4,s5,s6}, {s7s_7s7, s8s_8s8} } = {X1,X2,X3X_1, X_2, X_3X1,X2,X3}

X1X_1X1 = {s1,s2s_1, s_2s1,s2} 不妨把它称作非贫困类

X2X_2X2 = {s3,s4,s5,s6s_3, s_4, s_5, s_6s3,s4,s5,s6} 不妨把它称作存疑贫困类

X3X_3X3 = {s7,s8s_7, s_8s7,s8} 不妨把它称作贫困类

随机给出一个集合X = {s1,s2,s7s_1, s_2, s_7s1,s2,s7} ，显然 X 是C 的粗糙集，因为不能通过组合的方法从 X1，X2，X3X_1， X_2， X_3X1，X2，X3 得出 X 的。

上近似

对于上文随机给出的一个粗糙集 X={s1,s2,s7s_1, s_2, s_7s1,s2,s7}：

非贫困类 ： {s1，s2}∩X={s1,s2}→X1∩X={s1,s2}\{s1， s2\} ∩ X = \{s1, s2\} → X_1 ∩ X = \{s1, s2\}{s1，s2}∩X={s1,s2}→X1∩X={s1,s2}

存疑贫困类： {s3,s4,s5,s6}∩X=∅→X2∩X=Ø\{s3, s4, s5, s6\} ∩ X = \empty→ X_2 ∩ X = Ø{s3,s4,s5,s6}∩X=∅→X2∩X=Ø

贫困类： {s7,s8}∩X={s7}→X3∩X={s7}\{s7, s8\} ∩ X = \{s7\} → X_3 ∩ X = \{s7\}{s7,s8}∩X={s7}→X3∩X={s7}

把 X1X_1X1 和 X3X_3X3 称作是 X 关于C 的上近似。记作R‾X\overline{R}XRX.

下近似

对于上文随机给出的一个粗糙集 X={s1, s2, s7}：

非贫困类：{s1, s2} ⊆\subseteq⊆ X → X1X_1X1 ⊆\subseteq⊆ X
存疑贫困类：{s3, s4, s5, s6} ⊈\nsubseteq⊈ X → X2X_2X2 ⊈\nsubseteq⊈ X
贫困类：{s7, s8} ⊈\nsubseteq⊈ X → X3X_3X3 ⊈\nsubseteq⊈ X

把 X1X_1X1 和 X3X_3X3 称作是 X 关于 C 的下近似。记作R‾X\underline{R}XRX.

正域、负域、边界域

论域U被X的上近似以及下近似集划分为正域POSR(X)POS_R(X)POSR(X)，负域NEGR(X)NEG_R(X)NEGR(X)以及边界域BNDR(X)BND_R(X)BNDR(X)三个互不相交的区域。

正域：
POSR(X)=R‾XPOS_R(X) = \underline{R}X POSR(X)=RX
负域：
NEGR(X)=U−R‾XNEG_R(X) = U - \overline{R}X NEGR(X)=U−RX
边界域：
BNDR(X)=R‾X−R‾XBND_R(X) = \overline{R}X - \underline{R}X BNDR(X)=RX−RX

不难看出
POSR(X)∩NEGR(X)∩BNDR(X)=UPOS_R(X) \cap NEG_R(X) \cap BND_R(X) = U POSR(X)∩NEGR(X)∩BNDR(X)=U

系统的定义

在一个决策的信息系统S里:

论域就是数学里的集合，我们研究的对象构成的集合。

知识论域中的任何一个子集都可以被称作是知识，这是一种对于论域进行分类的能力，一般是由特征属性进行分类。

不可分辨关系 在指定的知识下，不可以被区分开来的对象之间构成了不可分辨关系，也就是等价关系。举个例子，如果以是否为贫困生作为标准，那么贫困生中的各个年级的学生都构成了不可分辨关系。

精确集与粗糙集 在一个知识下，如果论域可以由若干子集组合而成，那么论域就构成了精确集，否则，则为粗糙集。

上近似与下近似 上近似就是包含指定的集合X的元素最小可定义集；下近似就是包含X的最大可定义集。

知识粒度：

属性重要度：

知识粒度

在一个决策信息系统S中，存在一种知识B⊂\sub⊂C，使得 U/B={x1,x2,x3,…,xm}U / B = \{x1, x2, x3, …, x_m\}U/B={x1,x2,x3,…,xm}，一共区分出了m个等价类。则B的知识粒度GPu(B)GP_u(B)GPu(B)为:

GPU(B)=∑i=1m∣Xi∣2∣U∣2GP_U(B) = \sum_{i=1}^m\frac{|X_i|^2}{|U|^2} GPU(B)=i=1∑m∣U∣2∣Xi∣2

在粗糙集中，等价类的知识粒度越细，划分的能力就越强，近似集就会越精确；否则，划分能力就弱，近似集越粗糙。

1∣U∣≤GPu(B)≤1\frac{1}{|U|} \leq GP_u(B) \leq 1∣U∣1≤GPu(B)≤1

当U/B={X1,X2,…,X{∣U∣}}U/B = \{X_1, X_2, …, X_\{|U|\}\}U/B={X1,X2,…,X{∣U∣}}时，∣U∣|U|∣U∣是U元素的个数，这是知识粒度最小，为1∣U∣\frac{1}{|U|}∣U∣1，划分能力最强；当U / B = {U} ，此时知识粒度最大，为1，划分能力最弱。

UUU	aaa	bbb	ccc	eee	fff	ddd
1	0	1	1	1	0	1
2	1	1	0	1	0	1
3	1	0	0	0	1	0
4	1	1	0	1	0	1
5	1	0	0	0	1	0
6	0	1	1	1	1	0
7	0	1	1	1	1	0
8	1	0	0	1	0	1
9	1	0	0	1	0	0

例，在上表中，U/C={{1},{2,4}{3,5}{6,7},{8,9}}U/C = \{\{1\}, \{2, 4\}\, \{3, 5\}\{6,7\},\{8,9\}\}U/C={{1},{2,4}{3,5}{6,7},{8,9}}

则C的知识粒度为：

GPU(C)=∑i=15∣Xi∣2∣U∣2GP_U(C) = \sum_{i = 1}^5\frac{|X_i|^2}{|U|^2}GPU(C)=∑i=15∣U∣2∣Xi∣2

C的知识粒度为：
GPU(C)=∑i=15∣Xi∣2∣U∣2=12+22+22+22+2292=1781GP_U(C) = \sum_{i = 1}^5\frac{|X_i|^2}{|U|^2}\\ =\frac{1^2+2^2+2^2+2^2+2^2}{9^2}\\ =\frac{17}{81} GPU(C)=i=1∑5∣U∣2∣Xi∣2=9212+22+22+22+22=8117

相对知识粒度

若U/P={X1,X2,X3,…,Xm}U/P = \{X_1, X_2, X_3, …, X_m\}U/P={X1,X2,X3,…,Xm}，U/Q={Y1,Y2,Y3,…,Ym}U/Q = \{Y_1, Y_2, Y_3, …,Y_m\}U/Q={Y1,Y2,Y3,…,Ym}，则Q相对于P的相对知识粒度为：

GPU(Q∣P)=GPU(P)−GPU(P∪Q)GP_U(Q|P)=GP_U(P)-GP_U(P \cup Q)GPU(Q∣P)=GPU(P)−GPU(P∪Q)

例如上表中的数据，条件属性集C以及决策属性图D，有：

U/C={{1},{2,4},{3,5},{6,7},{8,9}}U/C=\{\{1\},\{2,4\},\{3,5\},\{6,7\},\{8,9\}\}U/C={{1},{2,4},{3,5},{6,7},{8,9}}

U/C∪D={{1}{2,4}{3,5},{6,7}.{8},{9}}U/C\cup D=\{\{1\}\{2,4\}\{3,5\},\{6,7\}.\{8\},\{9\}\}U/C∪D={{1}{2,4}{3,5},{6,7}.{8},{9}}

则D关于C的知识粒度为：

GPU(D∣C)=GPU(C)−GPU(C∪D)=1781−1581=281GP_U(D|C)=GP_U(C)-GP_U(C \cup D)\\=\frac{17}{81}- \frac{15}{81}\\=\frac{2}{81}GPU(D∣C)=GPU(C)−GPU(C∪D)=8117−8115=812

GPU(Q∣P)GP_U(Q|P)GPU(Q∣P)表示了Q相对于P的分类能力。GPU(Q∣P)GP_U(Q|P)GPU(Q∣P)的值越大，表示Q相对于P对于论域U的分类能力就越强；反之，分类能力越弱。

属性重要度

内部属性重要定义如下 给定了一个决策信息系统S，U为论域，B⊆\subseteq⊆C，若∀a∈B\forall a \in B∀a∈B

则属性a关于条件属性集B相对于决策属性集D的内部属性重要度为：

SigUinner=GPU(D∣B−{a})−GPU(D∣B)Sig_{U}^{inner} = GP_U(D|B-\{a\})-GP_U(D|B)SigUinner=GPU(D∣B−{a})−GPU(D∣B)

能力就越强；反之，分类能力越弱。

属性重要度

内部属性重要定义如下 给定了一个决策信息系统S，U为论域，B ⊆\subseteq⊆ C，若∀a∈B\forall a \in B∀a∈B

则属性a关于条件属性集B相对于决策属性集D的内部属性重要度为：

SigUinner=GPU(D∣B−{a})−GPU(D∣B)Sig_{U}^{inner} = GP_U(D|B-\{a\})-GP_U(D|B)SigUinner=GPU(D∣B−{a})−GPU(D∣B)

粗糙集的基础理论汇总相关推荐

编写tcp服务器发送hex格式_Android网络编程-TCP/IP协议
在Android网络编程-计算机网络基础一文中得知,IP协议属于网络层,TCP.UDP协议属于传输层. IP协议是TCP/IP协议族的动力,它为上层协议提供无状态.无连接.不可靠的服务. TCP协议是 ...
博客学院下载 GitChat 论坛问答商城头条活动码云 ITeye 写博客
博客学院下载 GitChat 论坛问答商城头条活动码云 ITeye 写博客发Chat 登录注册常见8种算法总结转载 2017年03月16日 22:23:43 目录冒泡排序鸡尾酒 ...
C语言基础-部分基础理论知识汇总
C语言基础-部分理论知识汇总本文为C语音部分理论知识汇总,主要包含:C语言的特点与程序结构 .基本数据类型.运算符和表达式.基本语句与顺序结构等内容. 本文为个人学习笔记整理,偏向理论知识介绍,具体 ...
java基础理论+java WEB+java开源框架知识点汇总
一. java基础篇 1.final 关键字的作用? 被 final 修饰的类不可以被继承被 final 修饰的方法不可以被重写被 final 修饰的变量不可以被改变.如果修饰引用,那么表示引用不 ...
【总结】有三AI所有GAN相关学习资料汇总，有图文、视频、代码实战等......
GAN无疑是这几年深度学习领域里最酷的技术,不管是理论的研究,还是GAN在图像生成,图像翻译,语音图像等基础领域的应用,都非常的丰富.我们公众号输出过非常多的GAN相关资源,本次做一个简单汇总. 免费 ...
Vue.js实训【基础理论(5天)+项目实战(5天)】博客汇总表【详细笔记】
目录前言基础理论(5天) 基础理论-Day01 基础理论-Day02 基础理论-Day03 基础理论-Day04 基础理论-Day05 项目实战项目实战-Day01 项目实战-Day02 ...
Vue.js-Day02-AM【Vue表单、核心指令（单选框、密码框、多行文本框、单选、多选、勾选、下拉列表）、组件汇总案例、ToDoList案例、计算属性(computed)、watch监听】
Vue.js实训[基础理论(5天)+项目实战(5天)]博客汇总表[详细笔记] 目录 1.Vue表单原生JS实现异步表单提交运行截图代码核心指令单选框.密码框.多行文本框单选多选勾 ...
全球知名大学课件下载地址汇总
本文集合了美国众多知名大学的网上课程课件,不用花一分钱就能获得知名大学的前沿知识!聪明的同学早就收藏转发啦美国大学课件下载地址汇总 1.加州大学伯克利分校http://webcast.berkele ...
大数据人工智能物联网论文_物联网学报“大数据”相关论文汇总
戳上面的蓝字关注我们哦! <物联网学报>"大数据"相关论文汇总 (点击题目即可跳转至指定论文) [1]龚淑蕾, 李堃, 童恩, 等. 基于蜂窝工业物联网的智能工厂解决 ...

粗糙集的基础理论汇总

粗糙集

什么是粗糙集

举一个例子

上近似

下近似

正域、负域、边界域

系统的定义

知识粒度

相对知识粒度

属性重要度

属性重要度

粗糙集的基础理论汇总相关推荐

最新文章

热门文章

UUU	aaa	bbb	ccc	eee	fff	ddd
1	0	1	1	1	0	1
2	1	1	0	1	0	1
3	1	0	0	0	1	0
4	1	1	0	1	0	1
5	1	0	0	0	1	0
6	0	1	1	1	1	0
7	0	1	1	1	1	0
8	1	0	0	1	0	1
9	1	0	0	1	0	0

UUU	aaa	bbb	ccc	eee	fff	ddd
1	0	1	1	1	0	1
2	1	1	0	1	0	1
3	1	0	0	0	1	0
4	1	1	0	1	0	1
5	1	0	0	0	1	0
6	0	1	1	1	1	0
7	0	1	1	1	1	0
8	1	0	0	1	0	1
9	1	0	0	1	0	0

UUU	aaa	bbb	ccc	eee	fff	ddd
1	0	1	1	1	0	1
2	1	1	0	1	0	1
3	1	0	0	0	1	0
4	1	1	0	1	0	1
5	1	0	0	0	1	0
6	0	1	1	1	1	0
7	0	1	1	1	1	0
8	1	0	0	1	0	1
9	1	0	0	1	0	0