粗糙集

什么是粗糙集

1982年波兰学者Z. Pawlak 提出了粗糙集理论——它是一种刻画不完整性和不确定性的数学工具,能有效地分析不精确,不一致(inconsistent)、不完整(incomplete) 等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。已被广泛应用于知识发现、机器学习、决策支持、模式识别、专家系统及归纳推理等领域。

从数学的角度看,粗糙集是研究集合的;从编程的角度看,粗糙集的研究对象是矩阵,只不过是一些特殊的矩阵;从人工智能的角度来看,粗糙集研究的是决策表。

举一个例子

学生 食堂饭钱 超市花销 其他佐证 贫困
s1
s2
s3 存疑
s4 存疑
s5 存疑
s6 存疑
s7
s8

论域(记作U):病人,比如在这个表格中,就是从s1s8

属性:分为条件属性决策属性(记作C)。

​ 其中,条件属性又有食堂属性、教超属性以及证明属性。

这些条件属性又被称为论域上的知识

我们把这个记作信息系统S

以决策属性C分类的论域S,记作

U / C= { {s1s_1s1​, s2s_2s2​}, {s3,s4,s5,s6s_3, s_4, s_5, s_6s3​,s4​,s5​,s6​}, {s7s_7s7​, s8s_8s8​} } = {X1,X2,X3X_1, X_2, X_3X1​,X2​,X3​}

X1X_1X1​ = {s1,s2s_1, s_2s1​,s2​} 不妨把它称作非贫困类

X2X_2X2​ = {s3,s4,s5,s6s_3, s_4, s_5, s_6s3​,s4​,s5​,s6​} 不妨把它称作存疑贫困类

X3X_3X3​ = {s7,s8s_7, s_8s7​,s8​} 不妨把它称作贫困类

随机给出一个集合X = {s1,s2,s7s_1, s_2, s_7s1​,s2​,s7​} ,显然 X 是C 的粗糙集,因为不能通过组合的方法从 X1,X2,X3X_1, X_2, X_3X1​,X2​,X3​ 得出 X 的。

上近似

对于上文随机给出的一个粗糙集 X={s1,s2,s7s_1, s_2, s_7s1​,s2​,s7​}:

非贫困类{s1,s2}∩X={s1,s2}→X1∩X={s1,s2}\{s1, s2\} ∩ X = \{s1, s2\} → X_1 ∩ X = \{s1, s2\}{s1,s2}∩X={s1,s2}→X1​∩X={s1,s2}

存疑贫困类: {s3,s4,s5,s6}∩X=∅→X2∩X=Ø\{s3, s4, s5, s6\} ∩ X = \empty→ X_2 ∩ X = Ø{s3,s4,s5,s6}∩X=∅→X2​∩X=Ø

贫困类: {s7,s8}∩X={s7}→X3∩X={s7}\{s7, s8\} ∩ X = \{s7\} → X_3 ∩ X = \{s7\}{s7,s8}∩X={s7}→X3​∩X={s7}

X1X_1X1​X3X_3X3​ 称作是 X 关于C上近似。记作R‾X\overline{R}XRX.

下近似

对于上文随机给出的一个粗糙集 X={s1, s2, s7}

非贫困类:{s1, s2} ⊆\subseteq⊆ X → X1X_1X1​ ⊆\subseteq⊆ X
存疑贫困类:{s3, s4, s5, s6} ⊈\nsubseteq⊈ X → X2X_2X2​ ⊈\nsubseteq⊈ X
贫困类:{s7, s8} ⊈\nsubseteq⊈ X → X3X_3X3​ ⊈\nsubseteq⊈ X

X1X_1X1​X3X_3X3​ 称作是 X 关于 C下近似。记作R‾X\underline{R}XR​X.

正域、负域、边界域

论域U被X的上近似以及下近似集划分为正域POSR(X)POS_R(X)POSR​(X),负域NEGR(X)NEG_R(X)NEGR​(X)以及边界域BNDR(X)BND_R(X)BNDR​(X)三个互不相交的区域。

正域:
POSR(X)=R‾XPOS_R(X) = \underline{R}X POSR​(X)=R​X
负域:
NEGR(X)=U−R‾XNEG_R(X) = U - \overline{R}X NEGR​(X)=U−RX
边界域:
BNDR(X)=R‾X−R‾XBND_R(X) = \overline{R}X - \underline{R}X BNDR​(X)=RX−R​X

不难看出
POSR(X)∩NEGR(X)∩BNDR(X)=UPOS_R(X) \cap NEG_R(X) \cap BND_R(X) = U POSR​(X)∩NEGR​(X)∩BNDR​(X)=U

系统的定义

在一个决策的信息系统S里:

论域 就是数学里的集合,我们研究的对象构成的集合。

知识 论域中的任何一个子集都可以被称作是知识,这是一种对于论域进行分类的能力,一般是由特征属性进行分类。

不可分辨关系 在指定的知识下,不可以被区分开来的对象之间构成了不可分辨关系,也就是等价关系。举个例子,如果以是否为贫困生作为标准,那么贫困生中的各个年级的学生都构成了不可分辨关系。

精确集与粗糙集 在一个知识下,如果论域可以由若干子集组合而成,那么论域就构成了精确集,否则,则为粗糙集。

上近似与下近似 上近似就是包含指定的集合X的元素最小可定义集;下近似就是包含X的最大可定义集。

知识粒度:

属性重要度:

知识粒度

在一个决策信息系统S中,存在一种知识B⊂\sub⊂C,使得 U/B={x1,x2,x3,…,xm}U / B = \{x1, x2, x3, …, x_m\}U/B={x1,x2,x3,…,xm​},一共区分出了m个等价类。则B的知识粒度GPu(B)GP_u(B)GPu​(B)为:

GPU(B)=∑i=1m∣Xi∣2∣U∣2GP_U(B) = \sum_{i=1}^m\frac{|X_i|^2}{|U|^2} GPU​(B)=i=1∑m​∣U∣2∣Xi​∣2​

在粗糙集中,等价类的知识粒度越细,划分的能力就越强,近似集就会越精确;否则,划分能力就弱,近似集越粗糙。

1∣U∣≤GPu(B)≤1\frac{1}{|U|} \leq GP_u(B) \leq 1∣U∣1​≤GPu​(B)≤1

当U/B={X1,X2,…,X{∣U∣}}U/B = \{X_1, X_2, …, X_\{|U|\}\}U/B={X1​,X2​,…,X{​∣U∣}}时,∣U∣|U|∣U∣是U元素的个数,这是知识粒度最小,为1∣U∣\frac{1}{|U|}∣U∣1​,划分能力最强;当U / B = {U} ,此时知识粒度最大,为1,划分能力最弱。

UUU aaa bbb ccc eee fff ddd
1 0 1 1 1 0 1
2 1 1 0 1 0 1
3 1 0 0 0 1 0
4 1 1 0 1 0 1
5 1 0 0 0 1 0
6 0 1 1 1 1 0
7 0 1 1 1 1 0
8 1 0 0 1 0 1
9 1 0 0 1 0 0

例,在上表中,U/C={{1},{2,4}{3,5}{6,7},{8,9}}U/C = \{\{1\}, \{2, 4\}\, \{3, 5\}\{6,7\},\{8,9\}\}U/C={{1},{2,4}{3,5}{6,7},{8,9}}

则C的知识粒度为:

GPU(C)=∑i=15∣Xi∣2∣U∣2GP_U(C) = \sum_{i = 1}^5\frac{|X_i|^2}{|U|^2}GPU​(C)=∑i=15​∣U∣2∣Xi​∣2​

C的知识粒度为:
GPU(C)=∑i=15∣Xi∣2∣U∣2=12+22+22+22+2292=1781GP_U(C) = \sum_{i = 1}^5\frac{|X_i|^2}{|U|^2}\\ =\frac{1^2+2^2+2^2+2^2+2^2}{9^2}\\ =\frac{17}{81} GPU​(C)=i=1∑5​∣U∣2∣Xi​∣2​=9212+22+22+22+22​=8117​

相对知识粒度

若U/P={X1,X2,X3,…,Xm}U/P = \{X_1, X_2, X_3, …, X_m\}U/P={X1​,X2​,X3​,…,Xm​},U/Q={Y1,Y2,Y3,…,Ym}U/Q = \{Y_1, Y_2, Y_3, …,Y_m\}U/Q={Y1​,Y2​,Y3​,…,Ym​},则Q相对于P的相对知识粒度为:

GPU(Q∣P)=GPU(P)−GPU(P∪Q)GP_U(Q|P)=GP_U(P)-GP_U(P \cup Q)GPU​(Q∣P)=GPU​(P)−GPU​(P∪Q)

例如上表中的数据,条件属性集C以及决策属性图D,有:

U/C={{1},{2,4},{3,5},{6,7},{8,9}}U/C=\{\{1\},\{2,4\},\{3,5\},\{6,7\},\{8,9\}\}U/C={{1},{2,4},{3,5},{6,7},{8,9}}

U/C∪D={{1}{2,4}{3,5},{6,7}.{8},{9}}U/C\cup D=\{\{1\}\{2,4\}\{3,5\},\{6,7\}.\{8\},\{9\}\}U/C∪D={{1}{2,4}{3,5},{6,7}.{8},{9}}

则D关于C的知识粒度为:

GPU(D∣C)=GPU(C)−GPU(C∪D)=1781−1581=281GP_U(D|C)=GP_U(C)-GP_U(C \cup D)\\=\frac{17}{81}- \frac{15}{81}\\=\frac{2}{81}GPU​(D∣C)=GPU​(C)−GPU​(C∪D)=8117​−8115​=812​

GPU(Q∣P)GP_U(Q|P)GPU​(Q∣P)表示了Q相对于P的分类能力。GPU(Q∣P)GP_U(Q|P)GPU​(Q∣P)的值越大,表示Q相对于P对于论域U的分类能力就越强;反之,分类能力越弱。

属性重要度

内部属性重要定义如下 给定了一个决策信息系统S,U为论域,B⊆\subseteq⊆C,若∀a∈B\forall a \in B∀a∈B

则属性a关于条件属性集B相对于决策属性集D的内部属性重要度为:

SigUinner=GPU(D∣B−{a})−GPU(D∣B)Sig_{U}^{inner} = GP_U(D|B-\{a\})-GP_U(D|B)SigUinner​=GPU​(D∣B−{a})−GPU​(D∣B)

能力就越强;反之,分类能力越弱。

属性重要度

内部属性重要定义如下 给定了一个决策信息系统S,U为论域,B ⊆\subseteq⊆ C,若∀a∈B\forall a \in B∀a∈B

则属性a关于条件属性集B相对于决策属性集D的内部属性重要度为:

SigUinner=GPU(D∣B−{a})−GPU(D∣B)Sig_{U}^{inner} = GP_U(D|B-\{a\})-GP_U(D|B)SigUinner​=GPU​(D∣B−{a})−GPU​(D∣B)

粗糙集的基础理论汇总相关推荐

  1. 编写tcp服务器发送hex格式_Android网络编程-TCP/IP协议

    在Android网络编程-计算机网络基础一文中得知,IP协议属于网络层,TCP.UDP协议属于传输层. IP协议是TCP/IP协议族的动力,它为上层协议提供无状态.无连接.不可靠的服务. TCP协议是 ...

  2. 博客 学院 下载 GitChat 论坛 问答 商城 头条 活动 码云 ITeye 写博客

    博客 学院 下载 GitChat 论坛 问答 商城 头条 活动 码云 ITeye 写博客 发Chat 登录注册 常见8种算法总结 转载 2017年03月16日 22:23:43 目录 冒泡排序 鸡尾酒 ...

  3. C语言基础-部分基础理论知识汇总

    C语言基础-部分理论知识汇总 本文为C语音部分理论知识汇总,主要包含:C语言的特点与程序结构 .基本数据类型.运算符和表达式.基本语句与顺序结构等内容. 本文为个人学习笔记整理,偏向理论知识介绍,具体 ...

  4. java基础理论+java WEB+java开源框架 知识点汇总

    一. java基础篇 1.final 关键字的作用? 被 final 修饰的类不可以被继承 被 final 修饰的方法不可以被重写 被 final 修饰的变量不可以被改变.如果修饰引用,那么表示引用不 ...

  5. 【总结】有三AI所有GAN相关学习资料汇总,有图文、视频、代码实战等......

    GAN无疑是这几年深度学习领域里最酷的技术,不管是理论的研究,还是GAN在图像生成,图像翻译,语音图像等基础领域的应用,都非常的丰富.我们公众号输出过非常多的GAN相关资源,本次做一个简单汇总. 免费 ...

  6. Vue.js实训【基础理论(5天)+项目实战(5天)】博客汇总表【详细笔记】

    目   录 前言 基础理论(5天) 基础理论-Day01 基础理论-Day02 基础理论-Day03 基础理论-Day04 基础理论-Day05 项目实战 项目实战-Day01 项目实战-Day02 ...

  7. Vue.js-Day02-AM【Vue表单、核心指令(单选框、密码框、多行文本框、单选、多选、勾选、下拉列表)、组件汇总案例、ToDoList案例、计算属性(computed)、watch监听】

    Vue.js实训[基础理论(5天)+项目实战(5天)]博客汇总表[详细笔记] 目   录 1.Vue表单 原生JS实现异步表单提交 运行截图 代码 核心指令 单选框.密码框.多行文本框 单选 多选 勾 ...

  8. 全球知名大学课件下载地址汇总

    本文集合了美国众多知名大学的网上课程课件,不用花一分钱就能获得知名大学的前沿知识!聪明的同学早就收藏转发啦 美国大学课件下载地址汇总 1.加州大学伯克利分校http://webcast.berkele ...

  9. 大数据人工智能物联网论文_物联网学报“大数据”相关论文汇总

    戳上面的蓝字关注我们哦! <物联网学报>"大数据"相关论文汇总  (点击题目即可跳转至指定论文) [1]龚淑蕾, 李堃, 童恩, 等. 基于蜂窝工业物联网的智能工厂解决 ...

最新文章

  1. 2020,让我更持久了...
  2. 用python画烟花-python实现烟花小程序
  3. sliverlight--无法启动调试。
  4. LVS+Keepalived实现高可用集群
  5. java mysql jsp分页代码_JAVA/JSP学习系列之六(MySQL翻页例子)
  6. 华为云云原生首次在太空验证,提升“天算星座“卫星计算精度
  7. 第一节 生命周期和Zend引擎
  8. 如何在while和for中使用ssh
  9. 8.0强行转换后变成了7_DCDC电源转换器应用FHP8N60型号,可替代FQP8N60参数的国外场效应管!...
  10. “数学不好,干啥都不行!”高级开发:方向不对,努力也白费!
  11. 白杨SEO:关键词定位与兴趣定位是什么?这两类推广渠道在网络营销上有什么差异?
  12. stm32_电容触摸按键
  13. 【Linux系统】第2节 虚拟机中安装Kali系统
  14. 跑马灯的一些使用心得
  15. 《割绳子》《蜡笔物理学》《Contre Jour》《顽皮鳄鱼爱洗澡》等游戏用Box2D引擎实现物理部分的方法(转)...
  16. gcc -wall -pedantic -ansi
  17. 前几天在头条上收到一条私信,内容大致是这样的:“我学校比较垃圾,想自学 Java 可以吗?自学 Java 难吗?毕业后能找到一份 6k左右的工作吗?”
  18. 扣丁软件测试基础知识,苹果无线充电线圈揭秘,iphone8无线充电线圈介绍
  19. Python+Vue计算机毕业设计财务管理系统v2t48(源码+程序+LW+部署)
  20. 正交函数系-工程数学笔记

热门文章

  1. 14. 深入解析Pod对象(一)
  2. LeetCode 145 二叉树的后序遍历(非递归)
  3. MSIL实用指南-生成break和continue
  4. WordPress主题制作全过程(二):主题文件构成
  5. andriod环境搭建
  6. Vijos 1092 全排列
  7. javascript动态改变窗口大小
  8. Java 面试高频提问知识点一
  9. HTML页面打印功能js代码,JavaScript_js实现页面打印功能实例代码(附去页眉页脚功能代码),复制代码 代码如下: html - phpStudy...
  10. python把某列改为日期格式_如何更改整列的日期格式?