粗糙集的基础理论汇总
粗糙集
什么是粗糙集
1982年波兰学者Z. Pawlak 提出了粗糙集理论——它是一种刻画不完整性和不确定性的数学工具,能有效地分析不精确,不一致(inconsistent)、不完整(incomplete) 等各种不完备的信息,还可以对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。已被广泛应用于知识发现、机器学习、决策支持、模式识别、专家系统及归纳推理等领域。
从数学的角度看,粗糙集是研究集合的;从编程的角度看,粗糙集的研究对象是矩阵,只不过是一些特殊的矩阵;从人工智能的角度来看,粗糙集研究的是决策表。
举一个例子
学生 | 食堂饭钱 | 超市花销 | 其他佐证 | 贫困 |
---|---|---|---|---|
s1 | 高 | 高 | 无 | 否 |
s2 | 高 | 高 | 有 | 否 |
s3 | 高 | 低 | 无 | 存疑 |
s4 | 高 | 低 | 有 | 存疑 |
s5 | 低 | 高 | 无 | 存疑 |
s6 | 低 | 高 | 有 | 存疑 |
s7 | 低 | 低 | 无 | 是 |
s8 | 低 | 低 | 有 | 是 |
论域(记作U):病人,比如在这个表格中,就是从s1到s8
属性:分为条件属性和决策属性(记作C)。
其中,条件属性又有食堂属性、教超属性以及证明属性。
这些条件属性又被称为论域上的知识。
我们把这个记作信息系统S
以决策属性C分类的论域S,记作
U / C= { {s1s_1s1, s2s_2s2}, {s3,s4,s5,s6s_3, s_4, s_5, s_6s3,s4,s5,s6}, {s7s_7s7, s8s_8s8} } = {X1,X2,X3X_1, X_2, X_3X1,X2,X3}
X1X_1X1 = {s1,s2s_1, s_2s1,s2} 不妨把它称作非贫困类
X2X_2X2 = {s3,s4,s5,s6s_3, s_4, s_5, s_6s3,s4,s5,s6} 不妨把它称作存疑贫困类
X3X_3X3 = {s7,s8s_7, s_8s7,s8} 不妨把它称作贫困类
随机给出一个集合X = {s1,s2,s7s_1, s_2, s_7s1,s2,s7} ,显然 X 是C 的粗糙集,因为不能通过组合的方法从 X1,X2,X3X_1, X_2, X_3X1,X2,X3 得出 X 的。
上近似
对于上文随机给出的一个粗糙集 X={s1,s2,s7s_1, s_2, s_7s1,s2,s7}:
非贫困类 : {s1,s2}∩X={s1,s2}→X1∩X={s1,s2}\{s1, s2\} ∩ X = \{s1, s2\} → X_1 ∩ X = \{s1, s2\}{s1,s2}∩X={s1,s2}→X1∩X={s1,s2}
存疑贫困类: {s3,s4,s5,s6}∩X=∅→X2∩X=Ø\{s3, s4, s5, s6\} ∩ X = \empty→ X_2 ∩ X = Ø{s3,s4,s5,s6}∩X=∅→X2∩X=Ø
贫困类: {s7,s8}∩X={s7}→X3∩X={s7}\{s7, s8\} ∩ X = \{s7\} → X_3 ∩ X = \{s7\}{s7,s8}∩X={s7}→X3∩X={s7}
把 X1X_1X1 和 X3X_3X3 称作是 X 关于C 的上近似。记作R‾X\overline{R}XRX.
下近似
对于上文随机给出的一个粗糙集 X={s1, s2, s7}:
非贫困类:{s1, s2} ⊆\subseteq⊆ X → X1X_1X1 ⊆\subseteq⊆ X
存疑贫困类:{s3, s4, s5, s6} ⊈\nsubseteq⊈ X → X2X_2X2 ⊈\nsubseteq⊈ X
贫困类:{s7, s8} ⊈\nsubseteq⊈ X → X3X_3X3 ⊈\nsubseteq⊈ X
把 X1X_1X1 和 X3X_3X3 称作是 X 关于 C 的下近似。记作R‾X\underline{R}XRX.
正域、负域、边界域
论域U被X的上近似以及下近似集划分为正域POSR(X)POS_R(X)POSR(X),负域NEGR(X)NEG_R(X)NEGR(X)以及边界域BNDR(X)BND_R(X)BNDR(X)三个互不相交的区域。
正域:
POSR(X)=R‾XPOS_R(X) = \underline{R}X POSR(X)=RX
负域:
NEGR(X)=U−R‾XNEG_R(X) = U - \overline{R}X NEGR(X)=U−RX
边界域:
BNDR(X)=R‾X−R‾XBND_R(X) = \overline{R}X - \underline{R}X BNDR(X)=RX−RX
不难看出
POSR(X)∩NEGR(X)∩BNDR(X)=UPOS_R(X) \cap NEG_R(X) \cap BND_R(X) = U POSR(X)∩NEGR(X)∩BNDR(X)=U
系统的定义
在一个决策的信息系统S里:
论域 就是数学里的集合,我们研究的对象构成的集合。
知识 论域中的任何一个子集都可以被称作是知识,这是一种对于论域进行分类的能力,一般是由特征属性进行分类。
不可分辨关系 在指定的知识下,不可以被区分开来的对象之间构成了不可分辨关系,也就是等价关系。举个例子,如果以是否为贫困生作为标准,那么贫困生中的各个年级的学生都构成了不可分辨关系。
精确集与粗糙集 在一个知识下,如果论域可以由若干子集组合而成,那么论域就构成了精确集,否则,则为粗糙集。
上近似与下近似 上近似就是包含指定的集合X的元素最小可定义集;下近似就是包含X的最大可定义集。
知识粒度:
属性重要度:
知识粒度
在一个决策信息系统S中,存在一种知识B⊂\sub⊂C,使得 U/B={x1,x2,x3,…,xm}U / B = \{x1, x2, x3, …, x_m\}U/B={x1,x2,x3,…,xm},一共区分出了m个等价类。则B的知识粒度GPu(B)GP_u(B)GPu(B)为:
GPU(B)=∑i=1m∣Xi∣2∣U∣2GP_U(B) = \sum_{i=1}^m\frac{|X_i|^2}{|U|^2} GPU(B)=i=1∑m∣U∣2∣Xi∣2
在粗糙集中,等价类的知识粒度越细,划分的能力就越强,近似集就会越精确;否则,划分能力就弱,近似集越粗糙。
1∣U∣≤GPu(B)≤1\frac{1}{|U|} \leq GP_u(B) \leq 1∣U∣1≤GPu(B)≤1
当U/B={X1,X2,…,X{∣U∣}}U/B = \{X_1, X_2, …, X_\{|U|\}\}U/B={X1,X2,…,X{∣U∣}}时,∣U∣|U|∣U∣是U元素的个数,这是知识粒度最小,为1∣U∣\frac{1}{|U|}∣U∣1,划分能力最强;当U / B = {U} ,此时知识粒度最大,为1,划分能力最弱。
UUU | aaa | bbb | ccc | eee | fff | ddd |
---|---|---|---|---|---|---|
1 | 0 | 1 | 1 | 1 | 0 | 1 |
2 | 1 | 1 | 0 | 1 | 0 | 1 |
3 | 1 | 0 | 0 | 0 | 1 | 0 |
4 | 1 | 1 | 0 | 1 | 0 | 1 |
5 | 1 | 0 | 0 | 0 | 1 | 0 |
6 | 0 | 1 | 1 | 1 | 1 | 0 |
7 | 0 | 1 | 1 | 1 | 1 | 0 |
8 | 1 | 0 | 0 | 1 | 0 | 1 |
9 | 1 | 0 | 0 | 1 | 0 | 0 |
例,在上表中,U/C={{1},{2,4}{3,5}{6,7},{8,9}}U/C = \{\{1\}, \{2, 4\}\, \{3, 5\}\{6,7\},\{8,9\}\}U/C={{1},{2,4}{3,5}{6,7},{8,9}}
则C的知识粒度为:
GPU(C)=∑i=15∣Xi∣2∣U∣2GP_U(C) = \sum_{i = 1}^5\frac{|X_i|^2}{|U|^2}GPU(C)=∑i=15∣U∣2∣Xi∣2
C的知识粒度为:
GPU(C)=∑i=15∣Xi∣2∣U∣2=12+22+22+22+2292=1781GP_U(C) = \sum_{i = 1}^5\frac{|X_i|^2}{|U|^2}\\ =\frac{1^2+2^2+2^2+2^2+2^2}{9^2}\\ =\frac{17}{81} GPU(C)=i=1∑5∣U∣2∣Xi∣2=9212+22+22+22+22=8117
相对知识粒度
若U/P={X1,X2,X3,…,Xm}U/P = \{X_1, X_2, X_3, …, X_m\}U/P={X1,X2,X3,…,Xm},U/Q={Y1,Y2,Y3,…,Ym}U/Q = \{Y_1, Y_2, Y_3, …,Y_m\}U/Q={Y1,Y2,Y3,…,Ym},则Q相对于P的相对知识粒度为:
GPU(Q∣P)=GPU(P)−GPU(P∪Q)GP_U(Q|P)=GP_U(P)-GP_U(P \cup Q)GPU(Q∣P)=GPU(P)−GPU(P∪Q)
例如上表中的数据,条件属性集C以及决策属性图D,有:
U/C={{1},{2,4},{3,5},{6,7},{8,9}}U/C=\{\{1\},\{2,4\},\{3,5\},\{6,7\},\{8,9\}\}U/C={{1},{2,4},{3,5},{6,7},{8,9}}
U/C∪D={{1}{2,4}{3,5},{6,7}.{8},{9}}U/C\cup D=\{\{1\}\{2,4\}\{3,5\},\{6,7\}.\{8\},\{9\}\}U/C∪D={{1}{2,4}{3,5},{6,7}.{8},{9}}
则D关于C的知识粒度为:
GPU(D∣C)=GPU(C)−GPU(C∪D)=1781−1581=281GP_U(D|C)=GP_U(C)-GP_U(C \cup D)\\=\frac{17}{81}- \frac{15}{81}\\=\frac{2}{81}GPU(D∣C)=GPU(C)−GPU(C∪D)=8117−8115=812
GPU(Q∣P)GP_U(Q|P)GPU(Q∣P)表示了Q相对于P的分类能力。GPU(Q∣P)GP_U(Q|P)GPU(Q∣P)的值越大,表示Q相对于P对于论域U的分类能力就越强;反之,分类能力越弱。
属性重要度
内部属性重要定义如下 给定了一个决策信息系统S,U为论域,B⊆\subseteq⊆C,若∀a∈B\forall a \in B∀a∈B
则属性a关于条件属性集B相对于决策属性集D的内部属性重要度为:
SigUinner=GPU(D∣B−{a})−GPU(D∣B)Sig_{U}^{inner} = GP_U(D|B-\{a\})-GP_U(D|B)SigUinner=GPU(D∣B−{a})−GPU(D∣B)
能力就越强;反之,分类能力越弱。
属性重要度
内部属性重要定义如下 给定了一个决策信息系统S,U为论域,B ⊆\subseteq⊆ C,若∀a∈B\forall a \in B∀a∈B
则属性a关于条件属性集B相对于决策属性集D的内部属性重要度为:
SigUinner=GPU(D∣B−{a})−GPU(D∣B)Sig_{U}^{inner} = GP_U(D|B-\{a\})-GP_U(D|B)SigUinner=GPU(D∣B−{a})−GPU(D∣B)
粗糙集的基础理论汇总相关推荐
- 编写tcp服务器发送hex格式_Android网络编程-TCP/IP协议
在Android网络编程-计算机网络基础一文中得知,IP协议属于网络层,TCP.UDP协议属于传输层. IP协议是TCP/IP协议族的动力,它为上层协议提供无状态.无连接.不可靠的服务. TCP协议是 ...
- 博客 学院 下载 GitChat 论坛 问答 商城 头条 活动 码云 ITeye 写博客
博客 学院 下载 GitChat 论坛 问答 商城 头条 活动 码云 ITeye 写博客 发Chat 登录注册 常见8种算法总结 转载 2017年03月16日 22:23:43 目录 冒泡排序 鸡尾酒 ...
- C语言基础-部分基础理论知识汇总
C语言基础-部分理论知识汇总 本文为C语音部分理论知识汇总,主要包含:C语言的特点与程序结构 .基本数据类型.运算符和表达式.基本语句与顺序结构等内容. 本文为个人学习笔记整理,偏向理论知识介绍,具体 ...
- java基础理论+java WEB+java开源框架 知识点汇总
一. java基础篇 1.final 关键字的作用? 被 final 修饰的类不可以被继承 被 final 修饰的方法不可以被重写 被 final 修饰的变量不可以被改变.如果修饰引用,那么表示引用不 ...
- 【总结】有三AI所有GAN相关学习资料汇总,有图文、视频、代码实战等......
GAN无疑是这几年深度学习领域里最酷的技术,不管是理论的研究,还是GAN在图像生成,图像翻译,语音图像等基础领域的应用,都非常的丰富.我们公众号输出过非常多的GAN相关资源,本次做一个简单汇总. 免费 ...
- Vue.js实训【基础理论(5天)+项目实战(5天)】博客汇总表【详细笔记】
目 录 前言 基础理论(5天) 基础理论-Day01 基础理论-Day02 基础理论-Day03 基础理论-Day04 基础理论-Day05 项目实战 项目实战-Day01 项目实战-Day02 ...
- Vue.js-Day02-AM【Vue表单、核心指令(单选框、密码框、多行文本框、单选、多选、勾选、下拉列表)、组件汇总案例、ToDoList案例、计算属性(computed)、watch监听】
Vue.js实训[基础理论(5天)+项目实战(5天)]博客汇总表[详细笔记] 目 录 1.Vue表单 原生JS实现异步表单提交 运行截图 代码 核心指令 单选框.密码框.多行文本框 单选 多选 勾 ...
- 全球知名大学课件下载地址汇总
本文集合了美国众多知名大学的网上课程课件,不用花一分钱就能获得知名大学的前沿知识!聪明的同学早就收藏转发啦 美国大学课件下载地址汇总 1.加州大学伯克利分校http://webcast.berkele ...
- 大数据人工智能物联网论文_物联网学报“大数据”相关论文汇总
戳上面的蓝字关注我们哦! <物联网学报>"大数据"相关论文汇总 (点击题目即可跳转至指定论文) [1]龚淑蕾, 李堃, 童恩, 等. 基于蜂窝工业物联网的智能工厂解决 ...
最新文章
- 2020,让我更持久了...
- 用python画烟花-python实现烟花小程序
- sliverlight--无法启动调试。
- LVS+Keepalived实现高可用集群
- java mysql jsp分页代码_JAVA/JSP学习系列之六(MySQL翻页例子)
- 华为云云原生首次在太空验证,提升“天算星座“卫星计算精度
- 第一节 生命周期和Zend引擎
- 如何在while和for中使用ssh
- 8.0强行转换后变成了7_DCDC电源转换器应用FHP8N60型号,可替代FQP8N60参数的国外场效应管!...
- “数学不好,干啥都不行!”高级开发:方向不对,努力也白费!
- 白杨SEO:关键词定位与兴趣定位是什么?这两类推广渠道在网络营销上有什么差异?
- stm32_电容触摸按键
- 【Linux系统】第2节 虚拟机中安装Kali系统
- 跑马灯的一些使用心得
- 《割绳子》《蜡笔物理学》《Contre Jour》《顽皮鳄鱼爱洗澡》等游戏用Box2D引擎实现物理部分的方法(转)...
- gcc -wall -pedantic -ansi
- 前几天在头条上收到一条私信,内容大致是这样的:“我学校比较垃圾,想自学 Java 可以吗?自学 Java 难吗?毕业后能找到一份 6k左右的工作吗?”
- 扣丁软件测试基础知识,苹果无线充电线圈揭秘,iphone8无线充电线圈介绍
- Python+Vue计算机毕业设计财务管理系统v2t48(源码+程序+LW+部署)
- 正交函数系-工程数学笔记
热门文章
- 14. 深入解析Pod对象(一)
- LeetCode 145 二叉树的后序遍历(非递归)
- MSIL实用指南-生成break和continue
- WordPress主题制作全过程(二):主题文件构成
- andriod环境搭建
- Vijos 1092 全排列
- javascript动态改变窗口大小
- Java 面试高频提问知识点一
- HTML页面打印功能js代码,JavaScript_js实现页面打印功能实例代码(附去页眉页脚功能代码),复制代码 代码如下: html - phpStudy...
- python把某列改为日期格式_如何更改整列的日期格式?