粗糙集理论介绍(一)(rough set)
首先介绍基本粗糙集理论,之后介绍多粒度粗糙集,优势粗糙集,邻域粗糙集等
1.基本概念
信息系统:
定义一个四元组称之为信息系统,表示为(U,Q,V,f)(U,Q,V,f)(U,Q,V,f),其中:
UUU是对象集合,又称为论域,即x1,x2,x3…
QQQ是属性集合(包括条件属性C和决策属性D)
VVV是属性的值域
fff是一种映射,反应对象之间的值
如下面表格即为信息系统:
U | A1 | A2 | A3 | A4 |
---|---|---|---|---|
1 | 0 | 0 | 1 | 0 |
2 | 1 | 0 | 2 | 1 |
3 | 1 | 1 | 1 | 0 |
4 | 0 | 2 | 1 | 1 |
5 | 1 | 2 | 1 | 0 |
其中U={1,2,3,4,5}U=\{1,2,3,4,5\}U={1,2,3,4,5},Q={A1,A2,A3,A4}Q=\{A1,A2,A3,A4\}Q={A1,A2,A3,A4},V={0,1,2}V=\{0,1,2\}V={0,1,2}
知识:
粗糙集中,知识被认为是一种分类能力,根据事务特征差别将其分门别类的能力都可以看作某种知识。
论域中相互间不可分辨的对象组成的集合,是组成知识的颗粒(grannule)。知识的粒度越小,能精确的表达的概念越多。知识的表示形式:不可分辨关系/等价类,粒度是知识的最小单位。
不可分辨(等价)关系:
不可分辨率关系即等价关系,详细定义可以参见离散数学的内容。在粗糙集中,指分类过程中,相差不大的个体被归类于同一类,他们的关系就是不可区分关系。
对于任何一个属性的集合PPP,不可分辨关系用INDINDIND表示,定义如下:
IND(P)={(x,y)∈U×U:f(x,a)=f(a,x),a∈P}IND(P)=\{(x,y)\in U \times U:f(x,a)=f(a,x),a\in P\}IND(P)={(x,y)∈U×U:f(x,a)=f(a,x),a∈P}
不可分辨关系就是U上的等价关系。
基本集:由论域中相互间不可区分的对象组成的集合,是组成论域知识的颗粒。
如下表描述:
U | R1 (颜色) | R2(形状) | R3(体积) |
---|---|---|---|
X1 | 红 | 圆形 | 小 |
X2 | 蓝 | 方形 | 大 |
X3 | 红 | 三角形 | 小 |
X4 | 蓝 | 三角形 | 小 |
X5 | 黄 | 圆形 | 小 |
X6 | 黄 | 方形 | 小 |
X7 | 红 | 三角形 | 大 |
X8 | 黄 | 三角形 | 大 |
取不同的属性组合,可以得到不同的等价关系(粒度)为:
IND(R1)={{x1,x3,x7},{x2,x4},{x5,x6,x8}}
IND(R1,R2)={{x1},{x2},{x3,x7},{x4},{x5},{x6},{x8}}
集合的上下近似:
根据知识判断对象a是否属于集合X,由三种情况:a肯定属于集合X、a可能属于集合X也可能不属于集合X,a不可能属于集合X。关于上下近似的具体定于如下:
设U为论域(非空对象集合),I为U中的等价关系,X⊂UX\subset UX⊂U,则有:
集合X关于关系I的下近似是根据享有的知识判断肯定属于X的对象所组成的最大集合,有时也成为X的正区域,记为POS(X):
I∗={x∈U:I(x)⊂X}I_*=\{ x\in U:I(x)\subset X\}I∗={x∈U:I(x)⊂X}
集合X关于I的上近似是由所有与X相交的非空等效类I(x)的并集,是哪些可能属于X的对象的组成的最小集合:
I∗={x∈U:I(x)∩X≠∅}I^*=\{ x\in U:I(x)\cap X\neq \emptyset\}I∗={x∈U:I(x)∩X=∅}
如果一个集合的上下近似相等,则该集合成为精确集合,否则称之为粗糙集,其中下近似称之为该概念的正区域,上下近似的差称之为边界。上近似以为的区域称之为负区域,记为NEG(X)
BND(X)=I∗(X)−I∗(X)BND(X)=I^*(X)-I_*(X)BND(X)=I∗(X)−I∗(X)
I∗(X)+NEG(X)=论域UI^*(X)+NEG(X)=论域UI∗(X)+NEG(X)=论域U
对于如下表格:
U | R1 (颜色) | R2(形状) | R3(体积) | class |
---|---|---|---|---|
X1 | 红 | 圆形 | 小 | 1 |
X2 | 蓝 | 方形 | 大 | 1 |
X3 | 红 | 三角形 | 小 | 1 |
X4 | 蓝 | 三角形 | 小 | 1 |
X5 | 黄 | 圆形 | 小 | 2 |
X6 | 黄 | 方形 | 小 | 2 |
X7 | 红 | 三角形 | 大 | 2 |
X8 | 黄 | 三角形 | 大 | 2 |
等价类IND(R1)={{x1,x3,x7},{x2,x4},{x5,x6,x8}}
X={x1,x2,x3,x4}
这样根据前面的上下近似得求法,很容易得到:
I∗(X)=x2,x4I_*(X)={x2,x4}I∗(X)=x2,x4
I∗(X)=x1,x3,x7,x2,x4I_*(X)={x1,x3,x7,x2,x4}I∗(X)=x1,x3,x7,x2,x4
粗糙度:
使用粗糙度来描述粗糙集得近似程度,定义如下:
β=I∗(X)I(X)\beta=\frac{I_*(X)}{I^(X)}β=I(X)I∗(X)
粗糙隶属函数:
含糊集合没有清晰得边界,即,根据论域中现有知识无法判定某些元素是否属于该集合,在粗糙集中,不确定性概念是针对元素隶属于集合得程度而言的:
uxIX=X∩I(X)I(X)u_x^I{X}=\frac{X\cap I(X)}{I(X)}uxIX=I(X)X∩I(X)
也可以使用粗糙隶属函数来定义集合X的逼近和边界区:
I∗(X)={x∈U:uxI(x)=1}I_*(X)=\{x\in U: u_x^I(x)=1\}I∗(X)={x∈U:uxI(x)=1}
I∗(X)={x∈U:uxI(x)>1}I^*(X)=\{x\in U: u_x^I(x)>1\}I∗(X)={x∈U:uxI(x)>1}
BND(X)={x∈U:uxI(x)>1}BND(X)=\{x\in U: u_x^I(x)>1\}BND(X)={x∈U:uxI(x)>1}
其他数学概念:
下面这些概念需要了解,以加深对粗糙集理论的理解:
笛卡尔积,关系,二元关系,等价关系,等价类,自反性、对称性、传递性等等
粗糙集理论介绍(一)(rough set)相关推荐
- 粗糙集理论介绍(二)
粗糙集理论的简单应用 粗糙集理论常用于数据挖掘领域中的决策以及维度约简.下面稍微介绍一下: 属性的重要性.属性约简和核 设有决策系统S=(U,C∪D,V,f)S=(U,C\cup D,V,f)S=(U ...
- 粗糙集理论介绍(概念入门)
面对日益增长的数据库,人们将如何从这些浩瀚的数据中找出有用的知识?我们如何将所学到的知识去粗取精?什么是对事物的粗线条描述什么是细线条描述? 粗糙集合论回答了上面的这些问题.要想了解粗糙集合论的思想, ...
- 粗糙集理论相关基本概念及属性约简
目录 粗糙集理论和数据挖掘的关系 1.Rough集的基本概念 2.属性约简 粗糙集理论和数据挖掘的关系 Rough set理论和数据挖掘关系密切,它能为数据挖掘提供新的方法和工具,且具有以下特点: 首 ...
- 粗糙集理论---研究现状
当前,除了以粗糙集理论为主题的会议或研讨班相继召开外,许多国际重要学术会议和学术研讨班也都把粗糙集理论的研究列入会议和讨论班的主要内容之一,这些都极大地促进了该理论的发展及其在各个领域中的应用. 对粗 ...
- 粗糙集在计算机网络中的应用,粗糙集理论在入侵检测系统中的应用研究软件工程专业论文.docx...
粗糙集理论在入侵检测系统中的应用研究软件工程专业论文 I I 摘要 摘要 随着计算机网络技术的发展,新的攻击手段可能使网络流量呈现出全新的特 征.传统的 IDS 存在着大量的问题:对未知的网络攻击检测 ...
- 实例学习SSIS(五)--理论介绍SSIS
导读: 实例学习SSIS(一)--制作一个简单的ETL包 实例学习SSIS(二)--使用迭代 实例学习SSIS(三)--使用包配置 实例学习SSIS(四)--使用日志记录和错误流重定向 实例学习SSI ...
- 随机抽样一致算法(RANSAC)理论介绍和程序实现
1.随机抽样一致算法(Random sample consensus,RANSAC)理论介绍 Ordinary LS是保守派:在现有数据下,如何实现最优.是从一个整体误差最小的角度去考虑,尽量谁也不得 ...
- 粗糙集理论应用的实例
在了解infobright时,其查询优化器的一个核心是使用粗糙集理论来做书数据节点的筛选,于是在网上查到一个广为流传的粗糙集应用实例,蛮有意思的 考虑一个数据库中的二维表如下: 元素 颜色 形状 大小 ...
- 深度学习之目标检测(九)--YOLOv3 SPP理论介绍
深度学习之目标检测(九)-- YOLOv3 SPP理论介绍 深度学习之目标检测(九)YOLOv3 SPP理论介绍 1. Mosaic 图像增强 2. SPP 模块 3. CIoU Loss 3.1 I ...
- 一、DMSP/OLS、NPP/VIIRS等夜间灯光数据之GDP空间化的理论介绍
一.前言 自上世纪90年代以来,DMSP/OLS夜间灯光数据问世,由于和其他遥感数据不同,该数据可以探测到地球夜间微弱的灯光.随着数据的积累,可以获取长时间序列的数据之后,随后常用于人类社会经济指标的 ...
最新文章
- 跟我学Springboot开发后端管理系统6:缓存框架Caffeine
- 河南省住建厅调研新郑智慧城市建设 市民享受服务便利
- android除去标题栏或全屏
- php网页轮播图,JavaScript_JavaScript实现图片轮播的方法,本文实例讲述了JavaScript实现图 - phpStudy...
- python教材答案第六章_python第六章{输入和输出}
- C# datetime 格式化
- Hive 中日志的存放位置
- 汉字区位码---非常浅显的知识点
- 基于ArcGIS和fragstats软件计算景观破碎度(一)
- 亚马逊美国站店铺fbm自发货流程是什么?亚马逊美国站店铺fbm如何做起来?
- 如何区分网线是几类的_如何区分家里的网线是超五类还是超六类的呢?
- 十八、疑案系列之——永远的无头公案
- 数据处理任务量级巨大?构建预置容器镜像的Amazon EKS解决方案了解一下!
- 三相直流无刷电机驱动
- 96Boards MIPI CSI Camera Mezzanine
- [错误解决] paramiko.ssh_exception.SSHException: Error reading SSH protocol banner
- Android中加速和位置传感器的使用
- 非精确一维线搜索(Armijo-Goldstein Rule 和 Wolfe-Powell Rule)
- vue控制台报错Duplicate keys detected:‘xxxx‘.This may canse an update error
- LWN: 使用BigBlueButton进行视频会议!
热门文章
- Qt 串口调试软件自动发送数据
- 最节省计算机硬件,在Word 的文档视图中,最节省计算机硬件资源的是( )视图.
- mysql order by file_深聊MySQL,从入门到入坟之:如何让order by、group by查询速度飞起来...
- spring boot整合SpringSecurity-04 使用jwt的方式认证
- am335x linux 的uboot工作流程.doc,am335x uboot2016.05 (MLO u-boot.img)执行流程(转)
- win10卸载软件程序
- 计算机英语带字幕,计算机专业英语听力字幕.doc
- Python读取excel画图
- UVM基本介绍(UVM class hierarchy、验证平台、树状图)
- Android 6.0 双向通话自动录音