粗糙集理论是一种研究不精确,不确定性知识的数学工具。

粗糙集理论的知识表达方式一般采用信息表或称为信息系统的形式,它可以表现为四元有序组K=(U,A,V,P)。其中U为对象的全体,即论域;A是属性全体;V是属性的值域;P为一个信息函数,反映了对象x在K中的完全信息。

粗糙集的思想为:

  一种类别对应一个概念(类别可以用集合表示,概念可以用规则描述),知识由概念组成;如果某个知识含有不精确概念,则该知识不精确。粗糙集对不精确概念的描述方法是通过下近似和上近似概念来描述。

  上近似包含了所有使用知识R可确切分类到X的元素。
  下近似包含了所有那些可能属于X的元素的最小集合。

粗糙集可以解决的问题可以如下一些:

  • 1,不确定或者不精确知识的表达
  • 2,经验学习并从经验中获取知识
  • 3,不一致信息的分析
  • 4,根据不完整得到,不确定的知识进行推理
  • 5,在保留信息的前提下进行数据化简
  • 6,识别并评估数据之间依赖关系

算法思想:

   粗糙集(RS)理论是一种刻画不完整性和不确定性的数学工具,能有效地分析和处理不精确、不一致和不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。

优点

  • (1) 它能处理各种数据,包括不完整(incomplete) 的数据以及拥有众多变量的数据;
  • (2) 它能处理数据的不精确性和模棱两可(ambiguity),包括确定性和非确定性的情况;
  • (3) 它能求得知识的最小表达(reduct) 和知识的各种不同颗粒(granularity) 层次;
  • (4) 它能从数据中揭示出概念简单,易于操作的模式(pattern) ;
  • (5) 它能产生精确而又易于检查和证实的规则,特别适于智能控制中规则的自动生成.

基本概念

知识

“知识”这个概念在不同的范畴内有多种不同的含义。在粗糙集理论中,“知识”被认为是一种分类能力。人们的行为是基于分辨现实的或抽象的对象的能力,如在远古时代,人们为了生存必须能分辨出什么可以食用,什么不可以食用;医生给病人诊断,必须辨别出患者得的是哪一种病。这些根据事物的特征差别将其分门别类的能力均可以看作是某种“知识”。 

不可分辨关系

分类过程中,相差不大的个体被归于同一类,它们的关系就是不可分辨关系(indiscernibility relation). 假定只用两种黑白颜色把空间中的物体分割两类,{黑色物体},{白色物体},那么同为黑色的两个物体就是不可分辨的,因为描述它们特征属性的信息相同,都是黑色.
如果再引入方,圆的属性,又可以将物体进一步分割为四类: {黑色方物体},{黑色圆物体},{白色方物体},{白色圆物体}. 这时,如果两个同为黑色方物体,则它们还是不可分辨的. 不可分辨关系是一种等效关系(equivalence relationship),两个白色圆物体间的不可分辨关系可以理解为它们在白,圆两种属性下存在等效关系.

基本集

基本集(elementary set) 定义为由论域中相互间不可分辨的对象组成的集合,是组成论域知识的颗粒. 不可分辨关系这一概念在粗糙集理论中十分重要,它深刻地揭示出知识的颗粒状结构,是定义其它概念的基础. 知识可认为是一族 等效关系,它将论域分割成一系列的等效类。

集合

粗糙集理论延拓了经典的集合论,把用于分类的知识嵌入集合内,作为集合组成的一部分. 一个对象a 是否属于集合X 需根据现有的知识来判断,可分为三种情况:
⑴ 对象a 肯定属于集合X ;
⑵ 对象a 肯定不属于集X ;
⑶ 对象a 可能属于也可能不属于集合X 。
集合的划分密切依赖于我们所掌握的关于论域的知识,是相对的而不是绝对的.给定一个有限的非空集合U 称为论域,I 为U 中的一族等效关系,即关于U 的知识,则二元对 K = (U,I) 称为一个近似空间(approximation space). 设x 为U 中的一个对象,X为U 的一个子集,I (x) 表示所有与x 不可分辨的对象所组成的集合,换句话说,是由x 决定的等效类,即I (x) 中的每个对象都与x 有相同的特征属性(attribute)。

参考链接:

http://blog.csdn.net/chl033/article/details/3240500http://blog.sina.com.cn/s/blog_65aba7b70100h5s0.html

【机器学习】粗糙集(Rough Set Approach)相关推荐

  1. 机器学习(Machine Learning)深度学习(Deep Learning)资料(Chapter 2)

    机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2) - tony的专栏 - 博客频道 - CSDN.NET 注:机器学习资料篇目一共 ...

  2. 机器学习和深度学习资料汇总【02】

    <Image Scaling using Deep Convolutional Neural Networks> 介绍:使用卷积神经网络的图像缩放. <Proceedings of ...

  3. 机器学习相关资料推荐 http://blog.csdn.net/jiandanjinxin/article/details/51130271

    机器学习(Machine Learning)&深度学习(Deep Learning)资料 标签: 机器学习 2016-04-12 09:16 115人阅读 评论(0) 收藏 举报 分类: 机器 ...

  4. 粗糙集 遗传matlab,一种基于遗传算法和粗糙集的属性约简方法及精神状态评估方法...

    一种基于遗传算法和粗糙集的属性约简方法及精神状态评估方法 [专利摘要]本发明公开了一种基于遗传算法和粗糙集的属性约简方法及精神状态评估方法,该基于遗传算法和粗糙集完成了粗糙集属性约简方法通过设定合适的 ...

  5. 基于自然语言处理的垃圾信息过滤方法

                            基于自然语言处理的垃圾信息过滤方法 Spam Filtering Method Based on Natural Language Processing ...

  6. 人工神经网络 人工智能,人工智能神经网络论文

    1.人工神经网络的论文 神经网络的是我的毕业论文的一部分 4.人工神经网络 人的思维有逻辑性和直观性两种不同的基本方式.逻辑性的思维是指根据逻辑规则进行推理的过程:它先将信息化成概念,并用符号表示,然 ...

  7. 空间数据挖掘技术理论及方法

    葛继科(西南农业大学信息学院 400716)   摘要  本文简要论述了空间数据库技术及空间数据挖掘技术的理论及特点,分析了空间数据挖掘技术的层次.方法,并重点介绍了当前常用的分类.聚类.关联规则等空 ...

  8. 数据挖掘和知识发现的技术、方法及应用

    [-] 数据挖掘和知识发现的技术方法及应用   一幅凝固的油画 数据挖掘和知识发现的技术方法及应用 一幅凝固的油画 Keywords 概念 技术 统计分析statistical analysis 决策 ...

  9. 人工神经网络的发展前景,人工神经网络及其应用

    人工神经网络是哪一年由谁提出来的 人工神经网络是1943年,心理学家W.S.McCulloch和数理逻辑学家W.Pitts提出来. 他们通过MP模型提出了神经元的形式化数学描述和网络结构方法,证明了单 ...

最新文章

  1. 《C#精彩实例教程》小组阅读12 -- C#面向对象技术高级应用
  2. 计算机重装系统知识,电脑重装系统基础知识扫盲贴
  3. Servlet的重定向和转发特点
  4. .NET 简单的smtp协议发邮件
  5. 三角形数、五边形数和六角形数
  6. PS 滤镜算法原理——染色玻璃
  7. sublime cscope使用方法
  8. python编程可以自学么-风变编程的Python这么火,零基础可以自学吗?
  9. matplotlib fontdict 字体设置
  10. 计算机病毒是具有破坏性的程序6,2015年计算机二级MS Office习题及答案解析(6)
  11. VC++常用数据类型
  12. NYOJ-97-兄弟郊游问题
  13. ea建模 教学_周末特惠:EA促销开启,吉你太美首次打折 + EA旗下多款游戏登陆Steam,EA access即将推出...
  14. 鼠标悬停图标360度旋转效果
  15. 华科计算机硕士毕业论文,华中科技大学硕士毕业论文要求_华中科技大学2020年硕士招生简章_华中科技大学研究生院...
  16. html5贝塞尔函数,径向偏振高阶贝塞尔-高斯涡旋光束的传输及其偏振特性
  17. C# winfrom窗体及控件 根据系统的分辨率自动调整位置
  18. 方舟服务器建家位置,《方舟生存进化》五种建家位置!每一种都能暴露建造者的种类!...
  19. Linux内核中的位操作:ffs.h,fls.h
  20. iPad连android热点掉线,iphone热点总掉线怎么办?苹果手机保持热点不断开的方法...

热门文章

  1. 【Android】Android江湖
  2. SQL openxml用法
  3. 【观影笔记】地平线:大数据时代(BBC)
  4. matlab求解非线性常微分方程组,Matlab数值求解非线性常微分方程 - 仿真模拟 - 小木虫 - 学术 科研 互动社区...
  5. 关于1-100中3的倍数的数字
  6. 在线客服系统源码开发实战总结:动态加载js文件实现粘贴一段js的sdk代码,直接引入插件效果...
  7. YouTube多语种视频营销,低成本也能带来高收益
  8. 福昕阅读器:针对PDF文件无法添加注释、附注、书签等功能的解决方法
  9. ARM处理器的七种工作模式,它们的名称(中英文)和应用场景
  10. Arduino小项目1---esp8266 WiFi 签到机