学习笔记,仅供参考,有错必纠

关键词: 数据填补;不完备数据;聚类;约束容差集合差异度


基于不完备数据聚类的缺失数据填补方法

摘要

缺失数据的处理是数据挖掘领域进行数据预处理的一个重要问题.传统的缺失数据填补方法大部分是基于概率分布等一些统计假设,对于大数据集的数据挖掘不一定是最适合的方法 . 受不完备数据分析( ROUSTIDA )未采用传统的概率统计学方法启发,提出基于不完备数据聚类的缺失数据填补方法( MIBOI ),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.

采用 UCI 机器学习基准数据集进行实验表明, MIBOI 对缺失数据的填补是有效可行的 .

引言

在实际数据分析中,经常遇到数据缺失问题.作为机器学习领域基准数据库的 UCI数据集中超过40%的数据库都含有缺失数据 [1 ] &#x

文献记录(part61)--基于不完备数据聚类的缺失数据填补方法相关推荐

  1. uci数据集中的缺失数据_从uci早期糖尿病风险预测数据集中创建分类器

    uci数据集中的缺失数据 To begin we must first go and download the dataset from the UCI dataset repository. The ...

  2. 文献记录(part75)--基于最大平均熵率的大数据关联聚类算法

    学习笔记,仅供参考,有错必纠 基于最大平均熵率的大数据关联聚类算法 摘要 聚类是数据挖掘和机器学习中的基本任务之一 . 传统聚类方法由于其设计中对簇结构假设的限制 , 导致算法在不符合其假设的数据集上 ...

  3. 文献精讲-基于双层局部对比度的红外弱小目标检测方法(DLCM)

    分享一下个人对于近期读过的一篇文献<基于双层局部对比度的红外弱小目标检测方法>的理解,文献的链接放在文章最后.侵权请联系删除. 一.原理 1.计算目标区域和内层窗口的灰度差d(T,IB)和 ...

  4. 文献学习(part52)--基于泛岭估计对岭估计过度压缩的改进方法

    学习笔记,仅供参考,有错必纠 文章目录 基于泛岭估计对岭估计过度压缩的改进方法 摘要 引言 岭估计方法 岭估计的主要问题 改进的岭估计方法 基于泛岭估计对岭估计过度压缩的改进方法 摘要 岭估计是解决多 ...

  5. 文献记录(part65)--基于用户聚类的异构社交网络推荐算法

    学习笔记,仅供参考,有错必纠 关键词 :社交网络:推荐系统:聚类算法:图摘要:数据挖掘 文章目录 基于用户聚类的异构社交网络推荐算法 摘要 引言 GCCR总体框架 基于用户聚类的异构社交网络推荐算法 ...

  6. 文献记录(part67)--基于决策树模型重用的分布变化流数据学习

    学习笔记,仅供参考,有错必纠 关键词:机器学习 , 分布变化 , 流数据 , 模型重用 , 集成学习 , 动态环境 基于决策树模型重用的分布变化流数据学习 摘要 在很多真实应用中 , 数据以流的形式不 ...

  7. 文献记录(part82)--基于监督联合去噪模型的社交网络链接预测

    学习笔记,仅供参考,有错必纠 关键词:社交网络分析 , 预测 , 监督学习 , 社区网络 , 矩阵 " 去噪 ", 弱大数定律 基于监督联合去噪模型的社交网络链接预测 摘要 社交网 ...

  8. 文献记录(part80)--基于平均互信息的最优社区发现方法

    学习笔记,仅供参考,有错必纠 关键词:AMI-COPRA 算法 ;AMI-GN 算法 ;平均互信息 ;AMI 方法 ;社区发现; 基于平均互信息的最优社区发现方法 摘要 本文提出一种基于平均互信息的最 ...

  9. 文献记录(part73)--基于 PCA 的信息压缩 : 从一阶到高阶

    学习笔记,仅供参考,有错必究 关键词:主成分分析 , 信息压缩 , 高阶张量 , Tucker 分解 , 各向异性 文章目录 基于 PCA 的信息压缩 : 从一阶到高阶 摘要 引言 从一阶PCA到高阶 ...

最新文章

  1. WebGL学习之纹理盒
  2. Windows系统编程之进程间通信
  3. HBase 在人工智能场景的使用
  4. 利用两款软件实现图片转文字
  5. 字符串转16进制_16、atoi-整数字符串转整数-leetcode8-中等
  6. “水仙花数”你了解多少??
  7. [转]mysql慢查询日志
  8. dk7与jdk8环境共存与切换
  9. 杜比服务器系统安装教程,win10杜比音效如何安装?win10安装杜比音效的详细教程...
  10. 怀旧在2022:游戏ROM下载+游戏模拟器推荐(安卓/iOS)
  11. 调用微信API获取小程序URL Link
  12. 通俗的理解:什么是编程语言?
  13. python 读excel每行替换_Python使用openpyxl读写excel文件
  14. C语言异或运算逆运算,异或的逆运算
  15. 提高Java开发效率:5个常用的Visual Studio代码扩展工具
  16. 分享几个appstore之外的iOS软件下载网址
  17. 小米平板4刷入twrp
  18. Modern PHP读书笔记一
  19. 9.2.1 Python图像处理之图像数学形态学-二值形态学应用之噪声消除
  20. ValidationError: Invalid options object.报错

热门文章

  1. Armijo-Goldstein和wolfe-power的matlab代码实现(转)
  2. Rstudio修改背景颜色和源
  3. 修改默认的pip版本为对应python2.7
  4. 使用pos标记寻找三词短语
  5. 获取python包的路径
  6. OpenCV学习笔记九-Canny边缘检测
  7. 中职计算机说课稿三篇,2020精选中职计算机说课稿3篇(15页)-原创力文档
  8. 让Eclipse启动时显示选择workspace的对话框
  9. ionic 签名、打包
  10. 让工作与(vue)音乐相伴