机器学习特征筛选:相关系数法(correlation)

通过计算特征与特征之间的相关系数的大小,可判定两两特征之间的相关程度。
取值区间在[-1, 1]之间,取值关系如下:
corr(x1,x2)相关系数值小于0表示负相关((这个变量下降,那个就会上升)),即x1与x2是互补特征
corr(x1,x2)相关系数值等于0表示无相关
corr(x1,x2)相关系数值大于0表示正相关,即x1与x2是替代特征
原理实现:取相关系数值的绝对值,然后把corr值大于90%~95%的两两特征中的某一个特征剔除。

如果两个特征是完全线性相关的,这个时候我们只需要保留其中一个即可。
因为第二个特征包含的信息完全被第一个特征所包含。
此时,如果两个特征同时都保留的话,模型的性能很大情况会出现下降的情况

# 手动相关系数法

# 相关系数--特征与特征
# 自己手写理论公式实现功能
d

机器学习特征筛选:相关系数法(correlation)相关推荐

  1. 机器学习特征筛选:方差选择法VarianceThreshold

    机器学习特征筛选:方差选择法VarianceThreshold 方差是衡量一个变量的离散程度(即数据偏离平均值的程度大小): 变量的方差越大,我们就可以认为它的离散程度越大,也就是意味着这个变量对模型 ...

  2. 机器学习特征筛选:互信息法(mutual information)

    机器学习特征筛选:互信息法(mutual information) 互信息法多为分类问题的分类变量的筛选方法 经典的互信息也是评价定性自变量对定性因变量的相关性的,为了处理定量数据,最大信息系数法被提 ...

  3. R语言基于Boruta进行机器学习特征筛选(Feature Selection)

    R语言基于Boruta进行机器学习特征筛选(Feature Selection) 对一个学习任务来说,给定属性集,有些属性很有用,另一些则可能没什么用.这里的属性即称为"特征"(f ...

  4. python 机器学习——特征筛选实现

    特征筛选实现 1.特征筛选 2.特征筛选具体案例操作 参考文献: 1.特征筛选 (1)含义 特征筛选/选择( Feature Selection )也称特征子集选择( Feature Subset S ...

  5. 【数据竞赛】百赛百试,十试九灵的特征筛选策略-Pearson Correlation

    作者:杰少 Kaggle竞赛知识点--Pearson Correlation! 简 介 Pearson相关性在采用线性模型建模时是必不可少的一种建模策略,它不仅可以用来判断特征与目标变量之间的关系,与 ...

  6. 高维数据中特征筛选方法的思考总结——多变量分析筛选法

    前言:之前的文章(高维数据中特征筛选方法的思考总结--单变量分析筛选法)中,对单变量分析筛选变量进行了初步考量,本文将进一步总结多变量分析筛选法.由于本文多处摘录网上的博客,只是进行了归纳整理,因此笔 ...

  7. 机器学习-特征中的相关性及相关系数、卡方检验、互信息

    在机器学习中,对于特征选择的方法分为三类:过滤式(Filter),包裹式(Wrapper),和嵌入式(Embedding).过滤式方法是先按照某种规则对数据集进行特征选择,然后再训练学习器,特征选择过 ...

  8. R统计绘图-多元线性回归(最优子集法特征筛选及模型构建,leaps)

    此文为<精通机器学习:基于R>的学习笔记,书中第二章详细介绍了线性回归分析过程和结果解读. 回归分析的一般步骤: 1. 确定回归方程中的自变量与因变量. 2. 确定回归模型,建立回归方程. ...

  9. 机器学习项目实战-能源利用率 Part-3(特征工程与特征筛选)

    博主前期相关的博客可见下: 机器学习项目实战-能源利用率 Part-1(数据清洗) 机器学习项目实战-能源利用率 Part-2(探索性数据分析) 这部分进行的特征工程与特征筛选. 三 特征工程与特征筛 ...

最新文章

  1. React 产品实现 -任务管理工具“氢”
  2. socket编程五种模型
  3. 海报设计素材|中国风的插画设计,国画浓抹中国色彩
  4. 6 redis 编译失败_Redis6 Windows 版本编译
  5. 【temu】美国版数据采集API
  6. 维护机房服务器工作,机房维护(服务器搬迁方案).doc
  7. deepfacelab SAE 模型训练参数详解
  8. jave wed 2
  9. mybatis集成springboot的多数据源最新实现
  10. div高度设置100%无效的问题 (亲身实践)
  11. html5 mp3播放器源码,HTML5自定义mp3播放器源码
  12. 那些老牌互联网公司现在都混得怎样了?
  13. Julia ---- 为Julia做一下辩解
  14. 罗马java_罗马数字转换阿拉伯数字(Java版,考虑较为全面)
  15. 我的2021保研之路已凉凉
  16. ISCC2018MISC猫的心事writeup
  17. Microsoft adCenter Analytics统计与Google Analytics、雅虎统计对比
  18. 【BFS】CODE[VS] 2059 逃出克隆岛(奴隶岛)
  19. 西门子et200 分布式i/o_你真的了解西门子Profinet吗?从RT切换到IRT出问题
  20. AI遥感平台——商汤智慧地球的体验

热门文章

  1. 死锁产生条件-不剥夺条件
  2. JVM---对象的实例化内存布局与访问定位
  3. 排序算法---选择排序(java版)
  4. 01 Java面试之控制类
  5. 计算机组成原理cache命中率
  6. 计算机图形学画圆vc代码,计算机图形学实验--完整版-带结果--vc++实现.doc
  7. 红外测试操作步骤_红外传感实验操作步骤及数据分析(无测试实图)
  8. 链表-回文链表(复制+双指针法)
  9. python跨文件全局变量_Python 进程之间共享数据(全局变量)的方法
  10. ICCV 2021 | R-MSFM: 用于单目深度估计的循环多尺度特征调制