根据给定方差的阈值,删除掉值变化小的维度,以此降低数据规模。当把阈值设置为0的时候,就会删除没有变化的数据。

示例

import numpy as np
from sklearn.feature_selection import VarianceThresholddef drop_min_value(data):"""根据方差去除变化小的特征"""sel = VarianceThreshold(threshold=0)  # 方差阈值,去掉方差为0的数据,也就是去除一个值的数据result = sel.fit_transform(data)return resultif __name__ == '__main__':X = np.array([[0, 0, 1],[0, 1, 0],[0, 0, 0],[0, 1, 1]])new_x = drop_min_value(X)print(new_x)  # 把第1列删掉了

sklearn文档:https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.VarianceThreshold.html

特征筛选1——根据方差筛选(单变量筛选)相关推荐

  1. 特征筛选6——肯德尔相关系数筛选特征(单变量筛选)

    肯德尔系数主要是用来判断两个有序序列的相关性 大致的计算流程: 对x与y先进行排序,得到不同的值对应的顺序 x与y配对计算,判断他们的顺序的一致对 (x的顺序与y的顺序相同) 和分歧对 (x的顺序与y ...

  2. 特征筛选5——距离相关系数筛选特征(单变量筛选)

    距离相关系数用来判断两个变量是否独立,值域为[0,2] 值接近0,两个变量正相关 值接近1,两个变量无关 值接近2,两个变量负相关 距离相关系数可以参考:https://docs.scipy.org/ ...

  3. 特征筛选4——斯皮尔曼相关系数筛选特征(单变量筛选)

    斯皮尔曼相关系数(斯皮尔曼等级相关系数),可以用来计算单调性,计算思路是: 首先将值做排序 判断排序的序号之间的相关系数 更多详情请参考:https://zh.wikipedia.org/wiki/% ...

  4. 特征筛选3——卡方检验筛选特征(单变量筛选)

    sklearn文档:https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.chi2.html 卡方检验 ...

  5. 特征筛选2——皮尔逊相关系数筛选(单变量筛选)

    值域为正负1之间,用来筛查单变量与预测结果之间的相关关系,一般来讲: 绝对值在0-0.1之间:无关 绝对值在0.1-0.3之间:弱相关关系 绝对值在0.3-0.6之间:存在相关关系 绝对值在0.6-0 ...

  6. 高维数据中特征筛选方法的思考总结——单变量分析筛选法

    基因组学.转录组学.蛋白组学及代谢组学等生信问题(高通量数据)中,面临的第一步往往就是降维(或者说筛选特征).降维方法分为两大类:单变量分析降维法.多变量分析降维法.单变量降维常常使用FC值或者P值, ...

  7. ML之FE:机器学习算法/数据挖掘中特征选取(变量筛选)的简介、常用方法(单变量分析并筛选—Filter/Wrapper/Embedded、多变量间相关性分析并筛选—PCC/MIC/IV)之详细攻略

    ML之FE:机器学习算法/数据挖掘中特征选取(变量筛选)的简介.常用方法(单变量分析并筛选-Filter/Wrapper/Embedded.多变量间相关性分析并筛选-PCC/MIC/IV)之详细攻略 ...

  8. R语言回归模型构建、回归模型基本假设(正态性、线性、独立性、方差齐性)、回归模型诊断、car包诊断回归模型、特殊观察样本分析、数据变换、模型比较、特征筛选、交叉验证、预测变量相对重要度

    R语言回归模型构建.回归模型基本假设(正态性.线性.独立性.方差齐性).回归模型诊断.car包诊断回归模型.特殊观察样本分析.数据变换.模型比较.特征筛选.交叉验证.预测变量相对重要度 目录

  9. 机器学习第18篇 - Boruta特征变量筛选(2)

    前面(机器学习第17篇 - 特征变量筛选(1))评估显示Boruta在生物数据中具有较高的特征变量选择准确度,下面就具体看下如何应用Boruta进行特征变量选择. Boruta算法概述 Boruta得 ...

最新文章

  1. c语言五子棋评估函数,简易五子棋评估函数
  2. Hacktoberfest活动导致GitHub捐款近5万
  3. 【高并发】java中的CAS,你需要知道的东西
  4. 命令行编译执行java文件
  5. ACM-百度之星资格赛之Energy Conversion——hdu4823
  6. CISCO 路由器启动自动配置
  7. 6. Keras-RNN应用
  8. 线性时变系统状态方程的解
  9. Jmeter 中的BeanShell使用
  10. 使用Atmel Studio7和USBasp烧写器烧写AVR单片机
  11. cobar_note
  12. 得到APP之订阅专栏《硅谷来信》和《精英日课》目录
  13. VB 提示框MsgBox用法
  14. 给小朋友讲故事——第一次世界大战(音频)
  15. 怎么样可以把pdf合并在一起呢
  16. [日语]学习“五十音”(读音篇)
  17. 葵花宝典——放入word中
  18. HTTP3 (QUIC) 协议
  19. Hadoop学习——Hadoop概述
  20. UE4 C++ 类的4种引用类型,和异步加载资产

热门文章

  1. linux下overcommit_memory的问题
  2. 用mendeley在word中插入文献_Mendeley教程-参考文献引用(论文撰写必备!)
  3. UE4的MaterialInstance作用
  4. 关于OpenGL ES中的纹理压缩
  5. 暂停交易?ERC20合约整数溢出安全漏洞案例技术分析一
  6. PCB常用度量衡单位
  7. MyEclipse-6.5注冊码生成器源代码
  8. nagios监控windows主机 linux主机
  9. 剧情很有趣:安全专家被骗记
  10. 用lsof恢复已删除的文件