特征筛选1——根据方差筛选(单变量筛选)
根据给定方差的阈值,删除掉值变化小的维度,以此降低数据规模。当把阈值设置为0的时候,就会删除没有变化的数据。
示例
import numpy as np
from sklearn.feature_selection import VarianceThresholddef drop_min_value(data):"""根据方差去除变化小的特征"""sel = VarianceThreshold(threshold=0) # 方差阈值,去掉方差为0的数据,也就是去除一个值的数据result = sel.fit_transform(data)return resultif __name__ == '__main__':X = np.array([[0, 0, 1],[0, 1, 0],[0, 0, 0],[0, 1, 1]])new_x = drop_min_value(X)print(new_x) # 把第1列删掉了
sklearn文档:https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.VarianceThreshold.html
特征筛选1——根据方差筛选(单变量筛选)相关推荐
- 特征筛选6——肯德尔相关系数筛选特征(单变量筛选)
肯德尔系数主要是用来判断两个有序序列的相关性 大致的计算流程: 对x与y先进行排序,得到不同的值对应的顺序 x与y配对计算,判断他们的顺序的一致对 (x的顺序与y的顺序相同) 和分歧对 (x的顺序与y ...
- 特征筛选5——距离相关系数筛选特征(单变量筛选)
距离相关系数用来判断两个变量是否独立,值域为[0,2] 值接近0,两个变量正相关 值接近1,两个变量无关 值接近2,两个变量负相关 距离相关系数可以参考:https://docs.scipy.org/ ...
- 特征筛选4——斯皮尔曼相关系数筛选特征(单变量筛选)
斯皮尔曼相关系数(斯皮尔曼等级相关系数),可以用来计算单调性,计算思路是: 首先将值做排序 判断排序的序号之间的相关系数 更多详情请参考:https://zh.wikipedia.org/wiki/% ...
- 特征筛选3——卡方检验筛选特征(单变量筛选)
sklearn文档:https://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.chi2.html 卡方检验 ...
- 特征筛选2——皮尔逊相关系数筛选(单变量筛选)
值域为正负1之间,用来筛查单变量与预测结果之间的相关关系,一般来讲: 绝对值在0-0.1之间:无关 绝对值在0.1-0.3之间:弱相关关系 绝对值在0.3-0.6之间:存在相关关系 绝对值在0.6-0 ...
- 高维数据中特征筛选方法的思考总结——单变量分析筛选法
基因组学.转录组学.蛋白组学及代谢组学等生信问题(高通量数据)中,面临的第一步往往就是降维(或者说筛选特征).降维方法分为两大类:单变量分析降维法.多变量分析降维法.单变量降维常常使用FC值或者P值, ...
- ML之FE:机器学习算法/数据挖掘中特征选取(变量筛选)的简介、常用方法(单变量分析并筛选—Filter/Wrapper/Embedded、多变量间相关性分析并筛选—PCC/MIC/IV)之详细攻略
ML之FE:机器学习算法/数据挖掘中特征选取(变量筛选)的简介.常用方法(单变量分析并筛选-Filter/Wrapper/Embedded.多变量间相关性分析并筛选-PCC/MIC/IV)之详细攻略 ...
- R语言回归模型构建、回归模型基本假设(正态性、线性、独立性、方差齐性)、回归模型诊断、car包诊断回归模型、特殊观察样本分析、数据变换、模型比较、特征筛选、交叉验证、预测变量相对重要度
R语言回归模型构建.回归模型基本假设(正态性.线性.独立性.方差齐性).回归模型诊断.car包诊断回归模型.特殊观察样本分析.数据变换.模型比较.特征筛选.交叉验证.预测变量相对重要度 目录
- 机器学习第18篇 - Boruta特征变量筛选(2)
前面(机器学习第17篇 - 特征变量筛选(1))评估显示Boruta在生物数据中具有较高的特征变量选择准确度,下面就具体看下如何应用Boruta进行特征变量选择. Boruta算法概述 Boruta得 ...
最新文章
- c语言五子棋评估函数,简易五子棋评估函数
- Hacktoberfest活动导致GitHub捐款近5万
- 【高并发】java中的CAS,你需要知道的东西
- 命令行编译执行java文件
- ACM-百度之星资格赛之Energy Conversion——hdu4823
- CISCO 路由器启动自动配置
- 6. Keras-RNN应用
- 线性时变系统状态方程的解
- Jmeter 中的BeanShell使用
- 使用Atmel Studio7和USBasp烧写器烧写AVR单片机
- cobar_note
- 得到APP之订阅专栏《硅谷来信》和《精英日课》目录
- VB 提示框MsgBox用法
- 给小朋友讲故事——第一次世界大战(音频)
- 怎么样可以把pdf合并在一起呢
- [日语]学习“五十音”(读音篇)
- 葵花宝典——放入word中
- HTTP3 (QUIC) 协议
- Hadoop学习——Hadoop概述
- UE4 C++ 类的4种引用类型,和异步加载资产