1 综述


(1) 什么是特征选择

特征选择 ( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ) ,或属性选择( Attribute Selection ) ,是指从全部特征中选取一个特征子集,使构造出来的模型更好。

(2) 为什么要做特征选择

在机器学习的实际应用中,特征数量往往较多,其中可能存在不相关的特征,特征之间也可能存在相互依赖,容易导致如下的后果:

Ø  特征个数越多,分析特征、训练模型所需的时间就越长。

Ø  特征个数越多,容易引起“维度灾难”,模型也会越复杂,其推广能力会下降。

特征选择能剔除不相关(irrelevant)或亢余(redundant )的特征,从而达到减少特征个数,提高模型精确度,减少运行时间的目的。另一方面,选取出真正相关的特征简化了模型,使研究人员易于理解数据产生的过程。

2 特征选择过程

特征选择常用算法综述相关推荐

  1. 文本聚类分析算法_常用的聚类分析算法综述

    聚类分析定义 所谓聚类就是按照事物的某些属性,把事物聚集成类,使类间的相似性尽可能小,类内相似性尽可能大.聚类是一个无监督的学习过程,它同分类的根本区别在于分类是需要事先知道所依据的数据特征,而聚类是 ...

  2. 数据分析与挖掘理论-常用算法对比(纯理论较枯燥)

    常见数据挖掘算法分析 概述 一般认为,数据挖掘领域所使用的方法均属于机器学习算法.深度学习算法和数据挖掘算法. 一般认为,数据挖掘领域的问题主要有分类.回归.聚类.推荐.图像识别.预测. 一般认为,数 ...

  3. 虚拟专题:联邦学习 | 联邦学习算法综述

    来源:大数据期刊 联邦学习算法综述 王健宗1 ,孔令炜1 ,黄章成1 ,陈霖捷1 ,刘懿1 ,何安珣1 ,肖京2 1. 平安科技(深圳)有限公司,广东 深圳 518063 2. 中国平安保险(集团)股 ...

  4. fastunfolding算法_社区发现算法综述—part1

    目前我能在arxiv上找到的最新的关于社区发现算法系列的综述文了. 正文从这里开始: 2.2 社区发现 现代网络在规模.多样性和复杂性上呈指数增长. 由于网络的变化,各种各样呈现出网络结构的不同类型的 ...

  5. etc的常见算法_几个常用算法的适应场景及其优缺点(非常好)

    本文主要回顾下几个常用算法的适应场景及其优缺点! 机器学习算法太多了,分类.回归.聚类.推荐.图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验. ...

  6. 人脸识别中的活体检测算法综述

    其它机器学习.深度学习算法的全面系统讲解可以阅读<机器学习-原理.算法与应用>,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造. 书的购买链接 书的勘误,优化,源代码资源 1. 什 ...

  7. 机器学习常用算法归详细纳整理

    作者:进击的西西弗斯 本文链接:https://blog.csdn.net/qq_42216093/article/details/116434557 版权声明:本文为作者原创文章,未经作者同意禁止转 ...

  8. 数学建模比赛题型划分、常用算法及其适用场景

    目录 题型划分.常用算法及其适用场景 常见赛题类型 算法体系分类 常用算法分类 数据预处理模型及应用场景 优化类模型及应用场景 优化类模型: 聚类模型及应用场景 评价模型及应用场景 预测类模型及应用场 ...

  9. 图像物体分类与检测算法综述

    图像物体分类与检测算法综述 转自<计算机学报> 目录 图像物体分类与检测算法综述 目录 图像物体分类与检测概述 物体分类与检测的难点与挑战 物体分类与检测数据库 物体分类与检测发展历程 图 ...

最新文章

  1. c语言选择题写小写字母表,C语言选择题(最全版).doc
  2. SSM整合Shiro进行登陆认证和授权详细配置
  3. OpenCV色彩校正模型MCC
  4. Python GUI编程(Tkinter)
  5. go语言变量声明、匿名变量
  6. Vue.js响应式原理
  7. Sublime删除所有包含特定值的行
  8. oracle监听管理工具,oracle监听器管理
  9. excel显著性检验_数据分析系列 10/32 | Excel方差分析之单因素方差分析
  10. kali linux 桌面消失_Kali安装好后,需要修改的一些常用配置
  11. vb.net 画多个矩形_电气原理图和接线图识图方法,电气接线图怎么画?你会画吗?...
  12. MATLAB电机仿真精华50例
  13. 固态硬盘迁移及0xc00000e错误码解决方案
  14. H5+App后台持续定位功能实现
  15. 2022-2028全球ERV空气交换器行业调研及趋势分析报告
  16. [AV1] AV1 Reference Software
  17. ai新视觉:一键解决模糊图片高清精准修复
  18. 部编版三下《燕子》教学反思
  19. 求解圆圈中最后剩下的数字
  20. 使用python进行分布分析(算数平均、几何平均、偏度、峰度,绘制直方图),以2022年上半年沪深300指数为例

热门文章

  1. 非法ip通过ssh成功登录,自动结束会话
  2. Know more about AWR Parse Statistics
  3. python绘图subplots函数使用模板
  4. CodeForces-1294B排序+pair使用
  5. python中keyboardinterrupt_如何防止代码块在Python中被KeyboardInterrupt中断?
  6. leetcode 151. 翻转字符串里的单词 c代码 三种方案
  7. 高校c语言程序设计比赛,分秒必争,力争上游,计算机学院举办第八届C语言程序设计挑战杯...
  8. php worker类,Workerman进阶之Worker类-id属性研究
  9. javawhile语句的用法例子_Python语句之循环
  10. tensorflow和python不兼容_tensorflow与numpy的版本兼容性问题的解决