从SVM核函数特点看特征选择:SVM的核函数本质上是通过拆解当前特征(变成更多的特征),使一个非线性的问题转换为线性问题(SVM本身只能解决线性问题,现在有了核函数它就能够解决非线性问题了)。

所以,无论是不是线性函数,SVM都没有对不同的feature进行交叉计算:

比如一个vector (a, b, c), SVM只会扩展出 (a1, a2, a3, b1, b2, c1, c2),但绝不会扩展出类似( a/b, b/c, logb(a^2) )。

所以在进行SVM特征选择时,必须给出理性的,直觉上有贡献的feature,而不是把所有原始信息丢给SVM,寄希望于其后期的核函数能搞定这一点。换句话说,经过计算的derived feature 包含信息可能不比原始feature更多,但如果是有效的derive feature会大大提高SVM的分类效果。

感觉对于事先提取有用的特征是很必要,对于图像区域信息提取,尽管可以有颜色、形状、纹理等信息,但区域之间的关系虽然也可以得到,但具体在SVM里如何得到体现我还真不知道,这个就是label之间的权值?

如果提取的特征相关性太大,那么做PCA还是很有必要的。这样就避免了冗余特征的存在,比较SVM不是万能公式,虽然它号称现今powerest的分类器。

SVM与feature相关推荐

  1. svm学习之线性部分总结

    svm是非常适合小数据集或中等规模的数据集的一个分类器: svm对feature scales是非常敏感的:如图所示: 如果训练数据不进行缩放,支持向量机就会倾向于忽略值较小的特征 对于线性分类器,有 ...

  2. 机器学习-LR推导及与SVM的区别

    之前整理过一篇关于逻辑回归的帖子,但是只是简单介绍了一下了LR的基本思想,面试的时候基本用不上,那么这篇帖子就深入理解一下LR的一些知识,希望能够对面试有一定的帮助. 1.逻辑斯谛分布 介绍逻辑斯谛回 ...

  3. 机器学习算法总结--SVM

    简介 SVM是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解.或者简单的可以理解为就是在高维空间中寻找一 ...

  4. 机器学习之支持向量机(SVM)小结

    1. 分类 支持向量机包含三种: 线性可分支持向量机:当训练数据线性可分时,可通过硬间隔最大化,学习一个线性的分类器,叫线性可分支持向量机,也称硬间隔支持向量机 线性支持向量机:当训练数据近似线性可分 ...

  5. LR推导及其与SVM的区别

    之前整理过一篇关于逻辑回归的帖子,但是只是简单介绍了一下了LR的基本思想,面试的时候基本用不上,那么这篇帖子就深入理解一下LR的一些知识,希望能够对面试有一定的帮助. 1.逻辑斯谛分布 介绍逻辑斯谛回 ...

  6. What are Kernels in Machine Learning and SVM?

    一个关于kernel的很好的解析: https://www.quora.com/What-are-Kernels-in-Machine-Learning-and-SVM 将它摘录过来了. What a ...

  7. 机器学习之支持向量机(SVM)学习笔记-Datawhale Task05

    Author Bryce230 e-mail 2540892461@qq.com Software win10,Pycharm2019.3.3,Python3.7.7 SVM笔记-Datawhale ...

  8. 机器学习| 面试题:01、机器学习中LR(Logistic Regression)和SVM(Support Vector Machine)有什么区别与联系?

    问题 机器学习中LR(Logistic Regression)和SVM(Support Vector Machine)有什么区别与联系? 背景 LR和SVM的概念大家都有了解甚至很熟悉了,不过在面试中 ...

  9. 特征选择综述阅读:A survey on feature selection methods

    目录 1.介绍 2.过滤方法(Filter methods) 2.1相关性标准 2.2 互信息 2.2.1 基于条件互信息的二值数据特性排名标准 2.3 小结 3.包裹式方法(Wrapper meth ...

最新文章

  1. gitignore 文件生效办法
  2. 分布式缓存之Memcache
  3. python安装mysqlclient模块报fatal error: Python.h:解决方法
  4. 【Python 标准库学习】时间相关的函数库 — time
  5. 【Python】Python中常用的字符串处理函数
  6. C语言之do_while输出菱形
  7. kafka源码1-生产者
  8. 客户端可以连接 .Net程序不能连接SQL Server 2000
  9. adc0808的c语言编程51,51单片机驱动ADC0808电路图C51及汇编程序
  10. 从零开始写触摸屏驱动(Linux4.3.2 JZ2440V3 480*272)
  11. 《有限单元法》--王勖成,习题2.12 MATLAB 程序
  12. 服务器lsass占用内存_windows 2008R2服务器的lsass.exe进程占用大量内存
  13. 机器视觉培训教程-相机的基本知识
  14. 怎么把台式电脑的大量数据快速迁移到笔记本
  15. C 语言面试题大汇总
  16. 图像分割—基于区域的图像分割
  17. java 绑定mac地址_如何JAVA实现使用TrueLicense在证书中绑定PC的MAC地址,以防止拷贝应用...
  18. 人气爆棚!让我瞧瞧谁家展位这么6?
  19. (币圈资讯)如何选择一个优质有潜力的项目?小白必读干货
  20. [网盘工具/百度网盘]秒传链接的使用 -2022版油猴网页脚本

热门文章

  1. cocos2dx在不同安卓机型下scrollview裁剪失败
  2. AndroidStudio_Android中使用Handler实现非阻塞线程间通讯_跨线程更新UI_耗时处理完成后主动通知更新UI_在同一个activity用---Android原生开发工作笔记219
  3. 大数据之-Hadoop之HDFS的API操作_定位读取文件_只读取某个block的内容_案例---大数据之hadoop工作笔记0065
  4. 微服务架构工作笔记002---了解Isito新一代微服务架构-服务网格
  5. Linux学习笔记016---CentOS7虚拟机设置使用静态IP上网_配置集群的时候可以用
  6. android q桌面,Android Q带来全新桌面模式
  7. java版本不兼容_java 中jdk版本不兼容的问题小记
  8. 如何获得CSDN深色模式(基于Edge的强制深色获取)
  9. oracle时分秒修改值_Oracle SQL Developer显示的时间包含时分秒的设置方法
  10. MySQL客户端连接被频繁杀掉,企业案例(一):由于mysql sleep线程过多小故障