SVM与feature
从SVM核函数特点看特征选择:SVM的核函数本质上是通过拆解当前特征(变成更多的特征),使一个非线性的问题转换为线性问题(SVM本身只能解决线性问题,现在有了核函数它就能够解决非线性问题了)。
所以,无论是不是线性函数,SVM都没有对不同的feature进行交叉计算:
比如一个vector (a, b, c), SVM只会扩展出 (a1, a2, a3, b1, b2, c1, c2),但绝不会扩展出类似( a/b, b/c, logb(a^2) )。
所以在进行SVM特征选择时,必须给出理性的,直觉上有贡献的feature,而不是把所有原始信息丢给SVM,寄希望于其后期的核函数能搞定这一点。换句话说,经过计算的derived feature 包含信息可能不比原始feature更多,但如果是有效的derive feature会大大提高SVM的分类效果。
感觉对于事先提取有用的特征是很必要,对于图像区域信息提取,尽管可以有颜色、形状、纹理等信息,但区域之间的关系虽然也可以得到,但具体在SVM里如何得到体现我还真不知道,这个就是label之间的权值?
如果提取的特征相关性太大,那么做PCA还是很有必要的。这样就避免了冗余特征的存在,比较SVM不是万能公式,虽然它号称现今powerest的分类器。
SVM与feature相关推荐
- svm学习之线性部分总结
svm是非常适合小数据集或中等规模的数据集的一个分类器: svm对feature scales是非常敏感的:如图所示: 如果训练数据不进行缩放,支持向量机就会倾向于忽略值较小的特征 对于线性分类器,有 ...
- 机器学习-LR推导及与SVM的区别
之前整理过一篇关于逻辑回归的帖子,但是只是简单介绍了一下了LR的基本思想,面试的时候基本用不上,那么这篇帖子就深入理解一下LR的一些知识,希望能够对面试有一定的帮助. 1.逻辑斯谛分布 介绍逻辑斯谛回 ...
- 机器学习算法总结--SVM
简介 SVM是一种二类分类模型,其基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解.或者简单的可以理解为就是在高维空间中寻找一 ...
- 机器学习之支持向量机(SVM)小结
1. 分类 支持向量机包含三种: 线性可分支持向量机:当训练数据线性可分时,可通过硬间隔最大化,学习一个线性的分类器,叫线性可分支持向量机,也称硬间隔支持向量机 线性支持向量机:当训练数据近似线性可分 ...
- LR推导及其与SVM的区别
之前整理过一篇关于逻辑回归的帖子,但是只是简单介绍了一下了LR的基本思想,面试的时候基本用不上,那么这篇帖子就深入理解一下LR的一些知识,希望能够对面试有一定的帮助. 1.逻辑斯谛分布 介绍逻辑斯谛回 ...
- What are Kernels in Machine Learning and SVM?
一个关于kernel的很好的解析: https://www.quora.com/What-are-Kernels-in-Machine-Learning-and-SVM 将它摘录过来了. What a ...
- 机器学习之支持向量机(SVM)学习笔记-Datawhale Task05
Author Bryce230 e-mail 2540892461@qq.com Software win10,Pycharm2019.3.3,Python3.7.7 SVM笔记-Datawhale ...
- 机器学习| 面试题:01、机器学习中LR(Logistic Regression)和SVM(Support Vector Machine)有什么区别与联系?
问题 机器学习中LR(Logistic Regression)和SVM(Support Vector Machine)有什么区别与联系? 背景 LR和SVM的概念大家都有了解甚至很熟悉了,不过在面试中 ...
- 特征选择综述阅读:A survey on feature selection methods
目录 1.介绍 2.过滤方法(Filter methods) 2.1相关性标准 2.2 互信息 2.2.1 基于条件互信息的二值数据特性排名标准 2.3 小结 3.包裹式方法(Wrapper meth ...
最新文章
- gitignore 文件生效办法
- 分布式缓存之Memcache
- python安装mysqlclient模块报fatal error: Python.h:解决方法
- 【Python 标准库学习】时间相关的函数库 — time
- 【Python】Python中常用的字符串处理函数
- C语言之do_while输出菱形
- kafka源码1-生产者
- 客户端可以连接 .Net程序不能连接SQL Server 2000
- adc0808的c语言编程51,51单片机驱动ADC0808电路图C51及汇编程序
- 从零开始写触摸屏驱动(Linux4.3.2 JZ2440V3 480*272)
- 《有限单元法》--王勖成,习题2.12 MATLAB 程序
- 服务器lsass占用内存_windows 2008R2服务器的lsass.exe进程占用大量内存
- 机器视觉培训教程-相机的基本知识
- 怎么把台式电脑的大量数据快速迁移到笔记本
- C 语言面试题大汇总
- 图像分割—基于区域的图像分割
- java 绑定mac地址_如何JAVA实现使用TrueLicense在证书中绑定PC的MAC地址,以防止拷贝应用...
- 人气爆棚!让我瞧瞧谁家展位这么6?
- (币圈资讯)如何选择一个优质有潜力的项目?小白必读干货
- [网盘工具/百度网盘]秒传链接的使用 -2022版油猴网页脚本
热门文章
- cocos2dx在不同安卓机型下scrollview裁剪失败
- AndroidStudio_Android中使用Handler实现非阻塞线程间通讯_跨线程更新UI_耗时处理完成后主动通知更新UI_在同一个activity用---Android原生开发工作笔记219
- 大数据之-Hadoop之HDFS的API操作_定位读取文件_只读取某个block的内容_案例---大数据之hadoop工作笔记0065
- 微服务架构工作笔记002---了解Isito新一代微服务架构-服务网格
- Linux学习笔记016---CentOS7虚拟机设置使用静态IP上网_配置集群的时候可以用
- android q桌面,Android Q带来全新桌面模式
- java版本不兼容_java 中jdk版本不兼容的问题小记
- 如何获得CSDN深色模式(基于Edge的强制深色获取)
- oracle时分秒修改值_Oracle SQL Developer显示的时间包含时分秒的设置方法
- MySQL客户端连接被频繁杀掉,企业案例(一):由于mysql sleep线程过多小故障