目录

一,核函数的引入

二,核函数的定义

三,核函数介绍:

四,核函数总结:


一,核函数的引入

世界上本来没有两个完全一样的物体,对于所有的两个物体,我们可以通过增加维度来让他们最终有所区别,比如说两本书,从(颜色,内容)两个维度来说,可能是一样的,我们可以加上作者这个维度,实在不行我们还可以加入页码,可以加入拥有者,可以加入购买地点,可以加入笔记内容等等。当维度增加到无限维的时候,一定可以让任意的两个物体可分了.

一般对于低维线性不可分的数据,在映射到高位以后,就变成了线性可分的,为此通过核函数将低维的数据映射到高维,再次利用SVM进行分类的思想。

回顾线性可分SVM的优化目标

低维特征仅仅以内积 xi∙xj 的形式出现,假如定义一个低维到高维特征空间的映射 ∅ ,将所有的特征映射到一个更高的维度,使数据线性可分,此时继续的使用线性可分的优化目标,求出分离超平面和分类决策函数。也就是说现在的SVM优化目标变为:

优化目标只是将内积 xi∙xi 换成 ∅(xi)∙∅(xj) 。

问题又出现了:

看起来似乎解决了问题,原始的空间为三维可以映射到20维,这也可以处理,但是我们低维的特征是100个维度,那需要更高的维度来映射,这时候映射成的高维度是爆炸性增长的,计算量太大,无法计算了。这时候就是核函数真正发挥威力的地方,先来就看下核函数的定义。

二,核函数的定义

假设 ∅ 是一个从低维的输入空间X(欧式空间的子集或是离散集合)到高维的希尔伯特空间H的映射,那么存在函数K(x,z)对任意x和z属于空间X,都有:

就称K(x,z) 为核函数。仔细观察上式可以发现,K(x,z)的计算是在低维特征空间来计算的,它避免了在刚才我们提到了在高维维度空间计算内积的恐怖计算量。也就是说,我们可以好好享受在高维特征空间线性可分的红利,却避免了高维特征空间恐怖的内积计算量。

三,核函数介绍:

核函数必须满足的条件,函数任何点的集合形成的Gram矩阵都是半正定的,即对于任意的 xi∈X,i=1,2,3…m.k(xi,xj) 对应的Gram矩阵 K=[k(xi,xj)] 是半正定矩阵,则K(x,z)是正定核函数。

常用的核函数有:

1,线性核函数(Linear Kernel):

也就是说,线性可分的SVM和线性不可分的SVM是一类的,仅仅在于核函数的不同。,

2,多项式核函数(Polynomial Kernel):

其中的参数都需要在实际的工程中进行调节。

3,高斯核函数(Gaussian kernel),也称之为径向基核函数,是非线性分类SVM的最主流函数:

其中, γ 大于0,需要调节的参数。

4,Sigmoid 核函数:

总结下SVM 核函数的求解过程

1)构造服从约束的目标函数

2)用SMO算法求出上式最小时对应的 α 向量的值 α∗ 向量

3)计算 w∗=∑i=1mαi∗yixi

4) 找出所有的S个支持向量,即满足 0≤αi≤C 对应的样本 ()(xs,ys) ,通过

计算出每个支持向量 ()(xs,ys) 对应的 bs∗=ys−∑i=1mαiyiK(xi,xj) ,所有的 bs∗ 对应的平均值即为最终的 b∗=1/s∑i=1sbs∗

这样最终的分类超平面和决策函数为:

四,核函数总结:

核函数的本质就是,将低维的样本特征映射到高维,使原本线性不可分的样本,线性可分可以继续的使用SVM模型。核函数的价值在于它虽然也是将特征进行从低维到高维的转换,但核函数好在它在低维上进行计算,而将实质上的分类效果(利用了内积)表现在了高维上,这样避免了直接在高维空间中的复杂计算,真正解决了SVM线性不可分的问题。

参考文献:

支持向量机SVM核函数研究 - 知乎

2-分类问题 SVM 核函数相关推荐

  1. matlab二分类svm高斯核 实例,16 SVM - 代码案例三 - 不同SVM核函数效果比较

    SVM的章节已经讲完,具体内容请参考:<01 SVM - 大纲> 常规操作: 1.头文件引入SVM相关的包 2.防止中文乱码 3.读取数据 4.数据分割训练集和测试集 6:4 import ...

  2. matlab svm核函数选择,SVM分类核函数及参数选择比较.pdf

    Compu~r Engineering口 4 胁日ff0 计算机工程与应用 SVM分类核函数及参数选择比较 奉国和 FENG Guohe 华南师范大学 经济管理学院 信息管理系,广州 5 10006 ...

  3. 机器学习面试——分类算法SVM

    1.什么是硬间隔和软间隔? 当训练数据线性可分时,通过硬间隔最大化,学习一个线性分类器,即线性可分支持向量机. 当训练数据近似线性可分时,引入松弛变量,通过软间隔最大化,学习一个线性分类器,即线性支持 ...

  4. MADlib——基于SQL的数据挖掘解决方案(23)——分类之SVM

    一.SVM简介 SVM法即支持向量机(Support Vector Machine,SVM)法,由Vapnik等人于1995年提出,具有相对优良的性能指标.该方法是建立在统计学理论基础上的机器学习方法 ...

  5. 【机器学习系列】之SVM核函数和SMO算法

    作者:張張張張 github地址:https://github.com/zhanghekai [转载请注明出处,谢谢!] [机器学习系列]之SVM硬间隔和软间隔 [机器学习系列]之SVM核函数和SMO ...

  6. 经典分类算法——SVM算法

    文章目录 经典分类算法--SVM算法 1 SVM算法:背景 2 SVM算法思想 3. Hard-SVM算法 4. Soft-Margin SVM算法 5. Kernel SVM算法 6. SVM小结 ...

  7. 机器学习算法之不同SVM核函数效果比较

    世界上有 10 种人: 一种知道二进制 一种不知道二进制 最后一种以为这是个二进制笑话 工程代码完整已上传:不同SVM核函数效果比较 如图所示的两类数据,分别分布为两个圆圈的形状,这样的数据本身就是线 ...

  8. 核函数及SVM核函数的选择

    核函数: 实际应用中,我们经常遇到数据线性不可分问题,可将数据从低维空间映射到高维空间,使数据在高维空间线性可分,之后在优化时需要计算内积,复杂度很高.这个时候就可以使用核函数,而核函数准确地说是一种 ...

  9. 机器学习:SVM多分类,SVM回归(SVR)

    文章目录 分类和回归的关系: 多分类问题处理的普适的方法: 一对多(One VS Rest): 一对一(One vs One): 有向无环图方法(Directed Acyclic Graph Meth ...

最新文章

  1. 分享下自己写的一个微信小程序请求远程数据加载到页面的代码
  2. 潭州课堂25班:Ph201805201 django 项目 第三十三课 后台文章标签查询提交到前台,删除功能实现(课堂笔记)...
  3. 2014年十大战略性技术趋势
  4. 剑桥大学eap入学测试准备!!!救命稻草
  5. matlab朴素贝叶斯工具箱,朴素贝叶斯分类matlab实现.doc
  6. android studio socket编程实例
  7. 信息学奥赛一本通 1119:矩阵交换行 | OpenJudge NOI 1.8 01 矩阵交换行
  8. centos后台登录ftp_安卓TikTok无限制版、手游扫码登录更新
  9. 通过宝塔webhook,实现git自动拉取服务器代码
  10. mysql安装包下载
  11. 域格4G模组开机网络注册流程
  12. 2022年的1024
  13. 市盈率、市净率、净资产收益率股息率介绍
  14. WPS如何并排放置两张图片_动图演示如何制作XRD叠图与PDF卡线图
  15. 深善扶贫:深圳弘法寺启动“春风谷雨”送温暖行动
  16. win7怎么桌面显示计算机图标不见了,win7显示桌面图标不见了如何恢复【图文】...
  17. sdlc 瀑布式 生命周期_管理信息系统中的系统开发生命周期(SDLC)
  18. 网信办督促平台整改算法歧视、大数据杀熟:必须保护用户合法权益
  19. TwinCAT3库文件制作
  20. 01day入学测试总结

热门文章

  1. ORA-08004: 序列 SEQ_XXX.NEXTVAL exceeds MAXVALUE 无法实例化
  2. 武侠世界(天龙八部)源码 vs2015编译 记录
  3. 主流的分布式文件系统
  4. 简易牛角插座直针/弯针间距 2.54mm DC2-10P/8/14/16/34/40/64P卡钩尺寸图
  5. 计算机二级office高级应用考纲,全国计算机等级考试二级MS Office高级应用考试大纲...
  6. 计算机硬件最小储存单位,构成储存器的最小单位是什么
  7. 笔记本蓝牙突然消失了
  8. 微软免费的刻录软件 cdburn,dvdburn
  9. LaTeX三线表格设置
  10. 多个containers 共用一个pvc_中山PVC活接球阀价格,化工管材厂家