手撕SVM公式——硬间隔、软间隔、核技巧
1.SVM作用
对于给定的训练样本集D={(x1,y1), (x2,y2),… (xn,yn)},yi属于{-1,+1},希望能找出一个超平面,把不同类别的数据集分开,对于线性可分的数据集来说,这样的超平面有无穷多个,而最优的超平面即是分隔间距最大的中间那个超平面
2.硬间隔最大化
对于以上的KKT条件可以看出,对于任意的训练样本总有ai=0或者yif(xi) - 1=0即yif(xi) = 1
1)当ai=0时,代入最终的模型可得:f(x)=b,即所有的样本对模型没有贡献
2)当ai>=0,则必有yif(xi) = 1,注意这个表达式,代表的是所对应的样本刚好位于最大间隔边界上,是一个支持向量,这就引出一个SVM的重要性质:训练完成后,大部分的训练样本都不需要保留,最终的模型仅与支持向量有关。
关于对偶问题
- 转化为对偶问题,具体就是把所有的约束条件,分别乘上拉格朗日乘子ai>=0,添加到需要优化的目标函数里,形成一个待优化的表达式
- 为什么原问题能求解,却要转化为对偶问题?
1)带约束的原问题求解比较困难,变成对偶问题可以把约束条件和待优化的目标融合在一个表达式里面
2)拉格朗日对偶问题一般是凹函数(求最大值),即使原问题是非凸的,变成对偶问题更容易优化求解
3)对偶问题能自然的引入核技巧,方便后续用来解决低维线性不可分的问题
3.软间隔最大化
前面我们是假定所有的训练样本在样本空间或特征空间中是严格线性可分的,即存在一个超平面能把不同类的样本完全分开,然鹅现实任务中很难确定这样的超平面(不管是线性超平面还是经过核变换到高维空间的超平面),所以引入松弛变量,允许一些样本出错,但我们希望出错的样本越少越好,所以松弛变量也有限制(注:公式中的松弛变量不是单单一个数,每个样本都有对应的松弛变量)。引入松弛变量的间隔问题成为软间隔
4.核函数
前面我们都是假设样本是线性可分的,虽然软间隔不完全可分,但大部分还是可分的。而现实任务中很可能遇到这样的情况,即不存在一个能够正确划分两个类别样本的超平面,对这样的问题,可以将样本从原始空间映射到一个更高维的特征空间中,使得样本在这个特征空间中线性可分。数学上可以证明,如果原始空间是有限维,即属性数有限,则一定存在一个高维特征空间使样本可分。
参考文章:《机器学习》——周志华
手撕SVM公式——硬间隔、软间隔、核技巧相关推荐
- 机器学习入门学习笔记:(4.2)SVM的核函数和软间隔
前言 之前讲了有关基本的SVM的数学模型(机器学习入门学习笔记:(4.1)SVM算法).这次主要介绍介绍svm的核函数.软间隔等概念,并进行详细的数学推导.这里仅将自己的笔记记录下来,以便以后复习查看 ...
- 支持向量机SVM(三)软间隔与松弛变量的替代损失函数
前两篇关于SVM的讨论中,我们只讨论了样本在原始空间和特征空间中线性可分的情况,但是,现实不可能这么完美,就算真的被找到了,但是世上没有免费的午餐,最后的结果很可能过拟合了. 所以要来讨论一下,怎么付 ...
- SVM支持向量机——核函数、软间隔
支持向量机的目的是寻找一个能讲两类样本正确分类的超平面,很多时候这些样本并不是线性分布的. 由此,可以将原始特征空间映射到更高维的特征空间,使其线性可分.而且,如果原始空间是有限维,即属性数量有限, ...
- SVM原理篇之手撕SVM
转载自:https://blog.csdn.net/c406495762/article/details/78072313 转载请注明作者和出处: https://zhuanlan.zhihu.com ...
- SVM之线性不可分与核技巧
跟我一起机器学习系列文章将首发于公众号:月来客栈,欢迎文末扫码关注! 在前面两篇文章中,笔者通过两个角度来介绍了什么是支持向量机.不过说一千道一万,还是不如动手来做做.在本篇文章中,笔者将首先介绍如何 ...
- SVM详解(三)支持向量机使用核技巧
文章目录 1. 数据升维处理非线性可分问题 2. CoverCoverCover 定理 3. 核函数 4. 常用核函数 5. 非线性支持向量机学习算法 1. 数据升维处理非线性可分问题 通过前面的学习 ...
- 【机器学习系列】之SVM硬间隔和软间隔
作者:張張張張 github地址:https://github.com/zhanghekai [转载请注明出处,谢谢!] [机器学习系列]之SVM硬间隔和软间隔 [机器学习系列]之SVM核函数和SMO ...
- 机器学习-SVM硬间隔与软间隔:重要参数C
SVM在软间隔数据上的推广 到这里,我们已经了解了线性SVC的基本原理,以及SVM如何被推广到非线性情况下,还了解了核函数的选择和应用.但实际上,我们依然没有完全了解SVM用于二分类的全貌.我们之前在 ...
- 支持向量机(SVM):超平面及最大间隔化、支持向量机的数学模型、软间隔与硬间隔、线性可分支持向量机、线性支持向量机、非线性支持向量机、核函数、核函数选择、SMO算法、SVM vs LR、优缺点
支持向量机(SVM):超平面及最大间隔化.支持向量机的数学模型.软间隔与硬间隔.线性可分支持向量机.线性支持向量机.非线性支持向量机.核函数.核函数选择.SMO算法.SVM vs LR.优缺点 目录
最新文章
- 什么时候用redis_C++传参什么时候用引用, 什么时候用指针?
- 牛顿求平方根法(输入是double,输出也是double)
- 在Android中使用Protocol Buffers
- MySQL 中存储时间的最佳实践
- python执行js文件
- UI学习笔记---第十四天数据持久化
- 基于Python语言使用RabbitMQ消息队列(一)
- 拷贝构造函数什么时候调用?
- c语言的数据类型说明保留字,第三章 数据类型、运算符与表达式
- GPS 经纬度转换 百度、高德经纬度
- JavaCV 制作字符画
- 心理很难受,无法平静!
- 基于Java毕业设计房屋租赁系统源码+系统+mysql+lw文档+部署软件
- 微信学习:我的学习测试环境(刚看我的DZd动力空间后台,发现推荐后双方有30软妹币福利,双赢哦)
- 2013年全球重要黑客大会一览
- 用HTML+CSS简单仿制了一个bilibili电脑界面⚆_⚆(做着玩的)
- 计算时针与分针之间的夹角
- 本地html页面录音,JavaScript实现页面中录音功能的方法
- php视频播放链提取,从PHP获取Vimeo的直接链接视频
- opencascade获取面的法向
热门文章
- 5G小基站国产化超五成,美国芯片仅占1%,难怪美国芯片难卖了
- VPS8504C 微功率隔离电源隔离芯片 VPSC源特科技
- 运维之道 | Kickstart+DHCP+FTP+TFTP+PXE 无人值守批量 Linux(Centos7)服务器安装
- Aerospike之路
- java applet找不到类_java – Applet类加载器在applet的jar中找不到类
- HAProxy页面参数解释
- 搜索引擎使用方法与技巧
- JMeter(十四):计数器的使用
- 7月第4周国内社区类网站/频道排行:猫扑重夺榜眼
- paypal订单捕获java,paypal获取交易订单信息api(python实现)