首先要清楚:
1,线性可分,即能找到超平面,对于硬间隔支持向量机
2,部分点不可分,总体近似可分,近似线性可分,对应软间隔支持向量机
3,线性不可分,需要用到核函数

软间隔支持向量机要加个松弛变量ξ。
我们都知道,硬间隔满足,yi * ( wi * x + b )≥1,这是函数间隔,是几何间隔的||w|| 倍。
由于一些点出现在两条线的间隔内部,函数间隔的约束条件不满足,所以引入松弛变量ξ,使yi * ( wi * x + b ) + ξ ≥1,即:yi * ( wi * x + b ) ≥1 - ξ。对于这些离群点有对应的松弛变量,其他的点是没有松弛变量ξ的。

再来另外一个解释:

1,函数距离与几何距离

你需要明白两个概念,函数距离(函数间隔)和几何距离(几何间隔),先看个图:

平行直线1与2之间的垂直距离d,就是几何距离,也就是我们平常计算的两条平行直线之间的距离。函数间隔,就是图中的d帽(暂时这么称呼):

它是两条平行直线在某一条轴线(例如x轴)上的距离。在二维平面,它是竖着的,如图中的蓝色线标注,也可以是横着的,图中未画出。
函数距离和几何距离之间有关系,在本例中为:

||w||是矩阵w的模
在本例中,函数距离(d帽)就是直线1减去直线2的距离,是1。把这个数带入函数距离(d帽),然后乘以2,就得到两条虚线间的间隔

看到了吗?这就是当初我们要最大化的那个式子。
还记得那个限制条件吗?

不等式右边的1 ,就是函数距离(d帽)。
也就是硬间隔支持向量机,它的数学模型为:

2,松弛变量是函数间隔

上面的一种情况是,我们找了两条直线,最大化他们的距离。但有时我们找的直线,它们中间有一些散落的点,这些点不满足那个限制条件。如下图所示:

不满足的样本,如图红色标注的4个点。
也就是由于这些特殊的点,限制条件不满足。这真是一只老鼠坏一锅汤!
怎么办呢?就该我们的主角上场了,对,就是松弛变量ξ。
为了方便叙述与理解,我只拿其中的一个点分析,下图中的红色点。
看图:

蓝色的线的长度就是引入的松弛变量ξ(ξ≥0)
由于d帽=1,相应的绿色的线的长度就是1-ξ
此时,红色的点到橙色的线(我们要确定的最终分割线),之间的函数距离为:

对于所有的样本点,都满足:

这就是引入松弛变量后的限制条件。
这就是软间隔支持向量机,它的数学模型为:

其中m是样本个数
到此,你已经明白了松弛变量的含义。
路过的大佬,有的地方理解的不对,给点指导。
本文原创,转载请注明出处。
下面是附加的svm详细介绍,敲公式太繁琐,还没更新完,。。。

附加SVM详细介绍

1,建立svm数学模型

支持向量机(support vector machine,SVM)是一种二分类的线性分类器,它的思想是找到一条直线或超平面,使得样本分布在其两侧。
二分类的思路,简单说就是确定一条直线,也就是确定参数w和b:

参数w和b知道后,再给一个样本x,带入到上面的公式,如果y≥+1,就判断为正类(+1),如果y≤-1,就判断为负类(-1)。

这条直线或超平面怎么找呢?

如图所示,我们要分开这两个类别,假设标签为{+1,-1}。要想更好的分开这两类数据,在数据上划出两条线,使这两类数据之间的间隔最大,对应图中的虚线。在两条虚线的中间画一条直线,对应图中橙色的线,就是我们需要找的分割线。

最大化两条虚线之间的距离,这两条虚线的距离=d*2
两条直线之间的距离公式

所以,我们要最大化这个式子
也就等于最小化||W||,等价于最小化||W||^2,即:
最小化:
这里多个1/2,因为对w求偏导时,可以把2抵消掉。由最大化转为最小化,以及中间一些细节的处理,就是数学抽象建模的过程。

另一方面,

我们要最小化这个式子,这个式子的表达是有限制条件的:

这两个限制条件的意思是:当样本是是-1类时,样本要在虚线的下方;当样本是是+1类时,样本要在虚线的上方。为了表述方便,我们把这两个公式综合成一个式子,即:

最后,我们抽象出来的数学模型为:

下面的工作就是解这个式子,来确定w,b。

2、svm模型的求解

支持向量机松弛变量的理解相关推荐

  1. 【IM】关于支持向量机分类的理解

    支持向量机分类的理解核心就是核方法以及二次规划最优求解. SVM相关博文: https://blog.csdn.net/fjssharpsword/article/details/79965283 h ...

  2. SVM支持向量机【直观理解】

    转载文章:https://baijiahao.baidu.com/s?id=1607469282626953830&wfr=spider&for=pc 如果你曾经使用机器学习解决分类问 ...

  3. 支持向量机的近邻理解:图像二分类为例(2)

    前言: 假设空间 一个古老的哲学原理:世界并不是以小包的形式来到我们面前,除非遍历整个空间,任何训练得到的模型都是过拟合的.面对学习问题,首先面对这一个空间的认知问题,对空间结构的认识来自于接口,而全 ...

  4. 支持向量机的近邻理解:图像二分类为例(1)

    前言: 机器学习在是否保留原始样本的层面划分为两类:参数学习和非参数学习.参数学习使用相对固定框架,把样本分布通过训练的方式回归到一个使用参数描述的数学模型里面,最终使用的是归纳方法:非参数模型保留了 ...

  5. 支持向量机-松弛变量与惩罚因子

    1.松弛变量 现在我们已经把一个本来线性不可分的文本分类问题,通过映射到高维空间而变成了线性可分的.就像下图这样: 圆形和方形的点各有成千上万个(毕竟,这就是我们训练集中文档的数量嘛,当然很大了).现 ...

  6. 支持向量机之超平面理解

    支持向量机(SVM,也叫支持向量网络),是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法.是由Vapnik与同事(Boser等,1992:Guyon等,1993:Vapnik等,1997) ...

  7. 支持向量机的近邻理解:图像二分类为例(3)

    前言: 假设空间 在图像识别领域,灰度图像被称为传说中的2维张量,任意图像为由所有二类图像构成的这个二维张量空间内的一个点.由人类专家完成图像属性归纳,把二维张量空间图像的特征显式的归结为一维张量空间 ...

  8. 支持向量机smo matlab,理解支持向量机(三)SMO算法

    在支持向量机模型的求解中,我们用到了SMO算法来求解向量α. 那么什么是SMO算法?在讲SMO算法之前.我们须要先了解下面坐标上升法. 1.坐标上升法 如果有优化问题: W是α向量的函数.利用坐标上升 ...

  9. 《机器学习实战》:通俗理解支持向量机

    代码.数据集.文章我都是放到了https://github.com/AAAZC/SVM_blog 上面了,文章在issues里面,建议上这个网站看 <机器学习实战>:通俗理解支持向量机 关 ...

最新文章

  1. How to create a site with AJAX enabled in MVC framework.
  2. python中的for else
  3. 用于 Outlook 2003 的删除重复邮件的插件(加载项)
  4. Mac版Endnote X9在word中无法插入文献怎么办?
  5. 孩子数学成绩不好怎么办_孩子数学成绩不好怎么办
  6. Java 8 Stream示例
  7. VB得到指定文件夹下的文件列表
  8. Skyline软件二次开发初级——11如何在WEB页面中的三维地图上加载和保存工程文件...
  9. GPU Pro 7——实时体积云(翻译,附Unity工程)
  10. 【位操作笔记】计算以2为底整数N的对数 查表法
  11. 第一章 时空、运动
  12. mysql的strict_linux关闭mysql strict mode的方法介绍
  13. 重庆大学计算机学院郭松涛,C.-C.Jay Kuo教授访问重大计算机学院
  14. bilibili 实时平台的架构与实践
  15. linux查看exif软件,EXIF信息查看器使用教程及功能解析
  16. Java面试题自我总结
  17. java 分割字符串(多种方法)
  18. Linux安装与卸载Nginx
  19. python股票相关性分析_python处理时间序列数据股票数据,并进行相关性分析
  20. 大数据知识点总结笔记

热门文章

  1. 用牛刀杀鸡——幂级数解数列
  2. 电子邮件管理系统 android,IM800电子邮件管理系统
  3. 小程序在线支付教程一
  4. 解决bugfree不能发邮件的问题!!
  5. Kotlin | 一份10万字的随查笔记,妈妈再也不担心我不会Ctrl+F了
  6. LumiLIFE智能机器鱼强势来袭,仅凭外表就萌众人一脸血
  7. 【码蹄集】四柱河内塔
  8. 曙光服务器bios开启虚拟化支持,中科曙光虚拟化培训教程汇总:3.1 使用针对ESXi的常见LSI 命令行管理工具 v1.0.pdf...
  9. oracle增删改查操作
  10. 广东省深湛高铁线路vue(echarts)实现