目录

1、SVM概念描述

2、SVM数学表达及相关计算

3、SVM优化问题定义

附:证明区

【证明1】

【计算1】


1、SVM概念描述

如图一所示,存在两个数据集,我们希望通过一个超平面将两个数据集分割开,并且我们希望这个超平面离两个数据集越远越好,某种意义上,这代表两个数据集分的更开。即图中的margin可以越大越好。

因为margin越大,对于新的数据点,错误分类的可能就越小。

如图二所示。可以看到,图中有两个可以选择的hyperplane,其中绿色的hyperplane的margin比较小,而黄色的比较大。对于一个新的点,图中用紫色圆形块标注,如果使用绿色的hyperplane将会把这个点归到第二个数据集中,而使用黄色的hyperplane则会归到第一个数据集,显然,如果去掉这两个hyperplane,单纯靠人为判断,我们也会将新的点归到第一个数据集,也就是说,此时margin比较小的绿色hyperplane对新的点的归类是错误的。这也就是我们说的,margin越大错误分类可能性越小。

2、SVM数学表达及相关计算

目标:找到一个超平面 来区分两个数据集,且超平面距离两个数据集的距离要最大。

其中yi是第i个点的标签,+1表示属于第一个数据集,-1表示属于第二个数据集。

这样对于新的点x,我们就可以通过的值判断x属于哪个数据集。

但是还需要注意到,中有两个未知变量,分别是,这两个未知量需要通过原先有的带标签数据集来决定。

为了严格起见以及方便运算(更好确定margin大小),我们做一点小小的调整。

通过选取新的,更新y的定义如下:

改变前后示意图如图三所示。

但要注意的是,这是等价的转换,因为图三左边的和右边的并不是一样的。相反这是通过更新,生成新的。也就是说,如果第一张图中没有一个点既不满足,也不满足的话(既不在黄色区域也不在蓝色区域),在第二张图中,也不会有点的在[-1,+1]区间(既不在黄色区域也不在蓝色区域)。

具体证明过程写在文末证明区【证明1】,自行食用~

通过改变定义,我们可以得到margin的距离,从图三的右图也可以发现,这个距离就是之间的距离。

这个距离通过计算可以知道是

计算过程同样写在文末证明区【计算1】,感兴趣的自行查看~

3、SVM优化问题定义

通过以上对目标的阐述以及相关计算,我们可以对SVM问题进行定义:

其中第一项中用来衡量距离大小,用来衡量错误分类情况,其中为预测的标签,是真实标签。

则是用来确定这两项的比重,越大,追求更大的margin就成了主要目标,否则,追求更小的错误分类成为主要目标。

然而这还是基础版本的SVM,因为这个函数第二项是不平滑项,而优化问题中不平滑项通常需要转换成平滑项,可以通过使用Huber函数将后一项平滑化。也有其他处理方式,这里不过多介绍。

附:证明区

【证明1】

【计算1】

通俗易懂SVM原理介绍,适合小白食用相关推荐

  1. Adaboost入门教程——最通俗易懂的原理介绍(图文实例)

    写在前面 说到Adaboost,公式与代码网上到处都有,<统计学习方法>里面有详细的公式原理,Github上面有很多实例,那么为什么还要写这篇文章呢?希望从一种更容易理解的角度,来为大家呈 ...

  2. Adaboost入门教程——最通俗易懂的原理介绍

    向AI转型的程序员都关注了这个号

  3. 切分数据集(train_test_split),思路分享及手打代码和介绍sklearn中train_test_split,适合小白入门

    本篇博客介绍train_test_split,步骤1-4是自己手打代码和思路分享,步骤5介绍如何使用sklearn中的train_test_split,步骤3有介绍随机种子哦,简单易懂,适合小白入门 ...

  4. 统计学习方法|支持向量机(SVM)原理剖析及实现

    欢迎直接到我的博客查看最近文章:www.pkudodo.com.更新会比较快,评论回复我也能比较快看见,排版也会更好一点. 原始blog链接: http://www.pkudodo.com/2018/ ...

  5. 深入浅出学大数据(五)Hadoop再探讨High Availability(HA)集群搭建及YARN原理介绍

      大家好,我是不温卜火,昵称来源于成语-不温不火,本意是希望自己性情温和.作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样 ...

  6. Vue实现音乐播放效果(适合小白学习)

    Vue实现音乐播放效果(适合小白学习) 播放器介绍 五个html主要标签 功能介绍 (1)搜索 (2)播放效果: 完整代码: 播放器介绍 总体的效果如图所示,没有加很多css特效,需要美化的小白,可以 ...

  7. 常见的推荐算法原理介绍

    常见的推荐算法原理介绍,随着互联网的发展短视频运营越来越精准化,我们身边常见的抖音.火山小视频等软件让你刷的停不下来,这些软件会根据你的浏览行为推荐你感兴趣的相关内容,这就用到了很多推荐算法在里面. ...

  8. Matlab 离散小波变换函数 dwt2() 原理介绍与实验

    文章目录 一.小波变换的原理 1.1 小波变换简介 1.2 CWT和DWT的原理 二.傅里叶变换与DWT的比较 三.Matlab实现图像的二维小波变换 3.1 dwt2()函数介绍 3.2 dwt2( ...

  9. 从小白到精通python要多久-超适合小白的python新手教程

    python介绍 这是我们专门为 小白 量身打造的Python新手教程,具有如下特点: 全视频,手把手,零起点,项目实例,基于船新的Python 版本. Python是一种计算机程序设计语言.你可能已 ...

最新文章

  1. 趋势线突破有效的标志
  2. MODIS(TerraAqua)陆地标准产品
  3. 全排列(含递归和非递归的解法)
  4. java中File类中list()和listFiles()方法区别
  5. SQL Server 自定义快捷键
  6. C#菜鸟正则表达式一
  7. Entity Framework入门教程:创建实体数据模型
  8. requirejs加载顺序_教你5分钟学会用requirejs(必看篇)
  9. 多语言 获取当前语言
  10. sqlserver随机取记录
  11. IOS解惑(1)之@property(nonatomic,getter=isOn) BOOL on;中的getter解惑
  12. CSS基础——CSS字体样式属性【学习笔记】
  13. 随机过程(基本概念、平稳随机过程)
  14. 计算机图形学(十二):真实感图形(光照模型、材质模型)
  15. __dirname与__filename
  16. 用python编程 商品打折怎么计算_(特价书)从问题到程序:用Python学编程和计算
  17. 使用pre-signed URLs通过浏览器上传 无中间件前端直传 minio
  18. 建网站应该选择自己建站还是在线建站?
  19. open falcon mysql_open-falcon中mysql数据库的备份或转移
  20. 会玩,使用 init 进程运行 Container

热门文章

  1. focus-within switch tab
  2. Oracle数据库入门 基础知识day04 火推阳光笔记
  3. 历经两个月的秋招,结束了,谈谈春秋招中一些重要的知识点吧(本科+后台+腾讯)
  4. VMWare虚拟机网络模式:Bridged、NAT、Host-Only
  5. 普罗米修斯 监控 postgresql
  6. 什么是SOCKET通信,看完马上明白
  7. Ubuntu下端口被占用问题
  8. 多项式mod的运算方法
  9. python docx设置标题中文字体rPr.rFonts.set(qn(‘w:eastAsia‘),u‘黑体‘),报错‘NoneType‘ object has no attribute ‘set‘
  10. 用令牌桶算法完成API接口限流