1.SVM讲解

SVM是一个很复杂的算法,不是一篇博文就能够讲完的,所以此篇的定位是初学者能够接受的程度,并且讲的都是SVM的一种思想,通过此篇能够使读着会使用SVM就行,具体SVM的推导过程有一篇博文是讲得非常细的,具体链接我放到最后面,供大家参考。

1.1支持向量机(SVM)的由来

首先我们先来看一个3维的平面方程:Ax+By+Cz+D=0

这就是我们中学所学的,从这个方程我们可以推导出二维空间的一条直线:Ax+By+D=0

那么,依次类推,更高维的空间叫做一个超平面:

x代表的是一个向量,接下来我们看下二维空间的几何表示:

SVM的目标是找到一个超平面,这个超平面能够很好的解决二分类问题,所以先找到各个分类的样本点离这个超平面最近的点,使得这个点到超平面的距离最大化,最近的点就是虚线所画的。由以上超平面公式计算得出大于1的就属于打叉分类,如果小于0的属于圆圈分类。

这些点能够很好地确定一个超平面,而且在几何空间中表示的也是一个向量,那么就把这些能够用来确定超平面的向量称为支持向量(直接支持超平面的生成),于是该算法就叫做支持向量机(SVM)了。

1.2如何找到超平面

函数间隔

在超平面wx+b=0确定的情况下,|wx+b|能够表示点x到距离超平面的远近,而通过观察wx+b的符号与类标记y的符号是否一致可判断分类是否正确,所以,可以用(y(w*x+b))的正负性来判定或表示分类的正确性。于此,我们便引出了函数间隔(functional margin)的概念。定义函数间隔(用

表示)为:

但是这个函数间隔有个问题,就是我成倍的增加w和b的值,则函数值也会跟着成倍增加,但这个超平面没有改变。所以有函数间隔还不够,需要一个几何间隔。

几何间隔

我们把w做一个约束条件,假定对于一个点 x ,令其垂直投影到超平面上的对应点为 x0 ,w 是垂直于超平面的一个向量,为样本x到超平面的距离,如下图所示:

根据平面几何知识,有

1.3最大间隔分类器

对一个数据点进行分类,当超平面离数据点的“间隔”越大,分类的确信度(confidence)也越大。所以,为了使得分类的确信度尽量高,需要让所选择的超平面能够最大化这个“间隔”值。这个间隔就是下图中的Gap的一半。

1.4后续问题

至此,SVM的第一层已经了解了,就是求最大的几何间隔,对于那些只关心怎么用SVM的朋友便已足够,不必再更进一层深究其更深的原理。

SVM要深入的话有很多内容需要讲到,比如:线性不可分问题、核函数、SMO算法等。

在此推荐一篇博文,这篇博文把深入的SVM内容也讲了,包括推导过程等。如果想进一步了解SVM,推荐看一下:

1.5新闻分类实例

.

.

.

.

欢迎添加微信交流!请备注“机器学习”。

svm通俗讲解_通俗易懂--SVM算法讲解(算法+案例)相关推荐

  1. python鸢尾花分类svm测试集_使用SVM对鸢尾花分类

    使用SVM对鸢尾花分类 百度AI Studio中的一个入门项目,增加了自己在实践时的一些注释,对小白来说阅读更顺畅.源码和数据在github上. 任务描述: 构建一个模型,根据鸢尾花的花萼和花瓣大小将 ...

  2. 练习图200例图纸讲解_实物图+电气图纸讲解:教你学会看配电系统图,不收藏,可惜了...

    每个专业的电气工程师都要学会看配电系统图,了解配电系统图中各种符号字母的含义.因为配电工程涉及的方面太多,所以看懂一张配电系统图也挺不容易,需要学习许多的配电知识及各种电气符号. 一.配电系统图的符号 ...

  3. 经典汽车电瓶充电电路图讲解_电工基础电路图讲解

    电路图简介: 电路经过变压.桥式整流与调理后对电瓶进行充电,变压器能调节充电电流简单. 电路原理:电路经过变压.桥式整流与调理后对电瓶进行充电,变压器能调节充电电流简单,能给12v 100AH左右的电 ...

  4. svm通俗讲解_机器学习算法:SVM

    关于支持向量机(SVM)的文章在互联网上当真不知凡几,各人理解不同所呈现的方式也各有不同,当然其中也不乏很多写的非常精彩的文章,如: 支持向量机通俗导论(理解SVM的三层境界)​blog.csdn.n ...

  5. 用通俗易懂的方式讲解:主成分分析(PCA)算法及案例(Python 代码)

    文章目录 知识汇总 加入方式 一.引入问题 二.数据降维 三.PCA基本数学原理 3.1 内积与投影 3.2 基 3.3 基变换的矩阵表示 3.4 协方差矩阵及优化目标 3.5 方差 3.6 协方差 ...

  6. 用通俗易懂的方式讲解:CatBoost 算法原理及案例

    文章目录 知识汇总 解惑答疑 1.梯度提升概述 2.什么是 CatBoost 3.CatBoost 的主要特点 01 对称树 FloatFeature OneHotFeature OnlineCtr ...

  7. 用通俗易懂的方式讲解:TF-IDF算法介绍及实现

    文章目录 1.TF-IDF算法介绍 (1)TF是词频(Term Frequency) (2) IDF是逆向文件频率(Inverse Document Frequency) (3)TF-IDF实际上是: ...

  8. 边界填充算法讲解_边界填充算法

    边界填充算法讲解 Boundary fill is the algorithm used frequently in computer graphics to fill a desired color ...

  9. java五子棋的重要算法讲解_[Java五子棋小游戏-Ai算法精讲以及实现]-02--高级算法初步...

    高级算法初步 走对自己利益最大的路 它有难了不要慌,抛弃它,以这盘棋局的胜利为他报仇 碰撞检测与跨步算法原理图 反向计算权重 每次计算完权重,都要进行一次反向权重计算 权重值 : 两侧的权重值相加 权 ...

最新文章

  1. FirstApp,iphone开发学习总结7,相机
  2. superset安装配置
  3. Python 面向监狱编程,就靠它了
  4. 九、oracle 事务
  5. Safari上使用WebRTC指南
  6. 开源贡献 计算_使用此网站为开源做贡献
  7. 炒房客共识:深圳楼市要撑不住了
  8. 【Java入门】泛型的学习与应用
  9. 【动态规划】【数位DP】[PA 2015]Rownanie
  10. mac10.11重装php,macosx-10.11-更新osx10.11后,删除自带php版本,重新编译php5.5.29,到make阶段提示错误。...
  11. 面试前,不要这么准备了,简直愚蠢到极点
  12. 电力电子仿真软件Plecs数据类型
  13. 如何在IDM官网安装IDM谷歌插件?
  14. Java - Eclipse: Error notifying a preference change listener
  15. 2017年中国软件业务收入报告新鲜出炉,华为以2178亿元连续16年蝉联榜首
  16. QT入门学习之软件程序开发初体验
  17. 统计一行字符串中单词的个数
  18. Python和PostgreSQL,PostGIS,空间数据管理
  19. 检查excel指定列中是否有错别字存在
  20. 亚太元宇宙新纪元峰会于1月12日在上海淳大万丽酒店盛大召开

热门文章

  1. 【python爬虫专项(9)】哪吒之魔童降世影片的海报爬取
  2. Flashy Graphs Sans Flash
  3. OpenGL--骨骼动画
  4. Ubuntu16.04安装opencv3
  5. JS中如何判断一个变量是否为数字
  6. 数据库查询语句SQL中like、%、-的区别
  7. 《狂飙》大结局高启强在逮捕前,打出了最后一通电话 说了最后一句话:“曾经有一份真挚的工作放我面前,但我没有珍惜如果上天可以再给我一次的话,我会说:入量化行业找slam
  8. 解决Flash “此Flash Player 与您的地区不相容,请重新安装Flash”的问题
  9. 扫雷游戏的实现步骤和代码
  10. 通过主动学习解决数据标注难题