svm通俗讲解_通俗易懂--SVM算法讲解(算法+案例)
1.SVM讲解
SVM是一个很复杂的算法,不是一篇博文就能够讲完的,所以此篇的定位是初学者能够接受的程度,并且讲的都是SVM的一种思想,通过此篇能够使读着会使用SVM就行,具体SVM的推导过程有一篇博文是讲得非常细的,具体链接我放到最后面,供大家参考。
1.1支持向量机(SVM)的由来
首先我们先来看一个3维的平面方程:Ax+By+Cz+D=0
这就是我们中学所学的,从这个方程我们可以推导出二维空间的一条直线:Ax+By+D=0
那么,依次类推,更高维的空间叫做一个超平面:
x代表的是一个向量,接下来我们看下二维空间的几何表示:
SVM的目标是找到一个超平面,这个超平面能够很好的解决二分类问题,所以先找到各个分类的样本点离这个超平面最近的点,使得这个点到超平面的距离最大化,最近的点就是虚线所画的。由以上超平面公式计算得出大于1的就属于打叉分类,如果小于0的属于圆圈分类。
这些点能够很好地确定一个超平面,而且在几何空间中表示的也是一个向量,那么就把这些能够用来确定超平面的向量称为支持向量(直接支持超平面的生成),于是该算法就叫做支持向量机(SVM)了。
1.2如何找到超平面
函数间隔
在超平面wx+b=0确定的情况下,|wx+b|能够表示点x到距离超平面的远近,而通过观察wx+b的符号与类标记y的符号是否一致可判断分类是否正确,所以,可以用(y(w*x+b))的正负性来判定或表示分类的正确性。于此,我们便引出了函数间隔(functional margin)的概念。定义函数间隔(用
表示)为:
但是这个函数间隔有个问题,就是我成倍的增加w和b的值,则函数值也会跟着成倍增加,但这个超平面没有改变。所以有函数间隔还不够,需要一个几何间隔。
几何间隔
我们把w做一个约束条件,假定对于一个点 x ,令其垂直投影到超平面上的对应点为 x0 ,w 是垂直于超平面的一个向量,为样本x到超平面的距离,如下图所示:
根据平面几何知识,有
1.3最大间隔分类器
对一个数据点进行分类,当超平面离数据点的“间隔”越大,分类的确信度(confidence)也越大。所以,为了使得分类的确信度尽量高,需要让所选择的超平面能够最大化这个“间隔”值。这个间隔就是下图中的Gap的一半。
1.4后续问题
至此,SVM的第一层已经了解了,就是求最大的几何间隔,对于那些只关心怎么用SVM的朋友便已足够,不必再更进一层深究其更深的原理。
SVM要深入的话有很多内容需要讲到,比如:线性不可分问题、核函数、SMO算法等。
在此推荐一篇博文,这篇博文把深入的SVM内容也讲了,包括推导过程等。如果想进一步了解SVM,推荐看一下:
1.5新闻分类实例
.
.
.
.
欢迎添加微信交流!请备注“机器学习”。
svm通俗讲解_通俗易懂--SVM算法讲解(算法+案例)相关推荐
- python鸢尾花分类svm测试集_使用SVM对鸢尾花分类
使用SVM对鸢尾花分类 百度AI Studio中的一个入门项目,增加了自己在实践时的一些注释,对小白来说阅读更顺畅.源码和数据在github上. 任务描述: 构建一个模型,根据鸢尾花的花萼和花瓣大小将 ...
- 练习图200例图纸讲解_实物图+电气图纸讲解:教你学会看配电系统图,不收藏,可惜了...
每个专业的电气工程师都要学会看配电系统图,了解配电系统图中各种符号字母的含义.因为配电工程涉及的方面太多,所以看懂一张配电系统图也挺不容易,需要学习许多的配电知识及各种电气符号. 一.配电系统图的符号 ...
- 经典汽车电瓶充电电路图讲解_电工基础电路图讲解
电路图简介: 电路经过变压.桥式整流与调理后对电瓶进行充电,变压器能调节充电电流简单. 电路原理:电路经过变压.桥式整流与调理后对电瓶进行充电,变压器能调节充电电流简单,能给12v 100AH左右的电 ...
- svm通俗讲解_机器学习算法:SVM
关于支持向量机(SVM)的文章在互联网上当真不知凡几,各人理解不同所呈现的方式也各有不同,当然其中也不乏很多写的非常精彩的文章,如: 支持向量机通俗导论(理解SVM的三层境界)blog.csdn.n ...
- 用通俗易懂的方式讲解:主成分分析(PCA)算法及案例(Python 代码)
文章目录 知识汇总 加入方式 一.引入问题 二.数据降维 三.PCA基本数学原理 3.1 内积与投影 3.2 基 3.3 基变换的矩阵表示 3.4 协方差矩阵及优化目标 3.5 方差 3.6 协方差 ...
- 用通俗易懂的方式讲解:CatBoost 算法原理及案例
文章目录 知识汇总 解惑答疑 1.梯度提升概述 2.什么是 CatBoost 3.CatBoost 的主要特点 01 对称树 FloatFeature OneHotFeature OnlineCtr ...
- 用通俗易懂的方式讲解:TF-IDF算法介绍及实现
文章目录 1.TF-IDF算法介绍 (1)TF是词频(Term Frequency) (2) IDF是逆向文件频率(Inverse Document Frequency) (3)TF-IDF实际上是: ...
- 边界填充算法讲解_边界填充算法
边界填充算法讲解 Boundary fill is the algorithm used frequently in computer graphics to fill a desired color ...
- java五子棋的重要算法讲解_[Java五子棋小游戏-Ai算法精讲以及实现]-02--高级算法初步...
高级算法初步 走对自己利益最大的路 它有难了不要慌,抛弃它,以这盘棋局的胜利为他报仇 碰撞检测与跨步算法原理图 反向计算权重 每次计算完权重,都要进行一次反向权重计算 权重值 : 两侧的权重值相加 权 ...
最新文章
- FirstApp,iphone开发学习总结7,相机
- superset安装配置
- Python 面向监狱编程,就靠它了
- 九、oracle 事务
- Safari上使用WebRTC指南
- 开源贡献 计算_使用此网站为开源做贡献
- 炒房客共识:深圳楼市要撑不住了
- 【Java入门】泛型的学习与应用
- 【动态规划】【数位DP】[PA 2015]Rownanie
- mac10.11重装php,macosx-10.11-更新osx10.11后,删除自带php版本,重新编译php5.5.29,到make阶段提示错误。...
- 面试前,不要这么准备了,简直愚蠢到极点
- 电力电子仿真软件Plecs数据类型
- 如何在IDM官网安装IDM谷歌插件?
- Java - Eclipse: Error notifying a preference change listener
- 2017年中国软件业务收入报告新鲜出炉,华为以2178亿元连续16年蝉联榜首
- QT入门学习之软件程序开发初体验
- 统计一行字符串中单词的个数
- Python和PostgreSQL,PostGIS,空间数据管理
- 检查excel指定列中是否有错别字存在
- 亚太元宇宙新纪元峰会于1月12日在上海淳大万丽酒店盛大召开
热门文章
- 【python爬虫专项(9)】哪吒之魔童降世影片的海报爬取
- Flashy Graphs Sans Flash
- OpenGL--骨骼动画
- Ubuntu16.04安装opencv3
- JS中如何判断一个变量是否为数字
- 数据库查询语句SQL中like、%、-的区别
- 《狂飙》大结局高启强在逮捕前,打出了最后一通电话 说了最后一句话:“曾经有一份真挚的工作放我面前,但我没有珍惜如果上天可以再给我一次的话,我会说:入量化行业找slam
- 解决Flash “此Flash Player 与您的地区不相容,请重新安装Flash”的问题
- 扫雷游戏的实现步骤和代码
- 通过主动学习解决数据标注难题