机器学习系列(1)SVM的公式推导
机器学习与深度学习
在深度学习“家喻户晓”之前,这种技术一直以“神经网络”的名义活跃于学者们的研究和工作者们的项目中。深度学习或者神经网络都属于机器学习的一个子类,理所当然地深度学习会具备机器学习中的一些共有特性,尽管近几年深度学习发展出了很多“专属”问题。近期更新的这个系列我们会以机器学习中常见算法的一些特殊性出发,探究一下它们会对我们的日后深度学习的学习带来哪些启发。
一 SVM的推导过程与其本身同样重要
支持向量机(SVM)是一类监督学习式的机器学习算法,其决策边界是对学习样本求解的最大边距超平面。SVM算法在中小规模的数据集中的表现非常令人满意,对我们的深度学习来说更有意义的部分是它的推导过程,深度学习的优势在于对原始特征的重构,而SVM在已经有一些很好的表示特征情况下,它的性能同时可以得到很好的理论保证,而在一些场景中模型能否得到有效的理论保证是决策者判断是否选用该模型的关键,如辅助医疗、自动驾驶领域等。通过SVM的推导我们来了解这种机器学习算法,并将其与之后的深度学习进行对比,也许会给你带来一些启发。
考虑这样一个问题,一个决策边界将样本划分为正样本(○)和负样本(△),而此决策边界可以有很多种表达方式,如图1.1中三种决策边界都可以实现我们想要的效果。那么,我们依据什么来判断哪种决策边界是最好的?
左图为1.1 几种边界示意图 右图为1.2 SVM假设示意图
在此我们做出一个假设如图1.2所示:定义与决策边界(粗)相互平行、距离相等的两条直线边界(细),该直线边界经过距离决策边界最近:两个样本,那么令两条直线边界间隔最大的决策边界的位置即是我们所求。接下来我们使用数学语言描述。
存在垂直于决策边界的向量w和向量为u的任意一个待检测样本(xi,yi),则决策过程可以描述为:u在w方向的投影大于某个值b即判定为此样本为正样本,相反地如果小于值b则判定为负样本。(向量投影也就是距离在求解时集的还要除以一个被投影向量的模,这里是经过b调节使得形式更加简单些)
这里可能需要解释一下:这里是个分类讨论,x为正样本y是+1,x是负样本y是-1,负的x的负样本等于正样本,两者才能抵消
关于间隔大小周志华老师西瓜书中的那种也很容易理解:点到一条直线的距离。
二 拉格朗日lagrange乘子法求解
观察(6)式,是一个有约束的求极值点的问题,也就是条件极值,常用方法为拉格朗日乘子法。
拉格朗日乘子法是一种寻找多元函数在一组约束下的极值的方法,表示为:
一个新的样本u只要与这些样本训练后与不为0的α以及对应的(xi,yi)相乘大于等于0即可判断为正样本,同理小于等于0为负样本。
三 SVM的核方法
1非线性带来高维转换
2对偶产生内积
四 软边界
软边界代表SVM允许一点点的错误,不严格寻找“支持向量”。6.28是最大间隔
使用的“损失函数”有没有感觉像是一种DL中的“激活函数”,所以说SVM是很强的且有很大的潜力。
机器学习系列(1)SVM的公式推导相关推荐
- 【机器学习系列】之SVM核函数和SMO算法
作者:張張張張 github地址:https://github.com/zhanghekai [转载请注明出处,谢谢!] [机器学习系列]之SVM硬间隔和软间隔 [机器学习系列]之SVM核函数和SMO ...
- SVM 支持向量机算法(Support Vector Machine )【Python机器学习系列(十四)】
SVM 支持向量机算法(Support Vector Machine )[Python机器学习系列(十四)] 文章目录 1.SVM简介 2. SVM 逻辑推导 2.1 Part1 化简限制条件 2.2 ...
- 【机器学习系列】之SVM硬间隔和软间隔
作者:張張張張 github地址:https://github.com/zhanghekai [转载请注明出处,谢谢!] [机器学习系列]之SVM硬间隔和软间隔 [机器学习系列]之SVM核函数和SMO ...
- 机器学习系列19:将核函数应用于支持向量机
https://www.toutiao.com/a6701463387273953806/ 机器学习系列19:将核函数应用于支持向量机 当我们在已知参数的情况下,如何用带有核函数的支持向量机(SVM) ...
- ccxt k线数据_机器学习系列:深度探秘K线结构新维度
标星★公众号,第一时间获取最新研究 来源:光大证券金工团队独家授权 作者:胡骥聪 近期原创文章: ♥ 基于无监督学习的期权定价异常检测(代码+数据) ♥ 5种机器学习算法在预测股价的应用(代码+数据) ...
- Weka中数据挖掘与机器学习系列之Exploer界面(七)
不多说,直接上干货! Weka的Explorer(探索者)界面,是Weka的主要图形化用户界面,其全部功能都可通过菜单选择或表单填写进行访问.本博客将详细介绍Weka探索者界面的图形化用户界面.预处理 ...
- 逻辑回归原理梳理_以python为工具 【Python机器学习系列(九)】
逻辑回归原理梳理_以python为工具 [Python机器学习系列(九)] 文章目录 1.传统线性回归 2.引入sigmoid函数并复合 3. 代价函数 4.似然函数也可以 5. python梯度下降 ...
- 机器学习系列(4)_机器学习算法一览,应用建议与解决思路
作者:寒小阳 时间:2016年1月. 出处:http://blog.csdn.net/han_xiaoyang/article/details/50469334 声明:版权所有,转载请联系作者并注明出 ...
- 机器学习实战 支持向量机SVM 代码解析
机器学习实战 支持向量机SVM 代码解析 <机器学习实战>用代码实现了算法,理解源代码更有助于我们掌握算法,但是比较适合有一定基础的小伙伴.svm这章代码看起来风轻云淡,实则对于新手来说有 ...
- 机器学习系列笔记一:Introduction
机器学习系列笔记一:Intro 文章目录 机器学习系列笔记一:Intro 数据 基本任务 1. 分类 2. 回归 机器学习的工作流程 机器学习算法的传统分类 监督学习 无监督学习 半监督学习 增强/强 ...
最新文章
- 浙江大学《深度学习与行人重识别》课程课件
- SSH连接服务器报错(WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED)的解决方案
- 推荐系统--用户行为和实验设计
- 【iVX 初级工程师培训教程 10篇文拿证】03 事件及猜数字小游戏
- easyexcel导入时读不到数据_easyexcel读取任意表格以及使用中的坑
- My安卓知识5--百度地图api的使用,周边信息检索
- 学习日志---hbase学习(最大版本查询)
- 【离散数学】单向连通和弱连通的区别
- GO语言实现设计模式【全】
- 网络游戏的客户端同步问题
- NEYC 2017 游记
- pcie协议_如何通过PCIE协议实现FPGA 配置?详情请戳这里!
- 如何用计算机处理图片,使用附带软件编辑照片 利用Digital Photo Professional 用电脑处理RAW图像...
- Sql优化总结!详细!(2021最新面试必问)
- postman简介与安装步骤
- iOS 一键加入QQ群(项目常用)
- 基于硬件的C(C++)语言程序设计教程5:更改Atmel Studio的语言设置
- bazel成功安装后,编译代码报错
- Android音乐播放器---实现Notification控制音乐播放
- 图解电动汽车:电动汽车电控系统
热门文章
- Generative Sparse Detection Networks for 3D Single-shot Object Detection稀疏检测网络(GSDN)
- yum install安装提示 File /usr/bin/yum, line 30 except KeyboardInterrupt, e:
- 小小突击队服务器维护多久,小小突击队7月2日更新公告
- 电脑机箱后面有3个音频接口,分别接什么?
- 查询android手机端包名,查看android手机原生app包名的方法
- 奥迪AUDI DELFOR 交付预测报文详解
- 建立任务,OSTaskCreate()源码解析
- 网易博客搬家到CSDN
- VC 基础知识(转载)
- python连接mysql失败_Python连接到MySQL失败,错误为“dh key too small”