感知机(perception):二类分类的线性模型,输入为实例的特征向量,输出为实例的类别,取+1,-1。

对应于输入空间中将样本实例分成正负两类的分离超平面,属于判别模型。

其损失函数为:所有误分类点到分类超平面的距离总和。目的为最小化这个距离总和。

其中, 为误分类点到分离超平面距离。L 是 w, b 的连续可导函数。

其包括原始形式和对偶形式,采用随机梯度下降法进行求解。首先任意选择一个超平面w0,b0,然后使用梯度下降法不断的极小化目标函数,其过程不是一次使所有的M个点的梯度下降,而是随机选择一个误分类点使其梯度下降,这样以来随机梯度下降会存在震荡,但整体趋势是下降的,算法本身是收敛的。

对偶形式的基本思想是将w和b表示为实例xi和标记yi的线性组合,通过求其解系求得w和b,本质是用代替w属于全局数据求解

由感知机模型可以进一步推出支持向量机

支持向量机(SVM):是一种二分类模型,定义在特征空间上的建个最大的线性分类器,这也是与感知机的区别:求间隔最大化。

支持向量机的学习策略就是间隔最大化,可形式化为求解一个凸二次规划问题,也等价于正则化的合页损失函数最小化问题。

线性可分支持向量机:硬间隔最大化

则:

线性支持向量机:软间隔最大化

NOTE: w的解唯一,b的解不唯一,存在于一个区间中

非线性支持向量机:核函数 + 软间隔最大化

通过非线性变换将非线性问题转化为线性问题。

这里引入了核函数将输入空间映射为特征空间,核函数:, 在学习与预测中只定义核函数,不显示定义函数 

常用核函数

多项式核函数:

,对应的支持向量机是一个p次多项式分类器,分类决策函数为:

高斯核函数:

对应的支持向量机为高斯径向基函数分类器,分类决策函数为:

字符串核函数:


原始问题:  对偶问题:
 

KKT(Karush-Kuhn-Tucker)条件:

对原始问题和对偶问题,如果函数 f(x) 和ci(x) 是凸函数,hj(x) 是仿射函数,并且不等式约束ci(x)是严格可行的,则 分别是原始问题和对偶问题的解的充分必要条件是满足以下条件:
                                                                      

且, 是对偶互补条件,即:若 ,则 


最后给出求解svm的SMO算法:

SMO算法假设如果所有的变量的解都满足KKT条件,则此问题的解就找到了。否则选择两个变量,固定其他变量,针对这两个变量构建一个二次规划问题,这个二次规划问题关于这两个变量的解应该更接近原始二次规划问题的解,因为这会使得原始二次规划问题的目标函数值变得更小。重要的是,这时子问题可以通过解析方法求解从而加快整个算法的计算速度。子问题有两个变量,一个是违反KKT条件最严重的一个,另一个由约束条件自动确定。如此,SMO算法将原问题不断分解为子问题并对子问题求解,进而达到求解原问题的目的。

李航统计学习方法总结与整理相关推荐

  1. 统计学习方法 pdf_李航统计学习方法(第三章)

    第3章 k 近邻法 k 近邻法(k-NN)是一种基于实例的学习方法,无法转化为对参数空间的搜索问题(参数最优化问题).它的特点是对特征空间进行搜索.除了k近邻法,本章还对以下几个问题进行较深入的讨论: ...

  2. 【李航统计学习方法】感知机模型

    目录 一.感知机模型 二.感知机的学习策略 三.感知机学习算法 感知机算法的原始形式 感知机模型的对偶形式 参考文献 本章节根据统计学习方法,分为模型.策略.算法三个方面来介绍感知机模型. 首先介绍感 ...

  3. 李航统计学习方法笔记——泛化误差上界

    泛化误差上界 References 统计学习方法(第2版)李航著 p25~27 定理 对于二分类问题,当假设空间是有限个函数的集合F={f1,f2,...,fd}F=\{f_1,f_2,...,f_d ...

  4. 机器学习:李航-统计学习方法-代码实现

    <统计学习方法>的代码实现分享 <统计学习方法>这本书,附件里并没有代码实现,于是许多研究者复现了里面算法的代码,并放在github里分享,这里介绍几个比较热门的<统计学 ...

  5. 《李航 统计学习方法》学习笔记——第八章提升方法

    提升方法 8.1提升方法AdaBoost 8.1.1提升方法的基本思路 8.1.2AdaBoost算法 8.1.3AdaBoost的例子(代码实现) 8.2AdaBoost算法的训练误差分析 定理8. ...

  6. 学习笔记:李航统计学习方法

    是关于李航的<统计学习方法>的学习笔记 主要是看七月在线的网课 1 统计学习及监督学习概论 1.1 基础概念 概念:关于计算机基于数据构建概率统计模型.并运用模型对数据进行预测与分析的一门 ...

  7. 李航 统计学习方法 课后习题答案 第二版

    李航<统计学习方法>课后习题答案(第2版)

  8. 李航 统计学习方法 第二版 课后习题答案 机器学习

    李航<统计学习方法>课后习题答案(第2版)

  9. 李航-统计学习方法-笔记-1:概论

    写在前面 本系列笔记主要记录<统计学习方法>中7种常用的机器学习分类算法,包括感知机,KNN,朴素贝叶斯,决策树,逻辑斯谛回归与最大熵模型,SVM,boosting. 课本还涉及到3种算法 ...

  10. 机器学习(李航统计学习方法)

    目录 绪论-资料介绍 绪论-频率派vs贝叶斯派 频率派的观点 贝叶斯派的观点 监督学习与无监督学习 单变量线性回归 模型表示 代价函数 梯度下降 多变量线性回归 多维特征 多变量梯度下降 梯度下降法实 ...

最新文章

  1. windows环境下 curl 安装和使用
  2. uboot移植9个步骤_不知道具体的新房装修步骤?9个步骤教你吃透装修
  3. 整数的个数(信息学奥赛一本通-T1067)
  4. sonarqube代码检核工具安装
  5. 在ArcEngine中使用Geoprocessing工具-执行工具
  6. java常用api简单统计
  7. 老式的计算机比现在的老太多了英语,老人自学英语30年成老师
  8. python怎么解压_Python-解压缩的方法
  9. linux的相关网站,与Linux相关的一些网站
  10. 【原】一张图片优化5K的带宽成本
  11. Android点赞头像列表
  12. python对象属性是与数据有关的项目_python之对象产生,属性(定义的值)的查找原则,对象绑定关系...
  13. android的opencv调试,Android opencv 2.3.1 调试及应用(第一篇)
  14. 计算机应用备课教案,计算机应用基础教案备课(全套).doc
  15. 【成功解决】Error:(3, 46) java: 程序包org.springframework.context.annotation不存在
  16. MATLAB计算几何
  17. curl怎么输出赋值_伺服电动缸怎么控制?
  18. html代码鼠的故事游戏,分享一个html+js实现打地鼠游戏的实例代码
  19. rust中slice panicked at 'byte index 5 is not a char boundary' 问题解决办法
  20. 例题4-6 师兄帮帮忙(A Typical Homework (a.k.a Shi Xiong Bang Bang Mang),Rujia Liu's Present 5, UVa 12412)

热门文章

  1. 物联网发展的尴尬境况:理想与现实仍有差距
  2. 【星辰傀儡线·命运环·卷一 血鸦】 4 金盔少女
  3. 遭遇Trojan.PSW.ZhengTu,Trojan.PSW.OnlineGames,Trojan.PSW.ZhuXian.b等
  4. 横向瀑布流android,waterfall
  5. Android 客户端性能优化(魅族资深工程师毫无保留奉献)
  6. IPv6动态地址DNS解析
  7. sql计算用户留存率和时间留存率
  8. 计算机系统的还原及备份,win7系统备份与还原功能怎么用?win7系统使用备份与还原功能的方法...
  9. 页面数据能够正常渲染,但控制台报错属性underfined
  10. VMware 配置局域网内访问