统计学习方法——统计学习的分类
首先简单介绍一下统计学习:
统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的一门学科。其可以理解为计算机系统通过运用数据及统计方法提高系统性能的机器学习。现在我们谈论的机器学习,往往就是统计机器学习。
下面进入正文
基本分类
有监督学习
监督学习和无监督学习的区别就是数据是否有标注。有标注的是监督学习,没有标注的是非监督学习。例如,做手写数字识别,0-9的图片会对应0-9数字来判断是否预测正确,而无监督学习则不会有这些判断是否正确的标注。
监督学习大体可以分为三种情况:回归、分类和标注,输出变量为连续变量为回归,离散变量为分类,输出的是一个向量则为标注(例word2vec)。无监督学习
无监督学习的本质是自己学习数据之中的规律和结构。例如聚类和降维。这些都是常见应用。强化学习
强化学习是系统在与环境的互动之中学习最优行为策略的机器学习问题。其学习目标不是短期奖励的最大化而是长期累积奖励的最大化。
强化学习一般基于马尔可夫决策过程:<S,A,P,r,γ>。S是有限状态的集合,A是有限状态的集合,P是计算状态转移概率的函数,r是奖励函数,其计算的是累计奖励。γ是计算累计奖励对后续奖励的衰变,故其在(0,1)。因为当前动作对后续影响是渐衰的。策略Π为根据当前状态S做出的行动A。
强化学习就是根据状态价值函数(策略只考虑当前状态)或者动作价值函数(策略考虑状态和动作)学习一个策略Π使得累计奖励最大。
概率模型和非概率模型
概率模型和非概率模型的本质区别就是其内在结构是否可以表示成联合概率分布的形式。如马尔科夫链为概率模型,神经网络为非概率模型。
线性模型和非线性模型
其判别的依据y(x)是否是线性函数。线性模型可以是用曲线拟合样本,但是分类的决策边界一定是直线的,例如logistics模型区分是否为线性模型,主要是看一个乘法式子中自变量x前的系数w,如果w只影响一个x,那么此模型为线性模型。或者判断决策边界是否是线性的。
参数化和非参数化模型
依据模型训练所得参数维度是否固定,固定为参数化(如k-means),不固定为非参数化(如SVM)。一般来说,比较简单的问题为参数化,困难的为非参数化。
按算法分类
分为在线学习(边学习边预测)和批量学习(学习完了在预测)。
按技巧分类
贝叶斯和核方法。
此处要区分贝叶斯方法和极大似然估计。极大似然估计为频率学派贝叶斯方法为贝叶斯学派。频率学派认为参数固定,于是用已知数据去似然。贝叶斯学派认为参数也服从概率分布,且要根据先验知识。
例如:一种癌症,得了这个癌症的人被检测出为阳性的几率为90%,未得这种癌症的人被检测出阴性的几率为90%,而人群中得这种癌症的几率为1%,一个人被检测出阳性,问这个人得癌症的几率为多少?
假设 A 表示事件 “测出阳性”, B1 表示“得癌症”,B2 表示“未得癌症”,那么:
再来看一下联合概率:人群中检测为阳性并且得癌症的几率:
检测为阳性但未得癌症的概率:
下面开始贝叶斯的功力所在了:“怎样求出在检测出阳性的前提下得癌症的概率呢?”根据上面的结果,
这个问题中:人群中患癌症与否的概率是先验概率,先验概率是已知的,根据观测值:是否为阳性,来判断得癌症的后验概率。(此处示例引用链接https://blog.csdn.net/piaoxuezhong/article/details/53899639)
统计学习方法——统计学习的分类相关推荐
- 机器学习理论《统计学习方法》学习笔记:第六章 逻辑斯谛回归与最大熵模型
机器学习理论<统计学习方法>学习笔记:第六章 逻辑斯谛回归与最大熵模型 6 逻辑斯谛回归与最大熵模型 6.1 逻辑斯谛回归模型 6.1.1 逻辑斯谛分布 6.1.2 二项逻辑斯蒂回归模型 ...
- 机器学习理论《统计学习方法》学习笔记:第五章 决策树
机器学习理论<统计学习方法>学习笔记:第五章 决策树 决策树 5.1 决策树模型与学习 5.1.1 决策树模型 5.1.2 决策树与if-then规则 5.1.3 决策树与条件概率分布 5 ...
- 机器学习理论《统计学习方法》学习笔记:第四章 朴素贝叶斯法
机器学习理论<统计学习方法>学习笔记:第四章 朴素贝叶斯法 4 朴素贝叶斯法 4.1 朴素贝叶斯法的学习与分类 4.1.1 基本方法 4.1.2 后验概率最大化的含义 4.2 朴素贝叶斯法 ...
- 机器学习理论《统计学习方法》学习笔记:第三章 k近邻法
机器学习理论<统计学习方法>学习笔记:第三章 k近邻法 3 k近邻法 3.1 K近邻算法 3.2 K近邻模型 3.2.1 模型 3.2.2 距离度量 3.2.3 K值的选择 3.2.4 分 ...
- 机器学习理论《统计学习方法》学习笔记:第二章 感知机
<统计学习方法>学习笔记:第二章 感知机 2 感知机 2.1 感知机模型 2.2 感知机学习策略 2.2.1 数据的线性可分性 2.2.2 感知机学习策略 2.3 感知机学习算法 2.3. ...
- 1.1 统计学习方法的定义与分类
统计学习方法的定义与分类 统计学习的概念 统计学习的定义 统计学习运用到的领域 统计学习的步骤 统计学习的分类 统计学习的概念 统计学习的定义 统计学习 (Statistical Machine Le ...
- 支持向量机-《统计学习方法》学习笔记
支持向量机-<统计学习方法>学习笔记 1 概述 2 线性可分支持向量机 2.1 线性可分支持向量机简介 2.2 寻找最优分离超平面 2.3 函数间隔 2.4 几何间隔 2.5 (硬)间隔最 ...
- 机器学习理论《统计学习方法》学习笔记:奇异值分解(SVD)
奇异值分解(SVD) 摘要 1 奇异值分解的定义与定理 1.1 奇异值分解的定义 1.2 奇异值分解的基本定理 1.3 奇异值分解的几何解释 2 紧奇异值分解和截断奇异值分解 2.1 紧奇异值分解 2 ...
- 《李航 统计学习方法》学习笔记——第八章提升方法
提升方法 8.1提升方法AdaBoost 8.1.1提升方法的基本思路 8.1.2AdaBoost算法 8.1.3AdaBoost的例子(代码实现) 8.2AdaBoost算法的训练误差分析 定理8. ...
- 李航·《统计学习方法》学习笔记
第一章 统计学习的方法概论 1.1 统计学习概述 1. 统计学习的过程: 2. 统计学习的分类: 3. 监督学习的分类 3.1 生成方法与判别模方法 3.1.1 生成方法 3.1.1 判别方法 3.2 ...
最新文章
- 003_推箱子-事件
- 逆向入门--何为OEP
- 优化技巧与理论(part1)
- Codeforces Round #648 (Div. 2)(A, B, C, D)
- LeetCode 244. 最短单词距离 II(哈希map+set二分查找)
- 马化腾评 Facebook 加密货币;苹果或将 15% 产能移出中国;Python 新版发布 | 极客头条...
- JAVA面向对象-----接口与类、接口之间的关系
- System.out.println 在idea控制台输出的中文乱码问题
- SSRS 2012 高级图表类型 -- 气泡图与散点图
- 配置隐藏计算机磁盘,这2种隐藏硬盘的方法 你绝对想不到!
- 视频转gif怎样操作?如何快速在线生成gif动图?
- 二元函数对xy同时求导_2020.5.6 | 考研数学—多元函数微分学重要考点攻克
- Arduino环境使用TM1638扩展版
- es7 创建模板时,报错 Validation Failed: 1: index patterns are missing
- 七日杀局域网找不到服务器,7日杀局域网的联机教程步骤图
- 「TJOI 2018」碱基序列
- html方框打勾字段,HTML+CSS入门 如何设置 checkbox复选框控件的对勾√样式
- 【计算机网络】1、为什么要学习计算机网络基础
- krohne流量计接线图_KROHNE电磁流量计OPTILUX4300
- virtualbox给CentOS7虚拟机磁盘扩容