1 统计学习方法概论

1.1 统计学习

统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。

从数据出发,提取数据的特征,抽象出数据的模型,发现数据中的知识,又回到对数据的分析与预测中去。

统计学习关于数据的基本假设是同类数据具有一定的统计规律性,这是统计学习的前提。这里的同类数据是指具有某种共同性质的数据,例如英文文章、互联网网页、数据库中的数据等。

统计学习总的目的就是考虑学习什么样的模型和如何学习模型,以使模型能对数据进行准确的预测与分析,同时也要考虑尽可能地提高学习效率。

实现统计学习方法的步骤如下:
(1)得到一个有限的训练数据集合;
(2)确定包含所有可能的模型的假设空间,即学习模型的集合;
(3)确定模型选择的准则,即学习的策略;
(4)实现求解最优模型的算法,即学习的算法;
(5)通过学习方法选择最优模型;
(6)利用学习的最优模型对新数据进行预测或分析。

学习:如果一个系统能够通过执行某个过程改进它的性能

计算机科学由三维组成:系统、计算、信息。

1.2 监督学习

1.2.1 基本概念

在监督学习中,将输入与输出所有可能取值的集合分别称为输入空间与输出空间。

监督学习假设输入与输出的随机变量X和Y遵循联合概率分布P(X,Y)。

监督学习的目的在于学习一个由输入到输出的映射,这一映射由模型来表示。换句话说,学习的目的就在于找到最好的这样的模型。模型属于由输入空间到输出空间的映射的集合,这个集合就是假设空间。假设空间的确定意味着学习范围的确定。

1.3 统计学习三要素

方法=模型+策略+算法

1.3.1 模型

在监督学习过程中,模型就是所要学习的条件概率分布或决策函数。模型的假设空间包含所有可能的条件概率分布或决策函数。

1.3.2 策略

监督学习问题就变成了经验风险或结构风险函数的最优化问题。

1.3.3 算法

统计学习基于训练数据集,根据学习策略,从假设空间中选择最优模型,最后需要考虑用什么样的计算方法求解最优模型。

1.4 模型评估与模型选择

将学习方法对未知数据的预测能力称为泛化能力。

过拟合是指学习时选择的模型所包含的参数过多,以致于出现这一模型对已知数据预测得很好,但对未知数据预测得很差的现象。

当模型的复杂度增大时,训练误差会逐渐减小并趋向于0;而测试误差会先减小,达到最小值后又增大。当选择的模型复杂度过大时,过拟合现象就会发生。

1.5 正则化与交叉验证

正则化项一般是模型复杂度的单调递增函数,模型越复杂,正则化值就越大。

正则化符合奥卡姆剃刀原理。奥卡姆剃刀原理应用于模型选择时变为以下想法:在所有可能选择的模型中,能够很好地解释已知数据并且十分简单才是最好的模型,也就是应该选择的模型。从贝叶斯估计的角度来看,正则化对应于模型的先验概率。可以假设复杂的模型有较小的先验概率,简单的模型有较大的先验概率。

1.6 泛化能力

学习方法的泛化能力是指由该方法学习到的模型对未知数据的预测能力。

1.7 生成模型与判别模型

监督学习方法又可以分为生成方法和判别方法。

1.7.1 生成方法

生成方法由数据学习联合概率分布P(X, Y),然后求出条件概率分布P(Y|X)作为预测的模型,即生成模型:

P(Y|X)= P(X, Y) / P(X)

模型表示了给定输入X产生输出Y的生成关系。

生成方法的特点:生成方法可以还原出联合概率分布P(X,Y),而判别方法则不能;生成方法的学习收敛速度更快,即当样本容量增加的时候,学到的模型可以更快地收敛于真实模型;当存在隐变量时,仍可以用生成方法学习,此时判别方法就不能用。

1.7.2 判别方法

判别方法由数据直接学习决策函数f(X)或者条件概率分布P(Y|X)作为预测的模型,即判别模型。判别方法关心的是对给定的输入X,应该预测什么样的输出Y。

判别方法的特点:判别方法直接学习的是条件概率P(Y|X)或决策函数,直接面对预测,往往学习的准确率更高;由于直接学习P(Y|X)或f(X),可以对数据进行各种程度上的抽象、定义特征并使用特征,因此可以简化学习问题。

1.8 分类问题

在监督学习中,当输出变量Y取有限个离散值时,预测问题便成为分类问题。这时,输入变量X可以是离散的,也可以是连续的。

1.9 标注问题

标注问题的输入是一个观测序列,输出是一个标记序列或状态序列。

1.10 回归问题

回归用于预测输入变量(自变量)和输出变量(因变量)之间的关系。回归问题的学习等价于函数拟合:选择一条函数曲线使其很好地拟合已知数据且很好地预测未知数据。

统计学习方法笔记1--统计学习方法概论相关推荐

  1. 李航-统计学习方法-笔记-1:概论

    写在前面 本系列笔记主要记录<统计学习方法>中7种常用的机器学习分类算法,包括感知机,KNN,朴素贝叶斯,决策树,逻辑斯谛回归与最大熵模型,SVM,boosting. 课本还涉及到3种算法 ...

  2. 统计学习方法笔记_cbr:统计学习及监督学习概论

    第一章笔记,统计学习及监督学习概论 目录 第一章笔记,统计学习及监督学习概论 1.1统计学习 1.统计学习的特点 2.统计学习的对象 3.统计学习的方法 4.统计学习的研究 1.2统计学习的分类 1. ...

  3. 统计学习笔记(1)——统计学习方法概论

    1.统计学习 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习.统计学习是数据驱动的学科.统计学习是一门概率论.统计学.信息论.计算理论.最优化理 ...

  4. 统计学习方法--笔记(1)

    学习理由:趁着研一的下半期刚开始有空闲的时候,打算开始学习朋友上学期介绍的李航<统计学习方法>,自己本身对于数学有着不一样的感情,所以,一旦跟自己专业相关的数学自己还是很感兴趣的读一读,学 ...

  5. 电信保温杯笔记——《统计学习方法(第二版)——李航》第16章 主成分分析

    电信保温杯笔记--<统计学习方法(第二版)--李航>第16章 主成分分析 介绍 总体主成分分析 基本思路 直观解释 定义 主要性质 主成分个数 规范化变量 样本主成分分析 样本主成分的定义 ...

  6. 电信保温杯笔记——《统计学习方法(第二版)——李航》第17章 潜在语义分析

    电信保温杯笔记--<统计学习方法(第二版)--李航>第17章 潜在语义分析 论文 介绍 单词向量空间 话题向量空间 话题向量空间 文本在话题向量空间的表示 从单词向量空间到话题向量空间的线 ...

  7. 统计学习方法笔记第二章-感知机

    统计学习方法笔记第二章-感知机 2.1 感知机模型 2.2感知机学习策略 2.2.1数据集的线性可分型 2.2.2感知机学习策略 2.3感知机学习算法 2.3.1感知机算法的原始形式 2.3.2算法的 ...

  8. 统计学习笔记—手撕“感知机”

    统计学习方法笔记(1)-感知机 引言 感知机模型 模型简述 感知机算法思想 感知机算法性质 算例实现 导入数据 使用前两类莺尾花数据 利用感知机进行线性分类 小结 参考 轻松一刻 引言 下午拜读了李航 ...

  9. 【统计学习笔记】泛化误差上界

    [统计学习笔记]泛化误差上界 1. 泛化误差 2. 泛化误差上界 1. 泛化误差 学习方法的泛化能力是指由该方法学习到的模型对未知数据的预测能力,是学习方法本质上重要的性质.测试误差是依赖于测试数据集 ...

最新文章

  1. drop wp table
  2. MySQL索引原理及慢查询优化 美团
  3. 推荐系统resys小组线下活动见闻2009-08-22
  4. supmap java_SuperMap iServerJava安装与出图必读之Windows操作系统篇
  5. 用ajax更新div,如何使用ajax和jquery更新特定的div
  6. Mybatis-plugins分页助手实现查询数据分页
  7. CSDN博客如何复制别人的文章到自己的博客(很详细,看着图片傻瓜式操作)
  8. php 单例 重连,PHP单例模式详解
  9. Multiple commands produce xxxxxxxxxx app/Info.plist':
  10. 计算机cmd卸载软件,一招让你学会,在win10命令提示符上卸载程序
  11. LTE-PCC SCC
  12. 软件测试学习之悟空CRM项目测试
  13. 详细分析《三合一收款码》后台程序识别原理
  14. 【转载】电磁波中的波段划分:L波段、S波段、C波段、X波段、Ku波段、K波段、Ka波段 等等
  15. 三国史诗——三国官制(二)
  16. android reboot重启分析
  17. 【ESP 保姆级教程】疯狂传感器篇 —— 案例:Mega + ESP8266 + MQ2烟雾传感器 + MQ3酒精传感器 + MQ7一氧化碳传感器 + OLED +巴法云平台
  18. 【深度学习】经典神经网络 VGG 论文解读
  19. 马小妹的Android之旅——Android四大基本组件之Activity
  20. JTAG 标准IEEE STD 1149.1-2013学习笔记(三)Test data registers

热门文章

  1. Enigma密码机原理介绍
  2. Win10删除资源管理器左侧“视频、图片、音乐”等图标
  3. GJ项目技术代码相关总结
  4. 如何设置Docker容器的CPU和内存使用限制
  5. citus 之二 distributed table
  6. 直播带货开发,获取这个礼拜的开始、时间
  7. 强哥说Java--Java的抽象类,Java开发前景怎么样
  8. 远丰电商|企业如何降低ERP运维成本又能增加ERP系统和业务?
  9. 微信小程序基础学习(WXSS+组件)
  10. JAVA练习4—ArrayList