统计学习方法的定义与分类

  • 统计学习的概念
    • 统计学习的定义
    • 统计学习运用到的领域
    • 统计学习的步骤
  • 统计学习的分类

统计学习的概念

统计学习的定义

统计学习 (Statistical Machine Learning) 是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科。

  • 以计算机和网络为平台
  • 以数据为研究对象
  • 以预测和分析数据为目的
  • 以方法为中心
  • 是多领域交叉的学科

统计学习运用到的领域

统计学习的步骤

  1. 得到一个有限的训练数据集合
  2. 确定学习模型的集合 — 模型
  3. 确定模型选择的准则 — 策略
  4. 实现求解最优模型的算法 — 算法
  5. 通过学习方法选择最优模型
  6. 利用学习的最优模型对新数据进行预测或分析
#mermaid-svg-njHMCLdbAvj4hQYW {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-njHMCLdbAvj4hQYW .error-icon{fill:#552222;}#mermaid-svg-njHMCLdbAvj4hQYW .error-text{fill:#552222;stroke:#552222;}#mermaid-svg-njHMCLdbAvj4hQYW .edge-thickness-normal{stroke-width:2px;}#mermaid-svg-njHMCLdbAvj4hQYW .edge-thickness-thick{stroke-width:3.5px;}#mermaid-svg-njHMCLdbAvj4hQYW .edge-pattern-solid{stroke-dasharray:0;}#mermaid-svg-njHMCLdbAvj4hQYW .edge-pattern-dashed{stroke-dasharray:3;}#mermaid-svg-njHMCLdbAvj4hQYW .edge-pattern-dotted{stroke-dasharray:2;}#mermaid-svg-njHMCLdbAvj4hQYW .marker{fill:#333333;stroke:#333333;}#mermaid-svg-njHMCLdbAvj4hQYW .marker.cross{stroke:#333333;}#mermaid-svg-njHMCLdbAvj4hQYW svg{font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;}#mermaid-svg-njHMCLdbAvj4hQYW .label{font-family:"trebuchet ms",verdana,arial,sans-serif;color:#333;}#mermaid-svg-njHMCLdbAvj4hQYW .cluster-label text{fill:#333;}#mermaid-svg-njHMCLdbAvj4hQYW .cluster-label span{color:#333;}#mermaid-svg-njHMCLdbAvj4hQYW .label text,#mermaid-svg-njHMCLdbAvj4hQYW span{fill:#333;color:#333;}#mermaid-svg-njHMCLdbAvj4hQYW .node rect,#mermaid-svg-njHMCLdbAvj4hQYW .node circle,#mermaid-svg-njHMCLdbAvj4hQYW .node ellipse,#mermaid-svg-njHMCLdbAvj4hQYW .node polygon,#mermaid-svg-njHMCLdbAvj4hQYW .node path{fill:#ECECFF;stroke:#9370DB;stroke-width:1px;}#mermaid-svg-njHMCLdbAvj4hQYW .node .label{text-align:center;}#mermaid-svg-njHMCLdbAvj4hQYW .node.clickable{cursor:pointer;}#mermaid-svg-njHMCLdbAvj4hQYW .arrowheadPath{fill:#333333;}#mermaid-svg-njHMCLdbAvj4hQYW .edgePath .path{stroke:#333333;stroke-width:2.0px;}#mermaid-svg-njHMCLdbAvj4hQYW .flowchart-link{stroke:#333333;fill:none;}#mermaid-svg-njHMCLdbAvj4hQYW .edgeLabel{background-color:#e8e8e8;text-align:center;}#mermaid-svg-njHMCLdbAvj4hQYW .edgeLabel rect{opacity:0.5;background-color:#e8e8e8;fill:#e8e8e8;}#mermaid-svg-njHMCLdbAvj4hQYW .cluster rect{fill:#ffffde;stroke:#aaaa33;stroke-width:1px;}#mermaid-svg-njHMCLdbAvj4hQYW .cluster text{fill:#333;}#mermaid-svg-njHMCLdbAvj4hQYW .cluster span{color:#333;}#mermaid-svg-njHMCLdbAvj4hQYW div.mermaidTooltip{position:absolute;text-align:center;max-width:200px;padding:2px;font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:12px;background:hsl(80, 100%, 96.2745098039%);border:1px solid #aaaa33;border-radius:2px;pointer-events:none;z-index:100;}#mermaid-svg-njHMCLdbAvj4hQYW :root{--mermaid-font-family:"trebuchet ms",verdana,arial,sans-serif;}

训练集
测试集
数据
学习系统
模型
预测系统
预测结果

统计学习的分类


部分分类的解释:

概率模型和非概率模型:概率模型由条件概率来表达,非概率模型由函数来表达,决策树、朴素贝叶斯是概率模型,而感知机、支持向量机、神经网络这些是非概率模型。

参数化和非参数化模型:参数化模型一般处理简单的问题,非参数化模型一般处理复杂的问题。

在线学习和批量学习:在线学习,每次都接受一个样本,然后学习模型进行预测,之后不断重复的模型,适用于实时数据;批量学习,是一次接受所有样本,然后学习模型进行预测的模型。

1.1 统计学习方法的定义与分类相关推荐

  1. 【统计学习方法】感知机对鸢尾花(iris)数据集进行二分类

    本文摘要 · 理论来源:[统计学习方法]第二章 感知机 · 技术支持:pandas(读csv).matplotlib(画图).numpy.sklearn.linear_model.Perceptron ...

  2. 《统计学习方法》(李航)第1章主要内容介绍(统计学习概述、分类、三要素)

    PS:所写内容为本人读书笔记,如需看更详细内容请购买正版书籍. 第1章:统计学习及监督学习概论 1.1  统计学习概述 统计学习:是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测和分析的学 ...

  3. 【统计学习方法系列】赏析李航教授《监督学习:回归与分类》

    原作者:https://github.com/fengdu78/lihang-code 参考作者:https://github.com/Dod-o/Statistical-Learning-Metho ...

  4. 【统计学习方法】线性可分支持向量机对鸢尾花(iris)数据集进行二分类

    本文摘要 · 理论来源:[统计学习方法]第七章 SVM · 技术支持:pandas(读csv).numpy.sklearn.svm.svm思想.matplotlib.pyplot(绘图) · 代码目的 ...

  5. 【统计学习方法】K近邻对鸢尾花(iris)数据集进行多分类

    本文摘要 · 理论来源:[统计学习方法]第三章 K近邻 · 技术支持:pandas(读csv).collections.Counter(统计).numpy.sklearn.neighbors.KNei ...

  6. 文本分类入门(三)统计学习方法

    文本分类入门(三)统计学习方法 前文说到使用统计学习方法进行文本分类就是让计算机自己来观察由人提供的训练文档集,自己总结出用于判别文档类别的规则和依据.理想的结果当然是让计算机在理解文章内容的基础上进 ...

  7. 统计学习方法第八章作业:分类问题AdaBoost算法、回归问题提升树算法 代码实现

    分类问题AdaBoost算法 import math import numpy as npclass Adaboost_tree:def __init__(self,X,Y,feature_type= ...

  8. 统计学习方法--KL散度的定义和狄利克雷分布的性质

    与公众号同步更新,详细内容及相关ipynb文件在公众号中,公众号:AI入门小白 文章目录 KL散度的定义 狄利克雷分布的性质 KL散度的定义 KL散度是描述两个概率分布Q(x)Q(x)Q(x)和P(x ...

  9. 统计学习方法笔记 -- 概论

    统计学习方法是基于训练数据构建统计模型,从而对数据进行预测和分析.  统计学习分为,监督学习(supervised learning),非监督学习,半监督学习和强化学习(reinforcement l ...

最新文章

  1. 计算机本科211调剂到双非值得吗,经验分享:从双非到211,调剂是场快准狠的战役...
  2. YUV视频格式到RGB32格式转换的速度优化 上篇(转)
  3. openjdk需要自己添加cacerts,
  4. EGOImageView 解析
  5. TOML-To-Go 更新,支持暗黑模式
  6. C++ 快速排序算法
  7. Ubuntu 16.04 安装phpmyadmin以及注意事项
  8. [软件工程学习笔记]浅谈敏捷开发
  9. flume介绍与原理
  10. (转)Bootstrap 之 Metronic 模板的学习之路 - (1)总览
  11. 关于Synchornized,Lock,AtomicBoolean和volatile的区别介绍
  12. Pandas MultiIndex(多重索引)
  13. raw socket java_记一次蛋疼的Raw socket发送经历。附:Raw socket编程总结
  14. 春风十里,Webpower喊营销汪们更聪明地获得理想薪资
  15. 进化计算(七)——MOEA/D算法详解
  16. lingo入门教程之二 --- 集合运用
  17. C. Banh-mi
  18. 基于Transformer的时空融合网络地铁客流预测模型
  19. 数据分析大厂面试真题汇总
  20. python b64encode_python base64编码解码、SHA256编码、urlsafe_b64encode编码

热门文章

  1. MIT协议是干什么的?底层原理是什么?
  2. vim 查找替换操作命令
  3. Matlab函数学习---sum函数(计算矩阵、数组和向量元素总和)
  4. C# Serializable标签 和序列化
  5. 摩尔定律,梅特卡夫定律和科斯定律
  6. 快速理解ResNeXt(结合代码)
  7. 基础知识--封装、继承、多态、抽象
  8. 【C语言】如何去求最大公约数和最小公倍数?
  9. 如何正确选择ARM核心板、ARM工控板的存储类型?
  10. Fedora下载地址