机器学习和概率统计的关系
机器学习和概率统计的关系
机器学习是一个比较宽泛的概念,主要包括有监督学习,无监督学习,强化学习等,每个分类又有很多不同的算法,在使用时需要根据不同的场景进行选择,这个将会在后续的博客中涉及,这里就不展开叙述。现在的机器学习主要都是基于对现有样本的观测分析(统计)然后再对未知样本的预测(概率),我自己一个不严谨的说法就是机器学习是一种特殊的概率统计表现形式。
概率统计的关注点
概率与统计的水很深,我们不是为了学习概率与统计,而是为了进行 机器学习而补充相关的概率统计知识,关键是打通概率与统计和机器学习的关系。概率统计根据是否已知整体进行区分:统计是已知一个样本的分布,并从中采样若干样本来计算分布的整体情况,如均值和方差等;概率是已知整体的情况,去预测某一种情况发生的概率,统计和概率互为逆工程。
机器学习与概率统计的关系
一个有监督学习算法,先要将带有标签的样本特征输入到算法模型中进行训练,然后将标签未知的样本特征喂给训练好的算法模型得到一个输出预测。对带有标签样本特征进行训练的过程就是我们统计的应用,就像对一个装有若干白球和黑球的桶我们进行多次的抓取采样,并记录我们采样的结果,根据采样的结果我们就可以估计出桶里的黑球和白球的分布,均值和方差等信息,这就是训练过程(统计);经过多次实验(当N趋于无穷大的时候,就有了大数定理)我们就可以比较准确的统计出所有样本的整体情况,有了对样本整体分布感知的模型,当来一个新的样本特征的时候,我就可以预测这个样本出现对应标签发生的概率是多少,这就是有监督学习算法,预测和训练与概率统计的关系。
总结
1.有了对概率统计的了解,我们可以基于各个分布的特性来评估模型和样本。对于样本特征分布非常相似的我们可以去掉其中某一个特征,对样本特征与标签的分布完全不一致的,如果样本特征比较多可以考虑暂时去掉这一维度的特征。
训练,验证,测试样本希望是同分布的原因就是因为你在训练的时候用按照训练样本就行统计的,如果预测的时候样本分布发生变化,那预测的结果可想而知。
统计估计的是分布,机器学习训练出来的是模型,模型可能包含了很多分布。
机器学习和概率统计的关系相关推荐
- 快速学习-机器学习(线性代数[概率统计])
线性代数 概率统计 常用统计变量 常见概率分布 重要概率公式
- 机器学习的概率统计模型(附代码)(一)
目录 概率论 1.1 离散随机变量分布 1)伯努利分布 2)二项分布 3)泊松分布 1.2 连续随机变量分布 1)均匀分布 2)指数分布 3)正态分布 总结 系列文章目录 概率论 概率论,是研究随机现 ...
- 机器学习的概率统计模型(附代码)(二)
目录 数理统计 2.1 抽样分布 1)卡方()分布 2)t分布 3)F分布 2.2 大数定律 2.3中心极限定理 总结 系列文章目录 数理统计 数理统计是数学的一个分支,分为描述统计和推断统计. ...
- 机器学习中的数学(五)--概率统计
写在前面 <机器学习中的数学>系列主要列举了在机器学习中用到的较多的数学知识,包括微积分,线性代数,概率统计,信息论以及凸优化等等.本系列重在描述基本概念,并不在应用的方面的做深入的探讨, ...
- 机器学习中的数学:概率统计
内容亮点 详解 6 大核心板块:概率思想.随机变量.统计推断.随机过程.采样理论.概率模型,筑牢机器学习核心基础. 教你熟练使用 Python 工具库:依托 NumPy.SciPy.Matplotli ...
- 机器学习基础-概率和统计基本概念
记录概率和统计相关的概念和基础知识 总体来说 概率和统计是互逆的: 概率根据数据生成的过程进行建模,研究某种模型产生的数据有什么特性, 统计学正好相反,通过已知的数据,来推导产生这些数据的模型是怎样的 ...
- 概率统计:概率与统计的关系
参考网上一些资料,做整理,记录并学习: https://www.zhihu.com/question/20269390 https://www.zhihu.com/question/20269390/ ...
- 【机器学习概率统计】08 极限思维:大数定理与中心极限定理
1.一个背景话题 本节课我们来介绍概率统计当中的极限思维,我们首先从一个大家都非常熟悉的场景切入来展开我们本节内容的讨论. 比如说,我们想获得本省 15 15 15岁男生的平均身高,这时你会怎么做?显 ...
- 读书笔记:程序员的数学 概率统计
读书笔记:程序员的数学 概率统计 特点 内容 第一.二章 概率定义 多随机变量 第三.四章 离散.连续分布 第五章 协方差矩阵与多元正态分布 第六.七章 估计与检验 伪随机数 第八章 各类应用 体会 ...
最新文章
- SpringBoot 操作elasticsearch
- Eclipse java项目转换为web项目
- 微型计算机及接口技术试题,1月自考微型计算机及其接口技术试题及答案解析...
- 【面试题 - 最大值减去最小值小于或等于 num 的子数组数量】滑动窗口
- ARP挂马***--嗅探欺骗的最恐怖方式
- php-cs-fixer不起作用,使用 PHP-CS-Fixer 规范PHP代码
- 2022年电子商务概论(农)之形考作业二
- 如何向下属布置工作任务,5个步骤,布置工作任务更清晰
- 从零开始编写minecraft光影包(3)基础泛光绘制
- 自动巡检机器人故障检测系统
- 基于u-net,cv2以及cnn的中文车牌定位,矫正和端到端识别软件
- java 软件开发面试宝典
- Xmake v2.7.1 发布,更好的 C++ Modules 支持
- 台达服务器XML文件,台达BA OPC XML DA使用方法 - 副本.docx
- 三种保存电脑本地图片方法
- corrcoef(corrcoef函数R和P是什么意思)
- 联想超级本Win8系统重新安装Win7系统的心路历程
- 某省公共资源交易电子公共服务平台学习案例
- C#调用百度翻译API实现自己的简单翻译工具
- OpenCV-Python图像处理:腐蚀和膨胀原理及erode、dilate函数介绍
热门文章
- java 链表逆序代码_如何实现一个高效的单向链表逆序输出?(详解)
- SAMSUNG U608
- 面试技术型中高层管理人员的问题
- 日常运维之AWS 导入pfx/p12证书
- Opencv 图像深度+转换深度
- setfill(' ') setw(n)
- git 解决冲突(使用git命令)
- 《python编程从入门到实践》python入门级-学习笔记(1-2章)——持续更新中
- python中竖杠用法_python中@的用法,你知多少
- python中的divmod函数_Python中的divmod函数和map函数