机器学习中的数学基础--特征函数与中心极限定理,统计学基本概念,极大似然估计,最大后验估计
机器学习中的数学基础--第六天
- 特征函数与中心极限定理
- 统计学基本概念
- 极大似然估计(Maximum likelihood estimation)
- 最大后验估计(Maximum A Posteriori)
特征函数与中心极限定理
特征函数:
中心极限定理:
独立同分布的中心极限定理:
该定理说明,当n很大时,随机变量 近似地服从标准正态分布N(0,1)。因此,当n很大时, 近似地服从正态分布N(nμ,nσ2).该定理是中心极限定理最简单又最常用的一种形式,在实际工作中,只要n足够大,便可以把独立同分布的随机变量之和当作正态变量。这种方法在数理统计中用得很普遍,当处理大样本时,它是重要工具。
统计学基本概念
p-value:假定值,假设几率
ps.P值不是给定样本结果时原假设为真的概率,而是给定原假设为真时样本结果出现的概率。
α:显著性水平,当原假设正确时,拒绝原假设的概率,1-α为置信度(置信区间)
TP、FP、TN、FN:
α和p-value 的区别:转载:知乎@DayDayUp
假设检验:H0(原假设),H1(备择假设)
True | False | |
---|---|---|
Positive | TP | FP |
Negative | TN | FN |
充分统计量:数学上,设(X₁, …,Xₑ)是来自总体X的一个随机样本,T=T(X₁, …,Xₑ)是一统计量。若在T=t的条件下,样本的条件分布与未知参数θ无关,则称统计量T是θ的充分统计量。
P(precosion)-R(recall)曲线:
P=TP/(TP+FP)(在预测正确中,真正正确的概率),
R=TP/(TP+FN)(在真正正确中,预测正确的概率)
ROC曲线:TPR(真阳率(True postive rate))-FPR(假阳率(False positive rate))
FPR=FP/(FP+TN)(所有负样本中有多少被预测为正例)
TPR=TP/(TP+FN)(等同于recall)
ps.图片转载处:ROC及AUC计算方法及原理,大佬讲的挺好!
AUC:AUC(Area Under Curve) 被定义为ROC曲线下的面积,因为ROC曲线一般都处于y=x这条直线的上方,所以取值范围在0.5和1之间,使用AUC作为评价指标是因为ROC曲线在很多时候并不能清晰地说明哪个分类器的效果更好,而AUC作为一个数值,其值越大代表分类器效果更好。
转载出处同上
极大似然估计(Maximum likelihood estimation)
定义:
极大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。极大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。
最大后验估计(Maximum A Posteriori)
转载:@知乎 夏飞(聊一聊机器学习的MLE和MAP:最大似然估计和最大后验估计)
机器学习中的数学基础--特征函数与中心极限定理,统计学基本概念,极大似然估计,最大后验估计相关推荐
- 机器学习笔记(VII)线性模型(III)对数几率回归和极大似然估计
背景知识 常见回归模型 线性回归(linear regression): y=wTx+b(1) y=\mathbf{w}^T\mathbf{x}+b\tag{1} 但是有时候预测值会逼近 y \mat ...
- 免费教材丨第51期:数学基础课程----概率论教程、机器学习中的数学基础
小编说 过去几个月里,有不少人联系我,向我表达他们对人工智能.数据科学.对利用机器学习技术探索统计规律性,开发数据驱动的产品的热情.但是,我发现他们中有些人实际上缺少为了获取有用结果的必要的数学直觉和 ...
- 机器学习中的数学基础 4
随机变量与概率分布 均匀分布 每个事件的概率是一样的,例如骰子的六面,每一面的概率都是 1 / 6 1/6 1/6 随机变量 给定样本空间 ( S , F ) (S,{\mathbb {F}}) (S ...
- 机器学习中的数学基础(2)——理解基、线性组合与向量空间
https://www.toutiao.com/a6668922466275951118/ 这是<机器学习中的数学基础>系列的第2篇. 铺垫 在介绍各种"高大上"的名词 ...
- 秦曾昌人工智能课程---1、机器学习中的数学基础
秦曾昌人工智能课程---1.机器学习中的数学基础 一.总结 一句话总结: 函数+线代:了解数学常用函数,了解矩阵,了解线性代数 由浅入深:人工智能需要的高数基础并不多,由浅入深,很简单的 1.机器学习 ...
- 秦曾昌人工智能课程---2、机器学习中的数学基础2
秦曾昌人工智能课程---2.机器学习中的数学基础2 一.总结 一句话总结: 概率论在机器学习中比较重要 1.机器学习中最重要的数学基础是什么? 概率和统计:机器学习中很多情况需要处理不确定性, 2.我 ...
- 机器学习中的数学基础(一):高等数学
机器学习中的数学基础(一):高等数学 1 高数 1.1 如何理解方向导数与梯度? 1.2 泰勒公式 1.3 拉格朗日乘子法 1.3.1 理论支持 1.3.2 实例 在看西瓜书的时候有些地方的数学推导( ...
- 机器学习中的数学基础--随机变量与概率分布,伯努利分布和泊松分布,贝叶斯定理
机器学习中的数学基础--第四天 随机变量与概率分布 伯努利分布和泊松分布 贝叶斯定理 随机变量与概率分布 均匀分布:每个事件的概率是一样的,例如骰子的六面,每一面的概率都是1/6 随机变量: 1.离散 ...
- 【机器学习中的数学基础】矩阵特征值、特征向量和特征值分解的几何意义
[机器学习中的数学基础]矩阵特征值.特征向量和特征值分解的几何意义 在<机器学习>西瓜书中的第十章提到了"多维缩放"(简称MDS)方法,该方法是一种经典的的降维方法.此 ...
- 机器学习中的数学基础怎么学?
又到了周末了,但小编的周六并不算周末.回到本次的话题上,这次小编给大家分享机器学习中的数学基础该怎么学. 首先给出小编的态度:机器学习中涉及的数学课程比较多,要想一下子去穷尽所有课程显然也不现实,大可 ...
最新文章
- html5 上传超大文件,HTML5教程 如何拖拽上传大文件
- Verilog中testbench的设计,文件读取和写入操作
- STP、RSTP、MSTP
- Android多模块覆盖率,Android代码覆盖率初探—问题已解决!
- 计算机基础说课 word,计算机基础说课稿
- 深度学习-超参数调优
- 蓝色营销型中央空调设备系统类网站源码 大型制冷设备网站织梦模板
- 查了一晚上的资料,累啊。
- leetcode74:二维矩阵搜索问题
- android适配规则(一)
- 23. 从上往下打印二叉树[层序遍历](C++版本)
- java8中的接口与时间操作
- intellij idea 和 maven的自己的理解和安装配置
- Hadoop安装目录
- jetbrains mono字体安装方法(LInux Windows MacOS系统)
- Axure8.0激活码
- 新东方报名系统服务器地址,新东方邮箱服务器地址
- [BZOJ]4453: cys就是要拿英魂! 单调栈+二分+hash
- 成年人的崩溃,是从借钱开始的
- 解决在EasyUI中使用百度地图出现不居中和坐标图标显示异常的问题(红色代码部分)