envi最大似然分类_闲谈最大后验概率估计(MAP estimate)amp;极大似然估计(MLE)和机器学习中的误差分类...
上一篇文章中提到了一个有趣的实验,简单来说就是1-100中有若干个数字是“正确的”,只告诉其中一部分“正确的”数字,去猜全部“正确的”数字。
为了严谨的去研究这个问题,我们需要将一些概念进行抽象。首先,把提前告知的其中一部分“正确的”数字定义为样本
这里需要说明一点,由以上定义容易发现
有了前面这些准备,我们就可以给出likelihood的定义:
所以,极大似然估计(MLE)就是在
但是,这种结果在机器学习中却不是令人满意的。譬如说如果
因此,我们需要定义prior。仍然令
所以,prior的定义就是假设在假设空间的概率
有了likelihood和prior,我们可以去定义后验概率(posteriori probability)
最大后验概率估计(MAP estimate)就是找到一个假设
我们可以发现,如果
但是真实情况往往不是这样,
由于
最后想谈一谈误差分类
我们不可能会产生一个精确的模型,我们产生的模型往往是含有噪音的,这些噪音可能来自:
- 模型并不是真实数据产生的模型
- 采样本身也是有噪音的
- 等等
我们也会非常关心:
- 这些噪音随着采样是以什么尺度下降的
- 随着神经元数目增加,我的模型可以把误差下降到多小
- 训练误差和测试误差
- 应该选择什么优化方式
- 等等
有很多很多的误差,我们需要对误差分类(error decomposition)
- 逼近误差(Approximation error)
它衡量了我的模型能最好逼近真实模型到什么程度(譬如说用分片线性函数去拟合非线性函数)。但是要注意,这种逼近是不计成本的,也就是说,在不计一切代价的情况下,如果目标是
在八十年代末九十年代初,最杰出的结论就是universal approximation theorem(万有逼近原理)。这个结论是说,即使只有一个隐藏层(只要够宽),都可以把神经网络拟合的很好。当然,激活函数不可以是仿射函数,要不然连最普通的XOR问题都解决不了。
2. 泛化误差(Generalization error)
它衡量了我可以通过数据集得到的最好的模型
泛化即推广能力。举个例子,给出一系列数据点,我们可以找到一条函数将数据点拟合。那么这条函数在我没有见过的数据点的预测能力和表现性能就叫做泛化能力。
泛化误差是我们很关心的误差,因为理论上已经证明了,
3. 优化误差(Optimization error)
它衡量了我可以通过数据集和某一种优化算法得到的最好的模型
所以最终我们可以得到一个等式
参考:
- Machine Learning_A Probabilistic Perspective[Murphy 2012-08-24]
- bilibili:数学学院本科课程:统计计算与机器学习1
envi最大似然分类_闲谈最大后验概率估计(MAP estimate)amp;极大似然估计(MLE)和机器学习中的误差分类...相关推荐
- 极大似然估计,最大后验概率估计(MAP),贝叶斯估计
1.贝叶斯公式 三种参数估计方法都和贝叶斯公式有关,因此首先从分析贝叶斯公式入手: 贝叶斯公式可以表达为: posterior:通过样本X得到参数的概率 likehood:通过参数得到样本X的概率 p ...
- 一文看懂 “极大似然估计” 与 “最大后验估计” —— 极大似然估计篇
参考: 唐宇迪<人工智能数学基础>第8章 Richard O. Duda <模式分类>第三章 白板机器学习 P2 - 频率派 vs 贝叶斯派 频率学派还是贝叶斯学派?聊一聊机器 ...
- 最大似然估计、最大后验概率估计和贝叶斯估计
本内容主要介绍概率论与统计学相关基础知识,主要涉及 联合概率.边缘概率和条件概率:贝叶斯公式.先验概率.后验概率和似然函数:最大似然估计.最大后验概率估计和贝叶斯估计 等.为机器学习中的贝叶斯分类 ...
- 贝叶斯公式的对数似然函数_贝叶斯估计、最大似然估计、最大后验概率估计
贝叶斯估计.最大似然估计(MLE).最大后验概率估计(MAP)这几个概念在机器学习和深度学习中经常碰到,读文章的时候还感觉挺明白,但独立思考时经常会傻傻分不清楚(
- 机器学习之最大似然估计(MLE)和最大后验概率估计(MAP)
最大似然估计MLE MLE(Maximum Likelihood Estimation)就是利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值的计算过程.直白来讲,就是给定了一定的数据, ...
- 透彻理解机器学习中极大似然估计MLE的原理(附3D可视化代码)
文章目录 相关资料 一.什么是概率,什么是似然 二.极大似然估计 Maximum Likelihood Estimation (MLE) 的含义 2.1 机器学习中的极大化似然函数 2.2 极大似然估 ...
- 数学知识——概率统计(8)统计推断之参数估计:极大似然估计和最大后验概率
目录 1. 统计推断 概念 问题表述 小结 参数估计 抽样分布 假设检验 2. 两大估计方法后面的学派 概率的定义 本质区别 3. 参数估计的思想 3.1 最大似然估计(MLE) 3.2 贝叶斯估计: ...
- 对极大似然估计和极大验后估计的理解
文章目录 Part.I 概念理解 Part.II 例子 Part.III 总结 Reference Part.I 概念理解 概率与统计:概率(probabilty)和统计(statistics)看似两 ...
- 最大似然估计(MLE),最大后验概率估计(MAP),贝叶斯估计入门讲解
已知数据X,去拟合某个概率模型的参数θ,是最基本的机器学习过程. 本文将入门讲解3个最基本的方法:最大似然估计(Maximum Likelihood Estimation,简称MLE),最大后验概率估 ...
最新文章
- 【英文文本分类实战】之三——数据清洗
- mac 上搭建gitlabel_在mac终端中使用git(适用于github、gitlabel)
- Uva 11077 Find the Permutation
- break和continue特殊玩法“标签”
- numpy 是否为零_一文看懂Numpy统计计算、数组比较
- hbuilderx的快捷键整理pdf_mac键盘快捷键详解,苹果电脑键盘快捷键图文教程
- 某系统有6台输出设备 有多个进程均需要使用2台_系统设计硬核知识(4)——操作系统的设备管理...
- 加强计算机网络应用,如何加强计算机网络管理技术创新应用
- 基于Echarts+HTML5可视化数据大屏展示—大数据智慧数据平台
- Qt文档阅读笔记-Visual Parent的初步理解(获取QML中的根节点及其子结点)
- add(1)(2)(3) add(1,2)(3)
- 【Flink】Flink 报错 Hash join exceeded Too many duplicate keys
- preventDefault() 方法 取消事件的默认动作
- ajax分批mysql_使用select2分批异步加载大量数据
- 学会这个大屏神器,低代码开发高端可视化大屏不在话下
- Windows Server 2003至Windows Server 2008的迁移
- qtouch跨平台组态软件
- 各大浏览器兼容性报告
- 计算机网络基础B试题及答案,计算机网络基础试题及答案2
- 使用JavaScript打开Chrome的设置页面
热门文章
- Maven硒测试自动化教程
- html5中meter讲解_Java中的得墨meter耳定律–最少知识原理–实际示例
- Java序列化魔术方法及其示例使用
- 简而言之SPIFFE
- Java SE中的Bootstrap CDI 2.0
- 小程序 转义_为内存密集型应用程序转义JVM堆
- 竹签子毕竟是_毕竟是什么程序和功能?
- gwt-2.8.2下载_GWT 2 Spring 3 JPA 2 Hibernate 3.5教程
- Hibernate应用程序级可重复读取
- 如何通过7个Logback调整立即改善Java日志记录