Raki的PRML阅读笔记 第1章:Introduction
第一章主要在讲一些数学基础:概率论,决策论,信息论
validation set
评估当前参数的表现,用于挑选超参数
如果数据量很⼤,那么模型选择很简单。使⽤⼀部分可得到的数据,可以训练出⼀系列的模型,也可以得到某个给定模型的⼀系列复杂度的参数值。之后在独⽴数据上(有时被称为验证集)⽐较它们,选择预测表现最好的模型即可。如果模型的设计使⽤有限规模的数据集迭代很多次,那么对于验证数据会发⽣⼀定程度的过拟合,因此保留⼀个第三⽅的测试集是很有必要的。这个测试集⽤来最终评估选择的模型的表现
但是在许多实际应⽤中,训练数据和测试数据都是很有限的。为了建⽴好的模型,我们想使⽤尽可能多的可得到的数据进⾏训练。然⽽,如果验证机很⼩,它对预测表现的估计就会有⼀定的噪声。解决这种困境的⼀种⽅法是使⽤交叉验证(cross validation),如图1.18所⽰。这种⽅法能够让可得到数据的S−1
S ⽤于训练,同时使⽤所有的数据来评估表现。当数据相当稀疏的时候,考虑S = N的情况很合适,其中N是数据点的总数。这种技术叫做“留⼀法”(leave-one-out)
最大后验估计:
p(w)p(w)p(w)是先验分布,代表在没有观测数据的情况下,www 的概率
p(D∣w)p(D|w)p(D∣w)是似然函数,代表用参数 www 来估计 DDD 的分布
p(w∣D)p(w|D)p(w∣D) 是后验分布
在贝叶斯的视角,代表允许我们在观察到D之后以后验概率的形式评估w的不确定性
在频率派的视角,参数 θ\thetaθ 是数据集 DDD 的一个固定的参数,而贝叶斯派则认为,只有一个单一的数据集D(即实际观察到的数据集),而参数的不确定性是通过w的概率分布来表达的。
贝叶斯的观点的一个优势是自然的引入了先验分布,具有任何合理先验的贝叶斯方法将导致一个不那么极端的结论
高斯分布
多项高斯分布
最大似然估计
高斯分布的似然估计:
无偏估计量:无偏估计的数学证明和分析
决策论
如果后验概率小于某个阈值,将会拒绝做出识别
生成模型:明确或隐含地对输入和输出的分布进行建模的方法被称为生成模型,因为通过对它们进行采样,有可能在输入空间生成合成数据点
判别模型:直接对后验概率进行建模的方法被称为判别模型
判别函数:直接把输入映射到标签,此时概率不起作用
后验概率有很多优势让我们选择它:
信息论
熵用来衡量一个分布的不确定性程度
⽆噪声编码定理 (noiseless coding theorem)(Shannon, 1948)表明,熵是传输⼀个随机变量状态值所需的⽐特位的下界
最⼤化微分熵的分布是⾼斯分布
**KL散度:**考虑某个未知的分布p(x),假定我们已经使⽤⼀个近似的分布q(x)对它进⾏了建模。如果我们使⽤q(x)来建⽴⼀个编码体系,⽤来把x的值传给接收者,那么,由于我们使⽤了q(x)⽽不是真实分布p(x),因此在具体化x的值(假定我们选择了⼀个⾼效的编码系统)时,我们需要⼀些附加的信息。我们需要的平均的附加信息量(单位是nat)为
注意KL散度不是对称的,KL散度可以用来衡量两个分布的差异(减去一项就是交叉熵)
Jensen不等式,对于凸函数:
Raki的PRML阅读笔记 第1章:Introduction相关推荐
- 《领域驱动设计》阅读笔记 第1章 消化知识
ddd小白,一篇章节便能激起了心中涟漪,感慨之初,记于笔下. 第1章 消化知识 用醍醐灌顶.茅塞顿开来形容此章短短的文字,实不为过. 简单介绍背景:旅游互联网,B2B,初创公司.产品设计-代码开发的 ...
- 深入理解 C 指针阅读笔记 -- 第六章
Chapter6.h #ifndef __CHAPTER_6_ #define __CHAPTER_6_/*<深入理解C指针>学习笔记 -- 第六章*/typedef struct __p ...
- 深入理解 C 指针阅读笔记 -- 第五章
Chapter5.h #ifndef __CHAPTER_5_ #define __CHAPTER_5_/*<深入理解C指针>学习笔记 -- 第五章*//*不应该修改的字符串就应该用 co ...
- 深入理解 C 指针阅读笔记 -- 第四章
Chapter4.h #ifndef __CHAPTER_4_ #define __CHAPTER_4_/*<深入理解C指针>学习笔记 -- 第四章*//*指针数组 -- 意思就是这是一个 ...
- 深入理解 C 指针阅读笔记 -- 第三章
Chapter3.h #ifndef __CHAPTER_3_ #define __CHAPTER_3_/*<深入理解C指针>学习笔记 -- 第三章*//*它们都保存在栈中的什么位置?*/ ...
- 《图解TCP/IP》阅读笔记(第九章)—— 网络安全相关
第九章 网络安全 本章旨在介绍互联网中网络安全的重要性及其相关的实现技术. 本章的内容在我看来,并没有前几章那么重要,大概有所了解就好. 9.1 TCP/IP与网络安全 起初,TCP/IP只用于一个相 ...
- thinking in java 阅读笔记 第六章 类再生
1.介绍了合成和继承,第一章就介绍过,这里详细的介绍了一下. 2.介绍了继承关系初始化构建方法调用顺序,这些东西建议阅读<<深入理解java虚拟机>>讲得更加透彻. 3.到底选 ...
- js高级教程阅读笔记 第五章-引用类型(5.6)
函数内部属性 函数中有两个特殊的对象. arguments:它包含了所有的参数,重要的是它的一个叫做callee的属性,用于指向拥有这个参数的函数.好处是什么呢 实例: function fa(num ...
- 《自然语言处理入门》何晗阅读笔记—第1章:自然语言处理基础概念
第 1 章-自然语言处理基础概念 什么是自然语言处理 自然语言处理(Natural Language Processing,NLP)是一门融合了计算机科学.人工智能以及语言学 的交叉学科. 自然语言是 ...
- 《代码整洁之道》阅读笔记——第12章:迭进
第12章:迭进 12.1 通过迭进设计达到整洁目的 开发时要遵循简单设计的5条规则 12.2 规则1:运行所有测试 全面测试并持续通过所有测试的系统就是可测试的系统. 12.3 规则2:重构 提升内聚 ...
最新文章
- Google Inc.:Google APIs:23' 解决方案
- 什么是Pro*C/C++,嵌入式SQL,第一个pro*c程序,pro*c++,Makefile,Proc增删改查
- 困了。还得背课文。变词型
- python gui测试框架_八款常用的 Python GUI 开发框架推荐
- Java——方法(练习九九乘法表)
- c# webbrowser 获取用户选中文字
- NYOJ88(数论)
- 迷你世界显示未连接服务器成功,迷你世界登录未成功是什么意思 | 手游网游页游攻略大全...
- java线程如何继承,java多线程(一)之继承Thread类
- UNIX环境高级编程之第4章:文件和目录-习题
- hdu-1068POJ1466 Girls and Boys---最大独立集
- Thinkphp企业级知宇自动发卡系统源码bug漏洞分析
- cropper初始化_【jQuery插件分享】Cropper——一个简单方便的图片裁剪插件
- 如何制作gif动态图片
- python怎么把二维数组转化一维数组,python 二维数组转一维数组
- [译]关于Android图形系统的一些事实真相
- 动态圣诞树html,圣诞了,送大家一颗HTML5圣诞树
- 5“机”时代,如何掘金新价值和新机遇?
- java分页打印_谷歌Chrome打印分页
- 19.Oracle数据库SQL开发之 笛卡尔积
热门文章
- 查找数组中特定元素_Leetcode 540 题 有序数组中的单一元素
- Eclipse 无法打开Console,show view无效
- mac启动rabbitmq_从0到1学习Flink—— Flink 读取 Kafka 数据写入到 RabbitMQ
- python中re怎么念_Python,Re模块的学习
- localhost提示没有入口_管家婆财贸双全连接失败,服务器端没有找到加密狗
- ajax php 数组参数传递参数,jquery中ajax传递中文参数和js数组问题
- 建模步骤_SolidWorks建模气球球拖,有步骤,新手都在找的练习题
- python小实例_Python100个小例子
- 【POJ1050+POJ2018+HDOJ6638+牛客1006D】最大子段和问题
- 【HDU6286】2018(容斥)