第一章主要在讲一些数学基础:概率论,决策论,信息论

validation set

评估当前参数的表现,用于挑选超参数

如果数据量很⼤,那么模型选择很简单。使⽤⼀部分可得到的数据,可以训练出⼀系列的模型,也可以得到某个给定模型的⼀系列复杂度的参数值。之后在独⽴数据上(有时被称为验证集)⽐较它们,选择预测表现最好的模型即可。如果模型的设计使⽤有限规模的数据集迭代很多次,那么对于验证数据会发⽣⼀定程度的过拟合,因此保留⼀个第三⽅的测试集是很有必要的。这个测试集⽤来最终评估选择的模型的表现

但是在许多实际应⽤中,训练数据和测试数据都是很有限的。为了建⽴好的模型,我们想使⽤尽可能多的可得到的数据进⾏训练。然⽽,如果验证机很⼩,它对预测表现的估计就会有⼀定的噪声。解决这种困境的⼀种⽅法是使⽤交叉验证(cross validation),如图1.18所⽰。这种⽅法能够让可得到数据的S−1
S ⽤于训练,同时使⽤所有的数据来评估表现。当数据相当稀疏的时候,考虑S = N的情况很合适,其中N是数据点的总数。这种技术叫做“留⼀法”(leave-one-out)

最大后验估计

p(w)p(w)p(w)是先验分布,代表在没有观测数据的情况下,www 的概率

p(D∣w)p(D|w)p(D∣w)是似然函数,代表用参数 www 来估计 DDD 的分布

p(w∣D)p(w|D)p(w∣D) 是后验分布

在贝叶斯的视角,代表允许我们在观察到D之后以后验概率的形式评估w的不确定性

在频率派的视角,参数 θ\thetaθ 是数据集 DDD 的一个固定的参数,而贝叶斯派则认为,只有一个单一的数据集D(即实际观察到的数据集),而参数的不确定性是通过w的概率分布来表达的。

贝叶斯的观点的一个优势是自然的引入了先验分布,具有任何合理先验的贝叶斯方法将导致一个不那么极端的结论

高斯分布


多项高斯分布

最大似然估计

高斯分布的似然估计:


无偏估计量:无偏估计的数学证明和分析

决策论

如果后验概率小于某个阈值,将会拒绝做出识别

生成模型:明确或隐含地对输入和输出的分布进行建模的方法被称为生成模型,因为通过对它们进行采样,有可能在输入空间生成合成数据点

判别模型:直接对后验概率进行建模的方法被称为判别模型

判别函数:直接把输入映射到标签,此时概率不起作用

后验概率有很多优势让我们选择它:


信息论

用来衡量一个分布的不确定性程度

⽆噪声编码定理 (noiseless coding theorem)(Shannon, 1948)表明,熵是传输⼀个随机变量状态值所需的⽐特位的下界

最⼤化微分熵的分布是⾼斯分布

**KL散度:**考虑某个未知的分布p(x),假定我们已经使⽤⼀个近似的分布q(x)对它进⾏了建模。如果我们使⽤q(x)来建⽴⼀个编码体系,⽤来把x的值传给接收者,那么,由于我们使⽤了q(x)⽽不是真实分布p(x),因此在具体化x的值(假定我们选择了⼀个⾼效的编码系统)时,我们需要⼀些附加的信息。我们需要的平均的附加信息量(单位是nat)为

注意KL散度不是对称的,KL散度可以用来衡量两个分布的差异(减去一项就是交叉熵)

Jensen不等式,对于凸函数:

Raki的PRML阅读笔记 第1章:Introduction相关推荐

  1. 《领域驱动设计》阅读笔记 第1章 消化知识

    ddd小白,一篇章节便能激起了心中涟漪,感慨之初,记于笔下. 第1章  消化知识 用醍醐灌顶.茅塞顿开来形容此章短短的文字,实不为过. 简单介绍背景:旅游互联网,B2B,初创公司.产品设计-代码开发的 ...

  2. 深入理解 C 指针阅读笔记 -- 第六章

    Chapter6.h #ifndef __CHAPTER_6_ #define __CHAPTER_6_/*<深入理解C指针>学习笔记 -- 第六章*/typedef struct __p ...

  3. 深入理解 C 指针阅读笔记 -- 第五章

    Chapter5.h #ifndef __CHAPTER_5_ #define __CHAPTER_5_/*<深入理解C指针>学习笔记 -- 第五章*//*不应该修改的字符串就应该用 co ...

  4. 深入理解 C 指针阅读笔记 -- 第四章

    Chapter4.h #ifndef __CHAPTER_4_ #define __CHAPTER_4_/*<深入理解C指针>学习笔记 -- 第四章*//*指针数组 -- 意思就是这是一个 ...

  5. 深入理解 C 指针阅读笔记 -- 第三章

    Chapter3.h #ifndef __CHAPTER_3_ #define __CHAPTER_3_/*<深入理解C指针>学习笔记 -- 第三章*//*它们都保存在栈中的什么位置?*/ ...

  6. 《图解TCP/IP》阅读笔记(第九章)—— 网络安全相关

    第九章 网络安全 本章旨在介绍互联网中网络安全的重要性及其相关的实现技术. 本章的内容在我看来,并没有前几章那么重要,大概有所了解就好. 9.1 TCP/IP与网络安全 起初,TCP/IP只用于一个相 ...

  7. thinking in java 阅读笔记 第六章 类再生

    1.介绍了合成和继承,第一章就介绍过,这里详细的介绍了一下. 2.介绍了继承关系初始化构建方法调用顺序,这些东西建议阅读<<深入理解java虚拟机>>讲得更加透彻. 3.到底选 ...

  8. js高级教程阅读笔记 第五章-引用类型(5.6)

    函数内部属性 函数中有两个特殊的对象. arguments:它包含了所有的参数,重要的是它的一个叫做callee的属性,用于指向拥有这个参数的函数.好处是什么呢 实例: function fa(num ...

  9. 《自然语言处理入门》何晗阅读笔记—第1章:自然语言处理基础概念

    第 1 章-自然语言处理基础概念 什么是自然语言处理 自然语言处理(Natural Language Processing,NLP)是一门融合了计算机科学.人工智能以及语言学 的交叉学科. 自然语言是 ...

  10. 《代码整洁之道》阅读笔记——第12章:迭进

    第12章:迭进 12.1 通过迭进设计达到整洁目的 开发时要遵循简单设计的5条规则 12.2 规则1:运行所有测试 全面测试并持续通过所有测试的系统就是可测试的系统. 12.3 规则2:重构 提升内聚 ...

最新文章

  1. Google Inc.:Google APIs:23' 解决方案
  2. 什么是Pro*C/C++,嵌入式SQL,第一个pro*c程序,pro*c++,Makefile,Proc增删改查
  3. 困了。还得背课文。变词型
  4. python gui测试框架_八款常用的 Python GUI 开发框架推荐
  5. Java——方法(练习九九乘法表)
  6. c# webbrowser  获取用户选中文字
  7. NYOJ88(数论)
  8. 迷你世界显示未连接服务器成功,迷你世界登录未成功是什么意思 | 手游网游页游攻略大全...
  9. java线程如何继承,java多线程(一)之继承Thread类
  10. UNIX环境高级编程之第4章:文件和目录-习题
  11. hdu-1068POJ1466 Girls and Boys---最大独立集
  12. Thinkphp企业级知宇自动发卡系统源码bug漏洞分析
  13. cropper初始化_【jQuery插件分享】Cropper——一个简单方便的图片裁剪插件
  14. 如何制作gif动态图片
  15. python怎么把二维数组转化一维数组,python 二维数组转一维数组
  16. [译]关于Android图形系统的一些事实真相
  17. 动态圣诞树html,圣诞了,送大家一颗HTML5圣诞树
  18. 5“机”时代,如何掘金新价值和新机遇?
  19. java分页打印_谷歌Chrome打印分页
  20. 19.Oracle数据库SQL开发之 笛卡尔积

热门文章

  1. 查找数组中特定元素_Leetcode 540 题 有序数组中的单一元素
  2. Eclipse 无法打开Console,show view无效
  3. mac启动rabbitmq_从0到1学习Flink—— Flink 读取 Kafka 数据写入到 RabbitMQ
  4. python中re怎么念_Python,Re模块的学习
  5. localhost提示没有入口_管家婆财贸双全连接失败,服务器端没有找到加密狗
  6. ajax php 数组参数传递参数,jquery中ajax传递中文参数和js数组问题
  7. 建模步骤_SolidWorks建模气球球拖,有步骤,新手都在找的练习题
  8. python小实例_Python100个小例子
  9. 【POJ1050+POJ2018+HDOJ6638+牛客1006D】最大子段和问题
  10. 【HDU6286】2018(容斥)