数学之美

最近在读《数学之美》这本书,做一下个人笔记。看的是PDF,看完后会买一本的哦!版权意识还是有的。

ps:图片文字都是这本书中的内容,侵权立删。会有点自己的理解。

第六章     信息的度量和作用

1    信息熵

从一个角度可以认为信息量就等于不确定性的多少。

信息熵(Entropy),一般用符号H表示,单位是比特。

熵的定义:

变量的不确定性越大,熵也就越大。

文中有个关于冗余度的:重复的内容很多,信息量就小,冗余度就大。

2    信息的作用

一个事物内部会存有随机性,也就是不确定性:U。引入信息 I 消除不确定性,而信息量取决于U的大小。当 I < U 时,可以消除一部分不确定性,也就是说新的不确定性:U' = U - I 。

⭐条件熵

假设X和Y是两个随机变量,已知X的随机分布P(X),那么也就知道了X的熵。现在还知道Y和X的联合概率密度,以及在Y取不同值的前提下X的概率分布,即条件概率分布。定义在Y的条件下的条件熵为:

H(X) >= H(X丨Y),也就是说多了Y的信息之后,关于X的不确定性下降了。在统计语言模型中,如果把Y看成是前一个字,那么在数学上就证明了二元模型的不确定性小于一元模型。同理,三元模型比二元好。(用条件熵解释了模型复杂度)

⭐信息的作用在于消除不确定性,NLP的大量问题就是寻找相关的信息。

3    互信息

互信息(Mutual Information):作为两个随机事件“相关性”的量化度量。

假定有两个随机事件X 和 Y ,它们的互信息定义如下:

4   延伸阅读:相对熵(交叉熵)

相对熵用来衡量两个取值为正数的函数的相似性,定义:

三个结论:

①对于两个完全相同的函数,它们的相对熵是零。

②相对熵越大,两个函数差异越大;反之,则相反。

③对于概率分布或者概率密度函数,如果取值均大于零,相对熵可以度量两个随机分布的差异性。

⭐相对熵是不对称的:

为了计算方便:将上面的不等式两边取平均,即

《数学之美》——第六章 个人笔记相关推荐

  1. 《数学之美》——第九章 个人笔记

    数学之美 最近在读<数学之美>这本书,做一下个人笔记.看的是PDF,看完后会买一本的哦!版权意识还是有的. ps:图片文字都是这本书中的内容,侵权立删.会有点自己的理解. 第九章    图 ...

  2. 《数学之美》——第一章 个人笔记

    数学之美 最近在读<数学之美>这本书,做一下个人笔记.看的是PDF,看完后会买一本的哦!版权意识还是有的. ps:图片文字都是这本书中的内容,侵权立删.会有点自己的理解. 第一章    文 ...

  3. 数学之美系列六 -- 图论和网络爬虫 (Web Crawlers)

    数学之美系列六 -- 图论和网络爬虫 (Web Crawlers) [离散数学是当代数学的一个重要分支,也是计算机科学的数学基础.它包括数理逻辑.集合论.图论和近世代数四个分支.数理逻辑基于布尔运算, ...

  4. 数学之美 第3章 统计语言模型

    数学之美 第3章 统计语言模型 回顾一下: 前面两章都是基础知识,告诉我们自然语言的起源基础,和一些发展过程遇到的问题,第二章告诉我们规则:理解自然语言(即分析语句和获取语义)这种处理方法不可能实现智 ...

  5. Python编程:从入门到实践第六章读书笔记6.3遍历字典

    Python编程:从入门到实践第六章读书笔记6.3遍历字典 #coding:gbk#6.3.1遍历所有的键-值对 user_0 = {'username': 'efermi','first': 'en ...

  6. 工程伦理第六章学习笔记2020最新

    工程伦理第六章学习笔记2020最新 继续更新第六章

  7. 《数学之美(第一版)》笔记整理 —— 目录

    序 因为想对互联网的新兴技术有一些更好的了解,不断拓展自己的知识面,所以想到了吴军老师的<数学之美>,个人非常推荐大家阅读,可以对各种技术有一个入门的了解.吴军老师的讲法也很生动,对部分章 ...

  8. 《数学之美》选章精读

    曾经花了一个月的时间阅读受推荐的书籍<数学之美>,对基于统计的自然语言处理的历史作一个大致的了解,每周精读一章,做下了一些粗略的笔记,算是有个交代吧. 第9章-图论和网络爬虫 概念 图论起 ...

  9. chmod 777 什么意思:鸟哥的linux私房菜第六章学习笔记

    鸟哥的linux私房菜基础学习篇:心血来潮决定看一下这本书,虽然都是讲很基础的东西,但是,绝对不是浪费时间,比如我看完了之后就终于明白了chmod777是什么意思了. 写这个读书笔记也主要是想记录一些 ...

最新文章

  1. OpenCV中resize函数五种插值算法的实现过程
  2. python可分组字典
  3. python学习方向-学习Python的六大发展方向,你知道吗?
  4. 浅析ProcessBuilder
  5. 存储过程打印超过8000的VARCHAR字符的问题
  6. [转载]sql(hive)中变量的使用
  7. python中的生成器
  8. vici 开源asp.net mvc支持asp.net2.0II6.0下部署 实例下载地址
  9. 7-7 旅游规划 (8 分)
  10. linux清空输入框,Linux uniq 命令
  11. 深入浅出设计模式① —— 设计模式之路
  12. python ray定时任务_python定时任务APScheduler
  13. java十大排序法_Java 十大排序算法
  14. OS | 【四 文件管理】强化阶段大题解构 —— FAT文件系统、UFS文件系统访问文件过程
  15. 因为此版本的应用程序不支持其项目类型(.csproj)”之解
  16. android 让手机震动,Android手机震动的设置步骤
  17. 行为型模式----golang实现
  18. java将图片变灰、去噪、反色
  19. 书评:《佐藤可士和的超整理术》
  20. 推出营销云和IoT云 打造CRM全流程解决方案

热门文章

  1. STM32 HAL库和LL库的区别
  2. 笔记|增长为王,阿里大佬分享的流量方法论
  3. 【物联网】26.物联网开发实例 - 节能监控系统
  4. excel的开发工具在哪?不用找了,这里什么都有
  5. python图片隐写_Python3 图片隐写术的实现
  6. 你还在发愁35岁以后吗?国外63岁的工程师却开发一个爆款计算器
  7. 农村信用社不良资产市场化处置方式
  8. 【对讲机的那点事】灵通LD7000H数字对讲机编程及常见问题及处理
  9. ORACLE高级消息队列AQ
  10. Triple-shapelet Networks for Time SeriesClassification(ICDM2020)