1 信息熵

一条信息的信息量与其不确定性有着直接的关系。信息量就等于不确定性的多少。

如何量化信息量的度量?  信息熵(entropy) 用符号H表示,单位是比特。

变量的不确定性越大,熵也就越大。

如果一本书重复的内容很多,它的信息量就小,冗余度就大。

不同语言的冗余度差别很大,而汉语在所有语言中冗余度是相对小的。

2 信息的作用

信息和消除不确定性是相互联系的。

信息是消除系统不确定性的唯一办法(在没有获得任何信息前,一个系统就像是一个黑盒子,引入信息,就可以了解黑盒子系统的内部结构)

网页搜索的本质也是利用信息消除不确定性的过程。

合理利用信息,而非玩弄公式和机器学习的算法,是做好搜索的关键。

条件熵:

,也就是说多了Y的信息之后,关于X的不确定性就下降了!在统计语言模型中,如果把Y看成是前一个字,那么在数学上就证明了二元模型的不确定性小于一元模型。

上述等号什么时候成立?等号成立,说明增加了信息,不确定性却没有降低。如果我们或缺的信息与要研究的事物毫无关系,等号就成立。

信息的作用在于消除不确定性,自然语言处理的大量问题就是寻找相关信息。

3 互信息

香农提出一个“互信息”的概念作为两个随机事件“相关性”的量化度量。

所谓两个事件相关性的量化度量,就是在了解其中一个Y的前提下,对消除另一个X不确定性所提供的信息量。

4 相对熵

相对熵也用来衡量相关性,但和变量的互信息不同,它用来衡量两个取值为正数的函数的相关性。

两个完全相同的函数,它们的相对熵等于零。

相对熵越大,两个函数差异越大;反之,相对熵越小,两个函数差异越小。

对于概率分布或者概率密度函数,如果取值均大于零,相对熵可以度量两个随机分布的差异性。

《数学之美》第6章 信息的度量和作用相关推荐

  1. 《数学之美》 第六章 信息的度量和作用

    <数学之美> 第六章 信息的度量和作用 信息量等于不确定性的多少 香农定理中,用比特bit这个概念来度量信息量.一个比特是一位二进制数,计算机中一个字节是8比特 信息熵,一般用符号H表示 ...

  2. 《数学之美》第六章——信息的度量和作用

    1 信息熵 一条信息的信息量与其不确定性有着直接的关系. 如何一件事情非常不确定,我们要搞清楚就需要了解大量的信息.如果一件事情了解较多,则只需要少量信息就可以搞清楚. 可以认为,信息量就等于不确定性 ...

  3. 数学之美 第3章 统计语言模型

    数学之美 第3章 统计语言模型 回顾一下: 前面两章都是基础知识,告诉我们自然语言的起源基础,和一些发展过程遇到的问题,第二章告诉我们规则:理解自然语言(即分析语句和获取语义)这种处理方法不可能实现智 ...

  4. 《数学之美》——第九章 个人笔记

    数学之美 最近在读<数学之美>这本书,做一下个人笔记.看的是PDF,看完后会买一本的哦!版权意识还是有的. ps:图片文字都是这本书中的内容,侵权立删.会有点自己的理解. 第九章    图 ...

  5. 《数学之美》选章精读

    曾经花了一个月的时间阅读受推荐的书籍<数学之美>,对基于统计的自然语言处理的历史作一个大致的了解,每周精读一章,做下了一些粗略的笔记,算是有个交代吧. 第9章-图论和网络爬虫 概念 图论起 ...

  6. 《数学之美》——第一章 个人笔记

    数学之美 最近在读<数学之美>这本书,做一下个人笔记.看的是PDF,看完后会买一本的哦!版权意识还是有的. ps:图片文字都是这本书中的内容,侵权立删.会有点自己的理解. 第一章    文 ...

  7. 《数学之美》第一章读后感

    第一章分别讲述了早期信息的传播,文字和数字的发展,文字和语言背后的数学三个部分. 我从中了解到了信息传递,不论是早期的远古社会,还是如今快速发展的互联网时代,其规律都是异曲同工的.比如信息传播的模型都 ...

  8. 数学之美:信息的度量和作用 KL散度 自信息 熵 相对熵 KL divergence entropy

    当上述公式中概率相等时会推出,H刚好等于5比特. 自信息: 一条信息的信息量与该信息的不确定性有关.如果想要搞懂一件非常不清楚的事,就需要了解大量的信息,相反如果一件事我们已经了如指掌,那就不需要太多 ...

  9. 数学之美-读书笔记6-10章

    文章目录 数学之美 第六章 信息的度量和作用 1信息熵 2信息的作用 3互信息 4延伸阅读 第7章 贾里尼克和现代语言处理 1早年生活 2 从水门事件到莫妮卡·莱文斯基 3一位老人的奇迹 第八章 简单 ...

最新文章

  1. 机器学习流程模板及多模型对比实战梳理
  2. mysql 开发进阶篇系列 10 锁问题 (使用“索引或间隙锁”的锁冲突)
  3. java代码示例(6-3)
  4. BTrace简介及使用
  5. Node.js 部署免费/自动续订 HTTPS
  6. Oracle数据库的备份
  7. 友讯(d-link)dwa-525 150m无线台式计算机网卡,D-Link新款台式机无线网卡即将上市
  8. flink整合java,Flink使用SideOutPut替换Split实现分流
  9. day32 java的多线程(2)
  10. springboot mysql事物_springboot如何开启数据库事务
  11. 【Vue】—props属性
  12. 30个专业的电子商务网站,助您一臂之力
  13. 华硕固件Linux-arm,AC86UASUS固件交叉编译的问题
  14. 《界面风格设计说明书》
  15. 实验报告三 密码破解技术
  16. php validate,jQuery Validate | 菜鸟教程
  17. python中tuple的意思_pythontuple什么意思
  18. cenos 解决Kernel panic – not syncing: Attempted to kill init
  19. Java多线程开发的实际应用场景
  20. 网络视频监控系统的现状和发展

热门文章

  1. 这些 AI 大咖的实践干货,从事人工智能的你应该知道
  2. 热度直逼TensorFlow的深度学习框架,我用它画下女朋友最美的脸
  3. Hadoop生态组件-HIVE学习
  4. 独家 | 降维是数据科学家的必由之路
  5. 编程界称霸全球的10大算法,你到底了解几个呢?
  6. 收藏 | 12个ggplot2拓展程序助你强化R可视化
  7. 半世纪全球顶级学者迁移图(附视频、亿级学术信息)| 数据院科技大数据研究中心发布
  8. 剑指offer: 二进制中1的个数 python 实现
  9. 2022最新!基于深度transformer的时间序列异常检测模型
  10. 一文梳理视觉Transformer架构进展:与CNN相比,ViT赢在哪儿?