数学基础:概率论乘法法则
两个事件相互独立:P(A∩B) = P(A)×P(B)
· 意思是事件A和事件B同时发生的概率 = 事件A发生的概率 × 事件B发生的概率
· · 举个栗子:掷两枚硬币硬币同时立着的概率 = 掷一枚硬币立着的概率 × 再掷一枚
· · 硬币立着的概率。
两个事件非独立:P(A∩B) = P(A)×P(B|A) = P(B)×P(A|B)
· 意思是事件A和事件B同时发生的概率 = 事件A发生的概率 × 在事件A发生的概率下事
· 件B发生的概率 = 事件B发生的概率 × 在事件B发生的概率下事件A发生的概率。

熵的概念

熵的非形式化概念

随机事件的不确定性,在密码学中将不确定性予以量化,并用熵来表示其不确定性的程度,值越大,不确定性越高,值为0时,为确定性事件。
熵是所包含的未知信息量。(某个事件的未知信息量越大,其不确定性就越大,对应的其熵值就越大)

熵的形式化概念

设事件X有x1、x2、x3、… 、xn共n中可能的结果,称为“自信息量”,记为I(xi)
I(xi)=−log⁡2P(xi)(发生的概率P越大信息量I就会越小)I(x_i)=-\log_2P(x_i)(发生的概率 P 越大信息量 I 就会越小) I(xi​)=−log2​P(xi​)(发生的概率P越大信息量I就会越小)
自信息量的 数学期望1就是事件X的熵,记作H(X)H(X)H(X)公式为:
H(X)=∑i=1n[P(xi)×I(xi)]=−∑i=1n[P(xi)×log⁡2P(xi)]H(X) = \sum_{i=1}^n[P(x_i)×I(x_i)]= -\sum_{i=1}^n[P(x_i)×\log_2P(x_i)] H(X)=i=1∑n​[P(xi​)×I(xi​)]=−i=1∑n​[P(xi​)×log2​P(xi​)]
如果结果x1 ··· xn的发生概率相等,则I(xi)I(x_i)I(xi​)的 数学期望1也就是H(X)的关系为
H(X)=I(xi)H(X) = I(x_i)H(X)=I(xi​)
因此熵就是各个事件信息量的平均值。

熵 联合熵 条件熵

:0≤H(X)=−∑i=1n[P(xi)log⁡2P(xi)]≤log⁡2n0\leq H(X)=-\sum_{i=1}^n[P(x_i)\log_2P(x_i)]\leq \log_2n0≤H(X)=−∑i=1n​[P(xi​)log2​P(xi​)]≤log2​n

联合熵
假设X和Y是 相互独立 的两个事件,X和Y同时出现的事件xiyj有 i×j 种结果,则XY同时出现的熵值为:
H(X,Y)=−∑i=1n∑j=1mP(xi,yj)log⁡2P(xi,yi)H(X,Y)=-\sum_{i=1}^n \sum_{j=1}^mP(x_i,y_j)\log_2P(x_i,y_i)H(X,Y)=−i=1∑n​j=1∑m​P(xi​,yj​)log2​P(xi​,yi​)

条件熵
事件Y发生的条件下,事件X的熵值
H(X∣Y)−∑i=1n∑j=1mP(xi,yj)log⁡2P(xi∣yi)H(X|Y)-\sum_{i=1}^n \sum_{j=1}^mP(x_i,y_j)\log_2P(x_i|y_i)H(X∣Y)−i=1∑n​j=1∑m​P(xi​,yj​)log2​P(xi​∣yi​)

p(xi,yj)p(x_i,y_j)p(xi​,yj​)表示 xi,yj 结果同时发生的概率
p(xi∣yj)p(x_i | y_j)p(xi​∣yj​)表示 xi 在 yj 发生的情况下发生的概率

假设X和Y是 不独立 的两个事件,X和Y同时出现的事件xiyj也会有 i×j 种结果,则XY同时出现的熵值为,
定理:H(X,Y)=H(X)+H(Y∣X)H(X,Y)=H(X)+H(Y|X)H(X,Y)=H(X)+H(Y∣X) (X,Y)不独立
推论

  • H(X,Y)≤H(Y)+H(X∣Y)H(X,Y)\leq H(Y)+H(X|Y)H(X,Y)≤H(Y)+H(X∣Y) (当X,Y独立时等号成立)
  • H(X∣Y)≤H(X)H(X|Y)\leq H(X)H(X∣Y)≤H(X) (当X,Y独立时等号成立)

平均互信息

度量两个事件之间的相关性,用I(X;Y)I(X;Y)I(X;Y)表示

由图可知其有以下几条性质:

  • I ( X ; Y ) = I ( Y ; X )
  • I ( X ; Y ) ≥\geq≥ 0 (当X,Y相互独立时为0)
  • I ( X ; Y ) ≤\leq≤ H(X)或者≤\leq≤ H(Y) (仅当X与Y相同时等号成立)
  • I(X;Y)=H(X)-H(X|Y)
  • I(X;Y)=H(Y)-H(Y|X)
  • I(X;Y)=H(X)+H(Y)-H(Y∪X)

本篇仅说明了,熵的概念,以及熵的一些性质,和平均互信息的性质。之后会介绍熵这个概念应用于密码学的信息理论之中,在信息论中,命名为信息熵。用于抽象出密码学的本质,并以形式化的方式予以描述。


  1. 数学期望:实验中每个可能出现的结果的概率乘以其结果的信息量。结果发生的概率越大,其信息量则越小。
    · 举个栗子:如果一个事件出现的所有结果都是等概率的,所以每个结果的信息量都相同,所以
    · 此事件的数学期望就等于其任意一个结果的信息量。(这里不明白没关系,记住公式就行) ↩︎ ↩︎

信息安全—密码学信息熵信息理论基础—熵的概念(熵、联合熵、条件熵、平均互信息)相关推荐

  1. kl距离 java_信息量、熵、最大熵、联合熵、条件熵、相对熵、互信息。

    一直就对机器学习中各种XX熵的概念比较模糊,现在总结一下自己的学习心得. 信息量 先说一下信息量的概念,其实熵就是信息量的集合. 摘抄个例子: 英文有26个字母,假设每个字母出现的概率是一样的,每个字 ...

  2. 详解熵、最大熵、联合熵和条件熵、相对熵以及互信息之间的关系

    信息量的定义 某事件发生的概率小,则该事件的信息量大. 定义随机变量 X X X的概率分布为P(X)" role="presentation" style="p ...

  3. 信息论复习笔记(1):信息熵、条件熵,联合熵,互信息、交叉熵,相对熵

    文章目录 1.1 信息和信息的测量 1.1.1 什么是信息 1.1.1 信息怎么表示 1.2 信息熵 1.3 条件熵和联合熵 The Chain Rule (Relationship between ...

  4. 直观理解信息论概念(条件熵,联合熵,互信息,条件互信息)

    1.概括图 其中:A=I(x;y|z),B=I(x;z|y),C=I(y;z|x),D=I(x;y;z) 这里不难看出以下几点结论. 一.在某个条件下,意味着已知这部分条件的信息,在计算条件熵(熵即不 ...

  5. 关于信息论中熵、相对熵、条件熵、互信息、典型集的一些思考

    1. 绪论 0x1:信息论与其他学科之间的关系 信息论在统计物理(热力学).计算机科学(科尔莫戈罗夫复杂度或算法复杂度).统计推断(奥卡姆剃刀,最简洁的解释最佳)以及概率和统计(关于最优化假设检验与估 ...

  6. 关于信息论中熵、相对熵、、条件熵、互信息、典型集的一些思考

    1. 绪论 0x1:信息论与其他学科之间的关系 信息论在统计物理(热力学).计算机科学(科尔莫戈罗夫复杂度或算法复杂度).统计推断(奥卡姆剃刀,最简洁的解释最佳)以及概率和统计(关于最优化假设检验与估 ...

  7. 【Pytorch神经网络理论篇】 21 信息熵与互信息:联合熵+条件熵+交叉熵+相对熵/KL散度/信息散度+JS散度

    1 信息熵 熵 (Entropy),信息熵:常被用来作为一个系统的信息含量的量化指标,从而可以进一步用来作为系统方程优化的目标或者参数选择的判据. 1.1 信息熵的性质 单调性,发生概率越高的事件,其 ...

  8. 信息熵、相对熵(KL散度)、交叉熵、条件熵、互信息、联合熵

    信息熵 信息量和信息熵的概念最早是出现在通信理论中的,其概念最早是由信息论鼻祖香农在其经典著作<A Mathematical Theory of Communication>中提出的.如今 ...

  9. 信息量-log2P(莫斯编码使用频繁P大的字符编码段信息量少)、信息熵:期望E=-Plog2P、两点分布交叉熵=KL散度=相对熵=-plnp-(1-p)ln(1-p)不对称、JS散度对称

    信息熵为什么要定义成-Σp*log§? 信息熵为什么要定义成-Σp*log(p)? 在解释信息熵之前,需要先来说说什么是信息量. 信息量是对信息的度量,单位一般用bit. 信息论之父克劳德·艾尔伍德· ...

最新文章

  1. Cloudera Manager 4.6 安装部署hadoop CDH集群
  2. LeetCode 1852. 每个子数组的数字种类数(滑窗)
  3. flutter在2019年会有怎样的表现?
  4. 掌门教育微服务体系 Solar(下)
  5. 【视频格式】webm用什么播放
  6. 服务器装win10 稳定吗,重装win10选32位还是64位?原来这么大区别,难怪感觉电脑不好使!...
  7. 三星note10 android11,【极光ROM】-【三星NOTE10/NOTE10+/5G N97XX-9825】-【V11.0 Android-R-UCD】...
  8. 汉语数字转换成阿拉伯数字
  9. java string rt_【Java常用类之String类18】
  10. 软件测试提交bug意思,软件测试bug定义及分类
  11. 【机器学习】阿里云天池竞赛——工业蒸汽量预测(1)
  12. ce逆向修改——植物大战僵尸针对“阳光值”
  13. Linux编程技术总结
  14. 现货黄金每天的开盘和收盘时间是几点
  15. 【PDF】白纸白字,白色字体,文字太浅看不清?
  16. 渗透项目(五):W1R3S
  17. Mann-whitney 检验算法学习
  18. DSOD: Learning Deeply Supervised Object Detectors from Scratch论文理解
  19. 统计分析建模与人工智能建模
  20. dot pairs 点_物理学院王雪华教授研究团队在量子纠缠光源研究上取得重大进展...

热门文章

  1. 【CUDA 基础】3.4 避免分支分化
  2. 2018-3-25至2018-8-9的日语笔记
  3. 机器学习苹果识别——python+opencv实现物体特征提取
  4. 数据分析基础——基本运算
  5. 教程:GIMP中怎样移动选区
  6. opencv如何把一个矩阵不同列分离开_【opencv基础】OpenCV从Mat中提取某些行或列
  7. 鸿蒙系统功能,华为HarmonyOS2.0系统功能都有哪些呢-华为鸿蒙系统HarmonyOS2.0功能介绍[图文]_咖绿茵手游站...
  8. uboot启动流程详解
  9. 海思hi3716c机顶盒接usb摄像头和usb无线耳机时,无线耳机有时没有声音
  10. 基桩静荷载测试数据分析软件,静荷载基桩检测原理及应用技术