相对熵的凸性证明

相对熵的定义式:D(p∣∣q)=∑x∈Xp(x)log⁡2p(x)q(x)D(p||q) = \sum_{x\in X} p(x)\log_2^{\cfrac {p(x)}{q(x)}}D(p∣∣q)=x∈X∑​p(x)log2q(x)p(x)​​
欲证明相对熵是下凸函数即证明不等式D(λp1(x)+(1−λp2(x))∣∣λq1(x)+(1−λq2(x)))≤λD(p1(x)∣∣q1(x))+(1−λ)D(p2(x)∣∣q2(x))D(\lambda p_1(x)+(1-\lambda p_2(x))||\lambda q_1(x)+(1-\lambda q_2(x))) \le \lambda D(p_1(x)||q_1(x))+(1- \lambda)D(p_2(x)||q_2(x))D(λp1​(x)+(1−λp2​(x))∣∣λq1​(x)+(1−λq2​(x)))≤λD(p1​(x)∣∣q1​(x))+(1−λ)D(p2​(x)∣∣q2​(x))成立
对不等式左项使用对数和不等式
D(λp1(x)+(1−λp2(x))∣∣λq1(x)+(1−λq2(x)))=∑x∈X((λp1(x)+(1−λp2(x)))log⁡2(λp1(x)+(1−λp2(x))(λq1(x)+(1−λq2(x))D(\lambda p_1(x)+(1-\lambda p_2(x))||\lambda q_1(x)+(1-\lambda q_2(x))) = \sum_{x \in X}((\lambda p_1(x)+(1-\lambda p_2(x)))\log_2^{\cfrac {(\lambda p_1(x)+(1-\lambda p_2(x))}{(\lambda q_1(x)+(1-\lambda q_2(x))}}D(λp1​(x)+(1−λp2​(x))∣∣λq1​(x)+(1−λq2​(x)))=x∈X∑​((λp1​(x)+(1−λp2​(x)))log2(λq1​(x)+(1−λq2​(x))(λp1​(x)+(1−λp2​(x))​​
把这里面的λp1(x)+(1−λp2(x))\lambda p_1(x)+(1-\lambda p_2(x)) λp1​(x)+(1−λp2​(x))看作同一 概率矢量的累加和则可以使用对数和不等式
((λp1(x)+(1−λp2(x)))log⁡2(λp1(x)+(1−λp2(x))(λq1(x)+(1−λq2(x))≤λp1(x)log2λp1(x)λq1(x)+(1−λ)p2(x)log2(1−λ)p2(x)(1−λ)q2(x)((\lambda p_1(x)+(1-\lambda p_2(x)))\log_2^{\cfrac {(\lambda p_1(x)+(1-\lambda p_2(x))}{(\lambda q_1(x)+(1-\lambda q_2(x))}} \le \lambda p_1(x)log_2^{\cfrac {\lambda p_1(x)}{\lambda q_1(x)}}+(1-\lambda)p_2(x)log_2^{\cfrac {(1-\lambda)p_2(x)}{(1-\lambda)q_2(x)}}((λp1​(x)+(1−λp2​(x)))log2(λq1​(x)+(1−λq2​(x))(λp1​(x)+(1−λp2​(x))​​≤λp1​(x)log2λq1​(x)λp1​(x)​​+(1−λ)p2​(x)log2(1−λ)q2​(x)(1−λ)p2​(x)​​
对不等式两边求和则得到∑x∈X((λp1(x)+(1−λp2(x)))log⁡2(λp1(x)+(1−λp2(x))(λq1(x)+(1−λq2(x))≤∑x∈Xλp1(x)log2λp1(x)λq1(x)+∑x∈X(1−λ)p2(x)log2(1−λ)p2(x)(1−λ)q2(x)\sum_{x\in X} ((\lambda p_1(x)+(1-\lambda p_2(x)))\log_2^{\cfrac {(\lambda p_1(x)+(1-\lambda p_2(x))}{(\lambda q_1(x)+(1-\lambda q_2(x))}} \le \sum_{x\in X} \lambda p_1(x)log_2^{\cfrac {\lambda p_1(x)}{\lambda q_1(x)}}+\sum_{x\in X}(1-\lambda)p_2(x)log_2^{\cfrac {(1-\lambda)p_2(x)}{(1-\lambda)q_2(x)}} x∈X∑​((λp1​(x)+(1−λp2​(x)))log2(λq1​(x)+(1−λq2​(x))(λp1​(x)+(1−λp2​(x))​​≤x∈X∑​λp1​(x)log2λq1​(x)λp1​(x)​​+x∈X∑​(1−λ)p2​(x)log2(1−λ)q2​(x)(1−λ)p2​(x)​​
即D(λp1(x)+(1−λp2(x))∣∣λq1(x)+(1−λq2(x)))≤λD(p1(x)∣∣q1(x))+(1−λ)D(p2(x)∣∣q2(x))D(\lambda p_1(x)+(1-\lambda p_2(x))||\lambda q_1(x)+(1-\lambda q_2(x))) \le \lambda D(p_1(x)||q_1(x))+(1- \lambda)D(p_2(x)||q_2(x))D(λp1​(x)+(1−λp2​(x))∣∣λq1​(x)+(1−λq2​(x)))≤λD(p1​(x)∣∣q1​(x))+(1−λ)D(p2​(x)∣∣q2​(x))成立

信息论相对熵的凸性证明相关推荐

  1. 关于信息论中熵、相对熵、条件熵、互信息、典型集的一些思考

    1. 绪论 0x1:信息论与其他学科之间的关系 信息论在统计物理(热力学).计算机科学(科尔莫戈罗夫复杂度或算法复杂度).统计推断(奥卡姆剃刀,最简洁的解释最佳)以及概率和统计(关于最优化假设检验与估 ...

  2. 关于信息论中熵、相对熵、、条件熵、互信息、典型集的一些思考

    1. 绪论 0x1:信息论与其他学科之间的关系 信息论在统计物理(热力学).计算机科学(科尔莫戈罗夫复杂度或算法复杂度).统计推断(奥卡姆剃刀,最简洁的解释最佳)以及概率和统计(关于最优化假设检验与估 ...

  3. 深度学习数学基础-概率与信息论

    前言 概率论学科定义 概率与信息论在人工智能领域的应用 3.1,为什么要使用概率论 3.2,随机变量 3.3,概率分布 3.3.1,离散型变量和概率质量函数 3.3.2,连续型变量和概率密度分布函数 ...

  4. 中科大凸优化P345678 Chapter2Conve Set

    Chapter1 Introduction Chapter2 Convex Set P3&P4 1.特例:仿射集Affine Sets 给定两点(向量),确定一条直线贯穿两个点 $ \vec{ ...

  5. (最优化理论与方法)第二章最优化所需基础知识-第七节:保凸的运算和共轭函数

    文章目录 一:保凸的运算 (1)非负加权和 (2)与仿射函数的复合 (3)逐点取最大值 (4)逐点取上界 (5)与标量函数复合 (6)与向量函数复合 (7)取下确界 (6)透视函数 二:共轭函数 (1 ...

  6. 考研上交823上岸东南蒙纳什心得

    目录 1 一志愿情况 1.1 失利原因1:缩招 1.2 失利原因2:专业课投入太多 2 调剂上岸东大 2.1 心态管理 2.2 东大招生福利 2.3 为什么选择东南?(复读不如东蒙!!) 1 一志愿情 ...

  7. 区块链:密码学与安全技术

    工程领域从来没有黑科技:密码学不仅是工程. 密码学为核心的安全技术在信息科技领域的重要性无需多言.离开现代密码学和信息安全技术,人类社会将无法全面步入信息时代.区块链和分布式账本中大量使用了密码学和安 ...

  8. 交叉熵以及通过Python实现softmax_交叉熵(tensorflow验证)

    文章目录 交叉熵(Cross Entropy) 信息论 相对熵 交叉熵 机器学习中的交叉熵 为什么要用交叉熵做损失函数? 分类问题中的交叉熵 softmax softmax_cross_entropy ...

  9. 墨妈的教学笔记之《数据压缩》之一—绪论(数据压缩的可行性及思路)

    解决数据压缩的问题通常可以从三步来分析:第一步是为什么要做,即数据压缩的必要性问题:第二步是为什么可以做,即分析信源数据的特性,并在此基础上进行数据压缩的可行性分析:第三步是在第二步分析的基础上,如何 ...

  10. UA MATH636 信息论5 信道编码定理的证明

    UA MATH636 信息论5 信道编码定理的证明 Random Coding Scheme 平均错误率 最大错误率 逆命题的证明 信道编码定理说的是所有小于 CCC的传输率是可实现的.这里的 CCC ...

最新文章

  1. html输入框颜色属性,css 修改input输入框属性
  2. MobileSpace-关于我的激情的故事
  3. 理解 e.clientX,e.clientY e.pageX
  4. c语言实力,排序算法(更新ing)(C语言实现)(认真的不像实力派)
  5. 51单片机数码管滚动显示学号_51单片机四位数码管4个LED灯4个按键实现多种功能?...
  6. 如何更优雅的写for循环
  7. 【图像去噪】基于matlab小波变换+Contourlet变换+PCA图像去噪【含Matlab源码 610期】
  8. 30分钟学会正则表达式
  9. 扫地机器人作文说明文提纲_扫地机器人说明文500字
  10. jeDate实现日期联动
  11. java pdf 富文本_Java生成pdf,兼富文本
  12. 捋一捋Python的文件处理(上)
  13. 智能电视 = Android + 高清大屏幕 ?
  14. 【报告分享】2020年天猫零食市场分析报告-魔镜(附下载)
  15. 初识网络原理——网络原理的基本概念
  16. C语言_断言函数assert
  17. Centos7安装Python
  18. 往事如烟 - 高手老胡
  19. Nuendo学习之旅——没声音怎么办
  20. Linux 下 ss 命令使用示例

热门文章

  1. excel转word_excel怎么转word?常用方法合集,看你使用哪一种
  2. Python爬虫实战之爬取链家广州房价_02把小爬虫变大
  3. 基于QT和DCMTK的Dicom 图像浏览器---收尾
  4. 蓝牙音频中Classic Audio和LEAudio对比和区别
  5. mw150um 驱动程序win10_win10系统版水星mw150us无线网卡驱动
  6. 字号大小对应表(字号换算磅值)
  7. 基于Ricequant时间序列模型预测股价
  8. 用K-Means和DBSCAN算法对西瓜数据集4.0进行聚类分析
  9. 【福利】小米手机修改MAC地址教程
  10. 如何获取论文的参考文献格式