李航《统计学习方法》中,P62页公式5.8:

计算特征A对数据集D的经验条件熵:

此处,给出条件熵()的定义:X给定条件下Y的条件概率分布的熵对X的数学期望:

在书中P61页下方给出了各类的定义:

设训练数据集为D,表示样本容量,即样本个数,设有K个类为属于类的样本个数,,设特征A有n个不同 的取值{},根据特征A的取值将D划分为n个子集的样本个数,,记子集中属于类的样本的集合为,即的样本个数。

那么,对于,其变形过程如下:

式中,为按P60页给出的定义:

是一个取有限个值的离散随机变量,其概率分布

这说明是数据集按照特征A分类成了类并由此计算其中的第类的概率分布

对于,它的含义是特征A取值时的条件下,D的条件概率分布的熵。D是整个数据集,在时就是上方所述的P61页给出的定义,所以特征A取值时的条件下D的条件概率分布的熵

表示由特征A对数据集D划分后形成的子数据集的熵。那么:

,

其中中属于第k类的概率,即:

最终可得:

因此,经验条件熵的求解步骤:

  1. 确定特征A;
  2. 根据特征A对数据集划分获取子集,计算子集的经验熵并求和;
    1. 对子集分类(此处分类是按类别分,不是按特征分),获取各类对应的集合
    2. 由上一步的计算第类在子集中的概率分布
    3. 按公式计算出子集的经验熵;
  3. 求子集对于数据集的概率分布
  4. 步骤2、3中的数据对应相乘后相加。

经验条件熵公式的推导相关推荐

  1. 视频教程-小白学习课程:梯度下降算法与公式详细推导-深度学习

    小白学习课程:梯度下降算法与公式详细推导 国内"双一流"大学博士研究生,计算机专业,研究方向和兴趣包括人工智能,深度学习,计算机视觉,群体智能算法,元胞自动机等,愿意分享自己的技术 ...

  2. kalman滤波器公式的推导

    卡尔曼滤波的使用范围: 该系统要有如下关系: 计算步骤: PART0:INI PART1:Time update 迭代的目标:从X(K-1)+ 求得X(K) + 因此,先有X(K-1)+,已知F,G. ...

  3. matlab三角函数降次,三角函数降次公式及推导过程

    三角函数中的降次幂公式可降低三角函数指数幂.多项式各项的先后按照某一个字母的指数逐渐减少的顺序排列,叫做这一字母的降次.接下来分享三角函数降次公式及推导过程. 三角函数降次公式 sin²α=(1-co ...

  4. 梯度下降法参数更新公式的推导

    梯度下降法参数更新公式的推导 先来回顾一下梯度下降法的参数更新公式: (其中,α是学习速率,是梯度) 这个公式是怎么来的呢?下面进行推导: 首先,如果一个函数 n 阶可导,那么我们可以用多项式仿造一个 ...

  5. Batch Normalization 反向传播(backpropagation )公式的推导

    What does the gradient flowing through batch normalization looks like ? 反向传播梯度下降权值参数更新公式的推导全依赖于复合函数求 ...

  6. 二维随机变量函数卷积公式的推导

    二维随机变量函数卷积公式的推导 @(概率论) 给定Z=g(x,y)Z = g(x,y) 通常需要求FZ(z),fZ(z)F_Z(z),f_Z(z) 这里是由两个变元依据关系映射到一个变元,因此,求得F ...

  7. 圆锥曲线万能弦长公式_圆锥曲线的弦长公式及其推导过程

    <圆锥曲线的弦长公式及其推导过程>由会员分享,可在线阅读,更多相关<圆锥曲线的弦长公式及其推导过程(5页珍藏版)>请在人人文库网上搜索. 1.圆锥曲线的弦长公式及其推导过程关于 ...

  8. 梅森公式的推导和探究

    梅森公式的推导(篇三):梅森公式的推导和探究 写在前:   本篇是<梅森公式的推导>的篇三,我的个人探究部分,尝试了梅森公式的推导和探究.篇一认识信号流图介绍了信号流图的基本概念和简单形式 ...

  9. 阿贝不变量等三个重要公式的推导

    近轴光学系统中物体近似的可以成完善像. 根据上图,单折射球面光路示意图,可知近轴光学系统时,-u,u',i,i' ,h等都非常小. 满足h=lu=l'u': 根据三角形角度关系可知: 下面将开始推导第 ...

  10. 递推最小二乘法RLS公式详细推导

    递推最小二乘法RLS公式详细推导 整理递推最小二乘法推导过程自我整理. 递推最小二乘估计(RLS)作为一种估计方式是在最小二乘法(LS)的基础上发展来的. 最小二乘法可以解决的问题是不需要知道先验的概 ...

最新文章

  1. PHP读取MySQL数据生成Excel文件实例
  2. 获取各种常见形状的位图
  3. 真正完美攻略之星月夜~Seven Tales in Spiral(中国同人文字AVG)
  4. Android 系统(139)---Android 解压和重新打包system.img
  5. 特斯拉要用太阳能满足整座岛全年能源需求
  6. makeObjectsPerformSelector 方法的用法
  7. 前端开发工程师如何在2013年里提升自己
  8. java实现gps定位_GPS定位数据的提取与存储系统的设计
  9. 逻辑程序设计语言Prolog
  10. 在12306网站上如何可以选择上中下铺
  11. pano2VR只更换全景图片
  12. 一个单调递增的数组 被人随机拿出一个数 你怎么找到这个数
  13. 【机器学习】python实现非线性回归(以中国1960-2014GDP为例)
  14. 一种基于XGBOOST的企业员工稳定性(员工离职)预测方法
  15. excel插入图片(利用vba)
  16. 楚留香服务器维护,【楚留香】4月20日维护公告
  17. 存款买房python
  18. 电路分析笔记-电阻电路的等效变换
  19. 安装AndroidStudio创建模拟器报错“VT-x is disabled in BIOS
  20. STK入门-学习记录

热门文章

  1. Construct2太空射击游戏-Debug
  2. 完全平方数的几种判定方法与算法用时
  3. PDF旋转使用的转换器有哪些
  4. 数据结构:自组织线性表
  5. linux上java设置内存,linux 设置java内存
  6. plc中int数据类型范围_AB的PLC中,这些数据类型:INT、DINT、SINT、REAL和BOOL,分别代表什么意思?...
  7. kubuntu 20.04 终端输入中文时乱码
  8. 【379】pandas 说明
  9. 物理防火墙是什么?有什么作用?
  10. ffmpeg - 视频裁剪