经验条件熵公式的推导
李航《统计学习方法》中,P62页公式5.8:
计算特征A对数据集D的经验条件熵:
此处,给出条件熵()的定义:X给定条件下Y的条件概率分布的熵对X的数学期望:
在书中P61页下方给出了各类的定义:
设训练数据集为D,表示样本容量,即样本个数,设有K个类,。为属于类的样本个数,,设特征A有n个不同 的取值{},根据特征A的取值将D划分为n个子集,为的样本个数,,记子集中属于类的样本的集合为,即,为的样本个数。
那么,对于,其变形过程如下:
式中,为按P60页给出的定义:
设是一个取有限个值的离散随机变量,其概率分布为
这说明是数据集按照特征A分类成了类并由此计算其中的第类的概率分布。
对于,它的含义是特征A取值时的条件下,D的条件概率分布的熵。D是整个数据集,在时就是上方所述的P61页给出的定义,所以特征A取值时的条件下D的条件概率分布的熵。
表示由特征A对数据集D划分后形成的子数据集的熵。那么:
,
其中是中属于第k类的概率,即:
最终可得:
因此,经验条件熵的求解步骤:
- 确定特征A;
- 根据特征A对数据集划分获取子集,计算子集的经验熵并求和;
- 对子集分类(此处分类是按类别分,不是按特征分),获取各类对应的集合;
- 由上一步的和计算第类在子集中的概率分布;
- 按公式计算出子集的经验熵;
- 求子集对于数据集的概率分布;
- 步骤2、3中的数据对应相乘后相加。
经验条件熵公式的推导相关推荐
- 视频教程-小白学习课程:梯度下降算法与公式详细推导-深度学习
小白学习课程:梯度下降算法与公式详细推导 国内"双一流"大学博士研究生,计算机专业,研究方向和兴趣包括人工智能,深度学习,计算机视觉,群体智能算法,元胞自动机等,愿意分享自己的技术 ...
- kalman滤波器公式的推导
卡尔曼滤波的使用范围: 该系统要有如下关系: 计算步骤: PART0:INI PART1:Time update 迭代的目标:从X(K-1)+ 求得X(K) + 因此,先有X(K-1)+,已知F,G. ...
- matlab三角函数降次,三角函数降次公式及推导过程
三角函数中的降次幂公式可降低三角函数指数幂.多项式各项的先后按照某一个字母的指数逐渐减少的顺序排列,叫做这一字母的降次.接下来分享三角函数降次公式及推导过程. 三角函数降次公式 sin²α=(1-co ...
- 梯度下降法参数更新公式的推导
梯度下降法参数更新公式的推导 先来回顾一下梯度下降法的参数更新公式: (其中,α是学习速率,是梯度) 这个公式是怎么来的呢?下面进行推导: 首先,如果一个函数 n 阶可导,那么我们可以用多项式仿造一个 ...
- Batch Normalization 反向传播(backpropagation )公式的推导
What does the gradient flowing through batch normalization looks like ? 反向传播梯度下降权值参数更新公式的推导全依赖于复合函数求 ...
- 二维随机变量函数卷积公式的推导
二维随机变量函数卷积公式的推导 @(概率论) 给定Z=g(x,y)Z = g(x,y) 通常需要求FZ(z),fZ(z)F_Z(z),f_Z(z) 这里是由两个变元依据关系映射到一个变元,因此,求得F ...
- 圆锥曲线万能弦长公式_圆锥曲线的弦长公式及其推导过程
<圆锥曲线的弦长公式及其推导过程>由会员分享,可在线阅读,更多相关<圆锥曲线的弦长公式及其推导过程(5页珍藏版)>请在人人文库网上搜索. 1.圆锥曲线的弦长公式及其推导过程关于 ...
- 梅森公式的推导和探究
梅森公式的推导(篇三):梅森公式的推导和探究 写在前: 本篇是<梅森公式的推导>的篇三,我的个人探究部分,尝试了梅森公式的推导和探究.篇一认识信号流图介绍了信号流图的基本概念和简单形式 ...
- 阿贝不变量等三个重要公式的推导
近轴光学系统中物体近似的可以成完善像. 根据上图,单折射球面光路示意图,可知近轴光学系统时,-u,u',i,i' ,h等都非常小. 满足h=lu=l'u': 根据三角形角度关系可知: 下面将开始推导第 ...
- 递推最小二乘法RLS公式详细推导
递推最小二乘法RLS公式详细推导 整理递推最小二乘法推导过程自我整理. 递推最小二乘估计(RLS)作为一种估计方式是在最小二乘法(LS)的基础上发展来的. 最小二乘法可以解决的问题是不需要知道先验的概 ...
最新文章
- PHP读取MySQL数据生成Excel文件实例
- 获取各种常见形状的位图
- 真正完美攻略之星月夜~Seven Tales in Spiral(中国同人文字AVG)
- Android 系统(139)---Android 解压和重新打包system.img
- 特斯拉要用太阳能满足整座岛全年能源需求
- makeObjectsPerformSelector 方法的用法
- 前端开发工程师如何在2013年里提升自己
- java实现gps定位_GPS定位数据的提取与存储系统的设计
- 逻辑程序设计语言Prolog
- 在12306网站上如何可以选择上中下铺
- pano2VR只更换全景图片
- 一个单调递增的数组 被人随机拿出一个数 你怎么找到这个数
- 【机器学习】python实现非线性回归(以中国1960-2014GDP为例)
- 一种基于XGBOOST的企业员工稳定性(员工离职)预测方法
- excel插入图片(利用vba)
- 楚留香服务器维护,【楚留香】4月20日维护公告
- 存款买房python
- 电路分析笔记-电阻电路的等效变换
- 安装AndroidStudio创建模拟器报错“VT-x is disabled in BIOS
- STK入门-学习记录