网上写得实在是太乱,整理下:

交叉熵函数:
H(p,q)=Ep[−logq]=−∑x∈χp(x)logq(x)①H(p,q)=E_p[-log\ q]=-\sum_{x\in \chi}p(x)log\ q(x)①H(p,q)=Ep​[−log q]=−x∈χ∑​p(x)log q(x)①
xxx是某个类别
χ\chiχ是所有的类别的集合

H(p,q)=H(p)+DKL(p∣∣q)H(p,q)=H(p)+D_{KL}(p||q)H(p,q)=H(p)+DKL​(p∣∣q)

DKL(p∣∣q)D_{KL}(p||q)DKL​(p∣∣q)是KL散度,注意,在概念上:
DKL(p∣∣q)D_{KL}(p||q)DKL​(p∣∣q) ≠ DKL(q∣∣p)D_{KL}(q||p)DKL​(q∣∣p)

其中
DKL(p∣∣q)=∑x∈χp(x)⋅logp(x)q(x)D_{KL}(p||q)=\sum_{x\in \chi}p(x)·log\frac{p(x)}{q(x)}DKL​(p∣∣q)=x∈χ∑​p(x)⋅logq(x)p(x)​

交叉熵损失函数:
L(w)=1N∑n=1NH(pn,qn)L(w)=\frac{1}{N}\sum_{n=1}^NH(p_n,q_n)L(w)=N1​n=1∑N​H(pn​,qn​)
=−1N∑n=1N[pnlogqn+(1−pn)log(1−qn)]②=-\frac{1}{N}\sum_{n=1}^N[p_nlog\ q_n+(1-p_n)log(1-q_n)]②=−N1​n=1∑N​[pn​log qn​+(1−pn​)log(1−qn​)]②
这里我们稍微停一下,似乎发现①和②的形式不太一样???
注意②是特指二分类的形式。

qn=11+e−w⋅xnq_n=\frac{1}{1+e^{-w·x_n}}qn​=1+e−w⋅xn​1​
www指的是该隐藏单元的输入权重,
xnx_nxn​指的是与隐藏单元链接的输入值
从定义可以看到,交叉熵损失函数的值总是小于1的。

其中,
pnp_npn​为真实分布,
qnq_nqn​为非真实分布.

这里的NNN指的是NNN条数据,而不是NNN分类,上述公式是针对二分类的。

参考链接:
https://www.cnblogs.com/ljy2013/p/6432269.html#commentform

交叉熵(cross entropy)概念整理相关推荐

  1. 平均符号熵的计算公式_交叉熵(Cross Entropy)从原理到代码解读

    交叉熵(Cross Entropy)是Shannon(香浓)信息论中的一个概念,在深度学习领域中解决分类问题时常用它作为损失函数. 原理部分:要想搞懂交叉熵需要先清楚一些概念,顺序如下:==1.自信息 ...

  2. 机器学习中交叉熵cross entropy是什么,怎么计算?

    项目背景:人体动作识别(分类),CNN或者RNN网络,softmax分类输出,输出为one-hot型标签. loss可以理解为预测输出pred与实际输出Y之间的差距,其中pred和Y均为one-hot ...

  3. 【Pytorch神经网络理论篇】 21 信息熵与互信息:联合熵+条件熵+交叉熵+相对熵/KL散度/信息散度+JS散度

    1 信息熵 熵 (Entropy),信息熵:常被用来作为一个系统的信息含量的量化指标,从而可以进一步用来作为系统方程优化的目标或者参数选择的判据. 1.1 信息熵的性质 单调性,发生概率越高的事件,其 ...

  4. 相对熵与交叉熵_详解机器学习中的熵、条件熵、相对熵、交叉熵

    目录 信息熵 条件熵 相对熵 交叉熵 总结 一  信息熵 (information entropy) 熵 (entropy) 这一词最初来源于热力学.1948年,克劳德·爱尔伍德·香农将热力学中的熵引 ...

  5. 联合熵、条件熵、互信息、相对熵、交叉熵的详解

    本篇博客,我们将介绍联合熵.条件熵.互信息.相对熵.交叉熵,如果对熵的概念还有不清楚的朋友,可以看一下这一篇博客,信息熵是什么呢? https://blog.csdn.net/ding_program ...

  6. 解释机器学习中的熵、联合熵、条件熵、相对熵和交叉熵

    原文地址:https://www.cnblogs.com/kyrieng/p/8694705.html 1.信息熵 (information entropy) 熵 (entropy) 这一词最初来源于 ...

  7. python3 23.keras使用交叉熵代价函数进行MNIST数据集简单分类 学习笔记

    文章目录 前言 一.交叉熵代价函数简介 二.交叉熵代价函数使用 前言 计算机视觉系列之学习笔记主要是本人进行学习人工智能(计算机视觉方向)的代码整理.本系列所有代码是用python3编写,在平台Ana ...

  8. 详解机器学习中的熵、条件熵、相对熵、交叉熵

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 目录 信息熵 条件熵 相对熵 交叉熵 总结 一 信息熵 (info ...

  9. 熵,信息熵,香农熵,微分熵,交叉熵,相对熵

    2019-07-13 https://blog.csdn.net/landstream/article/details/82383503 https://blog.csdn.net/pipisorry ...

最新文章

  1. iOS WKWebView带进度条封装(只用传入url,可改变进度条颜色)
  2. PTA 基础编程题目集 7-19 支票面额 C语言
  3. 使用基于注解的mybatis时,利用反射和注解生成sql语句
  4. centos图形界面的开启和关闭
  5. 设计模式:解释器模式(Interpreter)
  6. java sentence_Java Sentence類代碼示例
  7. IO多路转接模型----(select的模型,select的优缺点,poll的模型,poll的优缺点)
  8. 微型计算机原理risc,微型计算机原理习题及解答-20210409003329.docx-原创力文档
  9. xrdpdf卡片在哪可下载_暑假学习英语字母,就是这样简单(附可打印字母卡下载)...
  10. mac 下基于firebreath 开发多浏览器支持的浏览器插件
  11. 哥哥被我打哭了的飞鸽传书
  12. python解压打开文件过多_让Python在后台自动解压各种压缩文件!
  13. Linux Shell脚本入门教程系列之(十三)Shell分支语句case … esac教程
  14. 安装完MySQL后启动报错_MySQL数据库之mysql编译安装完成后,启动时报错The server quit without updating PID file...
  15. 全新UI多用户任务悬赏系统源码+带三级分销推广
  16. C++实现模板方法模式--问卷调查实战
  17. matlabsvd提取特征值_MATLAB中的SVD函数
  18. iOS 上的 WebSocket 框架 Starscream
  19. CSS特效二:按钮动画效果
  20. shell编程——select语句

热门文章

  1. [leetcode] 根据String数组构造TreeNode,用于LeetCode树结构相关的测试用例
  2. 微信小程序中this指向作用域问题this.setData is not a function报错
  3. python3编程教学_Python3 网络编程
  4. JQuery对象与DOM对象
  5. java实现多级菜单(java递归)方法一
  6. 看看差距--完备技术面试
  7. Ruby. Vs . Python
  8. 其他平台上测试工具的使用
  9. word日常排版(页眉和页脚)
  10. 《Swift开发实战》——导读