参考文献:

1)https://zhuanlan.zhihu.com/p/35709485
2)https://jackon.me/posts/why-use-cross-entropy-error-for-loss-function/

一、相关知识

1)熵:即衡量信息不确定性的大小
2)交叉熵:真实标签与预测标签之间的不同(越不同,包含的信息量越大,即熵越大)
3)损失函数:Loss(y_pred,y_ture)

二、交叉熵损失函数

-交叉熵损失函数:作用在softmax函数输出的概率分布向量之上,评估label和predicts之间的差距(熵越小即两者越接近)
计算公式:

  • q——表示预测样本分布
  • p——表示真实样本分布

在具体分类中:

  • y——表示样本的label,正类为1,负类为0
  • p——表示样本预测为正的概率

与相对熵(KL散度)的区别:

  • 相对熵是衡量两个概率分布之间的差异
  • 交叉熵是衡量真实与预测之间的概率分布差异,是相对熵的特殊情况,即其中一个分布(p(x))为已知(也就是熵为0),所以相对熵的后半部分删掉就是交叉熵

三、为什么要用交叉熵损失函数:

利用classification error = count of error items / count of all items来计算,无法更细致地衡量损失。具体例子:
模型一:(其中computed为预测结果,targets为实际结果)

模型二:

两个模型的classification error均为:=1/3=0.33,但显然第二个模型要优于第一个模型
而用交叉熵损失,可以清晰地体现两个模型的优劣:
第一个模型的 ACE ( average cross-entropy error ) 为:−(ln(0.4)+ln(0.4)+ln(0.1))/3=1.38
第二个模型的 ACE 是:−(ln(0.7)+ln(0.7)+ln(0.3))/3=0.64

损失函数 -交叉熵损失函数相关推荐

  1. 【转载】损失函数 - 交叉熵损失函数

    MSE 转载自:损失函数 - MSE[1] 数理统计中均方误差是指参数估计值与参数值之差平方的期望值,记为MSE.MSE是衡量"平均误差"的一种较方便的方法,MSE可以评价数据的变 ...

  2. 损失函数——交叉熵损失函数(CrossEntropy Loss)

    损失函数--交叉熵损失函数(CrossEntropy Loss) 交叉熵函数为在处理分类问题中常用的一种损失函数,其具体公式为: 1.交叉熵损失函数由来 交叉熵是信息论中的一个重要概念,主要用于度量两 ...

  3. 损失函数——交叉熵损失函数

    交叉熵代价函数(Cross-entropy cost function)是用来衡量人工神经网络(ANN)的预测值与实际值的一种方式.与二次代价函数相比,它能更有效地促进ANN的训练.在介绍交叉熵代价函 ...

  4. 损失函数 - 交叉熵损失函数

    Cross Entropy Error Function(交叉熵损失函数) 例子 表达式 函数性质 学习过程 优缺点 这篇文章中,讨论的Cross Entropy损失函数常用于分类问题中,但是为什么它 ...

  5. sigmoid函数求导_交叉熵损失函数的求导(Logistic回归)

    目录 前言 交叉熵损失函数 交叉熵损失函数的求导 前言 最近有遇到些同学找我讨论sigmoid训练多标签或者用在目标检测中的问题,我想写一些他们的东西,想到以前的博客里躺着这篇文章(2015年读研时机 ...

  6. 人脸识别-Loss-2010:Softmax Loss(Softmax激活函数 + “交叉熵损失函数”)【样本3真实标签为c_5,则样本3的损失:loss_3=-log(\hat{y}_5^3)】

    一般一个CNN网络主要包含卷积层,池化层(pooling),全连接层,损失层等. 全连接层:等号左边部分就是全连接层做的事, W W W 是全连接层的参数,我们也称为权值, X X X 是全连接层的输 ...

  7. 【交叉熵损失函数】关于交叉熵损失函数的一些理解

    目录 0. 前言 1.损失函数(Loss Function) 1.1 损失项 1.2 正则化项 2. 交叉熵损失函数 2.1 softmax 2.2 交叉熵 0. 前言 有段时间没写博客了,前段时间主 ...

  8. python交叉熵损失函数实现_Softmax和交叉熵的深度解析和Python实现

    原标题:Softmax和交叉熵的深度解析和Python实现 作者 | PARAS DAHAL 译者 | zzq [导读]如果你稍微了解一点深度学习的知识或者看过深度学习的在线课程,你就一定知道最基础的 ...

  9. 交叉熵损失函数、修正Huber损失、极大似然估计、负对数似然、似然与交叉熵、KL散度

    交叉熵损失函数.修正Huber损失.极大似然估计.负对数似然.似然与交叉熵.KL散度 目录

最新文章

  1. 李飞飞AI100报告第二弹,提出14大AI机遇与挑战,82页pdf
  2. lintcode-102-带环链表
  3. 上海交通大学2006年数学分析考研试题
  4. gRPC编码初探(java)
  5. 单片机为什么一直用C语言,不用其他编程语言?只有学过的知道!
  6. 平面单腿机器人跳跃控制研究——后续内容
  7. 计算机专业务必学好的基本课程
  8. Intellij IDEA 代码格式化配置和快捷键
  9. win10系统Qt配置海康HCSadpSDK局域网设备搜索
  10. http://hi.baidu.com/%BE%C5%CC%EC%C4%A7%CA%DE/blog/item/9b3263626a75ff49ebf8f808.html
  11. 计算机专业要考哪些证书?这5种证书含金量最高,拿到就是高薪
  12. 欧姆龙PLC-小型PLC概述
  13. 求一元二次方程的解法c语言,有什么方法求一元二次方程求解決一元二次方程的解法要详细...
  14. 薅羊毛php源码,基于AutoJs实现的薅羊毛App专业版源码大分享---更新啦
  15. https://mp.weixin.qq.com/s?__biz=MzkxNTIzODIxNQ==tempkey=MTEwOV9qbGlub091aVlKb1NtOVZKV3lTcHgwd3U0NG
  16. 中国NPP净初级生产力数据/植被覆盖空间分布数据分享(2000-2021)
  17. 计算机专业应聘范围,求职面试自我介绍范围
  18. 你要怎样知足,才会有点幸福
  19. Golang后端开发学习之路
  20. CSDN蓝桥杯算法题——题解Java版本——切面条

热门文章

  1. 2023COSP深圳户外展行业高峰论坛即将召开!博洋优选也将参加
  2. oracle中update语句更新字段
  3. 数值计算笔记之非线性方程的求解(一)二分法
  4. Product-based Neural Networks (PNN) - 改进特征交叉的方式
  5. 优质的服务+智能+完美的线路=AI智能语音机器人
  6. 【LSP简史】里氏替换原则表述方式的变化,从学术到「人话」
  7. CFileDialog使用总结
  8. sourcetree的日常使用
  9. 工业软件CAD、CAE、CAM介绍
  10. auto auto const auto auto