来源: AINLPer微信公众号
编辑: ShuYini
校稿: ShuYini
时间: 2019-12-22

引言

    在使用pytorch深度学习框架,计算损失函数的时候经常会遇到这么一个函数:

nn.CrossEntropyLoss()

    该损失函数结合了nn.LogSoftmax()和nn.NLLLoss()两个函数。它在做分类(具体几类)训练的时候是非常有用的。在训练过程中,对于每个类分配权值,可选的参数权值应该是一个1D张量。当你有一个不平衡的训练集时,这是是非常有用的。那么针对这个函数,下面将做详细的介绍。

什么是交叉熵?

交叉熵主要是用来判定实际的输出与期望的输出的接近程度,为什么这么说呢,举个例子:在做分类的训练的时候,如果一个样本属于第K类,那么这个类别所对应的的输出节点的输出值应该为1,而其他节点的输出都为0,即[0,0,1,0,….0,0],这个数组也就是样本的Label,是神经网络最期望的输出结果。也就是说用它来衡量网络的输出与标签的差异,利用这种差异经过反向传播去更新网络参数。

交叉熵原理?

在说交叉熵之前,先说一下

crossentropyloss 输入_Pytorch常用的交叉熵损失函数CrossEntropyLoss()详解相关推荐

  1. 交叉熵损失函数原理详解

    交叉熵损失函数原理详解 之前在代码中经常看见交叉熵损失函数(CrossEntropy Loss),只知道它是分类问题中经常使用的一种损失函数,对于其内部的原理总是模模糊糊,而且一般使用交叉熵作为损失函 ...

  2. 交叉熵损失函数原理详解,KL散度

    https://blog.csdn.net/b1055077005/article/details/100152102 https://blog.csdn.net/tsyccnh/article/de ...

  3. 【Pytorch】交叉熵损失函数 CrossEntropyLoss() 详解

    文章目录 一.损失函数 nn.CrossEntropyLoss() 二.什么是交叉熵 三.Pytorch 中的 CrossEntropyLoss() 函数 参考链接 一.损失函数 nn.CrossEn ...

  4. Pytorch专题实战——交叉熵损失函数(CrossEntropyLoss )

    文章目录 1.用CrossEntropyLoss预测单个目标 2.用CrossEntropyLoss预测多个目标 3.二分类使用BCELoss损失函数 4.多分类使用CrossEntropyLoss损 ...

  5. 【机器学习】 二次损失函数的不足及交叉熵损失softmax详解

    二次代价函数的不足: 以sigmoid激活函数为例,由于初始化是随机的,假设目标值为0,第一次随机初始化使得输入为0.82,那么还可以,多次迭代之后可以收敛到0.09,但如果第一次随机初始化到0.98 ...

  6. 解决pytorch二分类任务交叉熵损失函数CrossEntropyLoss报错:IndexError: Target 1 is out of bounds.

    解决方法 修改nn.CrossEntropyLoss()为nn.BCELoss() 问题解析 pytorch 中二分类任务交叉熵要用二分类交叉熵(Binary Cross Entropy),BCELo ...

  7. 【交叉熵损失函数】关于交叉熵损失函数的一些理解

    目录 0. 前言 1.损失函数(Loss Function) 1.1 损失项 1.2 正则化项 2. 交叉熵损失函数 2.1 softmax 2.2 交叉熵 0. 前言 有段时间没写博客了,前段时间主 ...

  8. 深入理解Pytorch负对数似然函数(torch.nn.NLLLoss)和交叉熵损失函数(torch.nn.CrossEntropyLoss)

    在看Pytorch的交叉熵损失函数torch.nn.CrossEntropyLoss官方文档介绍中,给出的表达式如下.不免有点疑惑为何交叉熵损失的表达式是这个样子的 loss ⁡ ( y , clas ...

  9. 交叉熵损失函数python_交叉熵损失函数nn.CrossEntropyLoss()

    nn.CrossEntropyLoss() 1.引言 在使用pytorch深度学习框架做多分类时,计算损失函数通常会使用交叉熵损失函数nn.CrossEntropyLoss() 2. 信息量和熵 信息 ...

  10. 交叉熵损失函数分类_PyTorch学习笔记——多分类交叉熵损失函数

    理解交叉熵 关于样本集的两个概率分布p和q,设p为真实的分布,比如[1, 0, 0]表示当前样本属于第一类,q为拟合的分布,比如[0.7, 0.2, 0.1]. 按照真实分布p来衡量识别一个样本所需的 ...

最新文章

  1. 团队作业——Alpha冲刺 6/12
  2. JDBC编程的事务处理
  3. 批处理bat中的脚本
  4. 小心Redis漏洞让你服务器沦为肉鸡
  5. java模拟网易邮箱登录_求赐教:网易邮箱Web端模拟登录看信的加密参数_ntes_nnid、_ntes_nuid...
  6. 快速地创建快顶尖的医学图像处理控件ImageGear Medical
  7. 跟一个刚毕业不久的码农聊天后被凡尔赛了
  8. 截取字符串,计算字符串字节大小,选择文件夹,上传文件
  9. Android -- Camera.ShutterCallback
  10. 【车道线检测与寻迹】【1月8日】车辆、道路模型与道路跟踪
  11. 如何进行容器镜像加速?| 深度揭示阿里云 Serverless Kubernetes(3)
  12. CF949D Curfew(贪心)
  13. 全网最好的子网划分方法与例题解析
  14. excel从入门到忘记 学习心得分享(含百度网盘分享)
  15. 目前支持WebGL的浏览器有哪些?
  16. Ubuntu 18.04 无法自动检测耳机解决方法
  17. linux去除pdf页头,删除PDF水印小妙招
  18. 基于ubuntu 20.04与cri-docker 搭建部署高可用k8s 1.25.3
  19. c语言生成随机数猜数字大小,产生一个随机数,进行猜数字小游戏
  20. 14岁萝莉自学编程独立开发游戏

热门文章

  1. 【TSP】基于matlab粒子群算法求解旅行商问题【含Matlab源码 445期】
  2. 【语音加密】基于matlab GUI语音信号加密解密【含Matlab源码 295期】
  3. 【脑电信号】基于matlab HMM睡眠状态检测【含Matlab源码 050期】
  4. ai面向分析_2020年面向企业的顶级人工智能平台
  5. ai策略机器人研究a50_跟上AI研究的策略
  6. AttributeError: module ‘tensorflow‘ has no attribute ‘constant‘
  7. python: 在pycharm打开带有中文字符的文件时,乱码,File was loaded in the wrong encoding: ‘UTF-8‘
  8. 周期T与频率f数量级对应关系(MHz--μs)
  9. pythontab_PythonTab 中文网简介
  10. python学习_Python学习 基础篇完结