--- 
做了这么长时间的基于深度学习的NLP,愈发可以感受到bayesian的意思,语言模型里面一切皆是分布,问题答案都是分布,一个问题模拟出来的是一个答案的分布;
我觉得我做的最好的一个聊天模型,就是先将问题表示成一个100维的高斯分布,然后计算各个答案跟这个分布的契合概率,当然这个模型肯定不能放出来,但是这种思想可以延伸出去,也希望有兴趣的朋友跟我探讨探讨,jy2641@columbia.edu.
---
0: 原则上,loss函数都应该选convex函数,convex函数的定义就是函数上方得点是一个convex集合
1:  之前使用的0-1的数据预测正负样本,loss函数选用的是cross entropy loss,
实际上这里的0-1 cross entropy和seq2seq的softmax cross entropy都是使用的log函数算的loss,
但是最近看到有人说,在seq2seq里面使用MSE, mean square error比softmax cross entropy要好很多,
遂作下图,可以观察比较一下各个不同的loss函数;
下面是对于分类里面的三种常见的loss的比较,函数形式是
x: predicted - true value的绝对值
log_loss = -np.log(1- x + 1e-12)
mse = x*x
abs_loss = x
我的感觉是,类别非常多,或者越不能准确预测某一类的值的时候,不要用log loss
2: 对于刚刚做的问答匹配采用正样本和负样本之间的cosine差值的loss;
loss = max(0, 0.2 - cosine(question, true answer) + cosine(question, negative answer)) 
之所以有效,可能是为了防止模型过多关注那些泾渭分明的case,而不去关注那些true answer 和 negative answer很模糊的case;

转载于:https://www.cnblogs.com/LarryGates/p/6561493.html

关于rnn神经网络的loss函数的一些思考相关推荐

  1. 银行股价预测——基于pytorch框架RNN神经网络

    银行股价预测--基于pytorch框架RNN神经网络 任务目标 数据来源 完整代码 流程分析 1.导包 2.读入数据并做预处理 3.构建单隐藏层Rnn模型 4.设计超参数,训练模型 5.加载模型,绘图 ...

  2. tensorflow学习(4.loss函数以及正则化的使用 )

    本文还是以MNIST的CNN分析为例 loss函数一般有MSE均方差函数.交叉熵损失函数,说明见 https://blog.csdn.net/John_xyz/article/details/6121 ...

  3. Keras自定义Loss函数

    Keras作为一个深度学习库,非常适合新手.在做神经网络时,它自带了许多常用的目标函数,优化方法等等,基本能满足新手学习时的一些需求.具体包含目标函数和优化方法.但它也支持用户自定义目标函数,下边介绍 ...

  4. 深度学习中的损失函数总结以及Center Loss函数笔记

    北京 上海巡回站 | NVIDIA DLI深度学习培训 2018年1月26/1月12日 NVIDIA 深度学习学院 带你快速进入火热的DL领域 阅读全文                        ...

  5. 《深度学习笔记》——loss函数的学习笔记

    1 loss的作用 在南溪看来,loss函数是对目标target和预测prediction之间的一种距离度量的公式: 2 loss函数的设计原则 此设计原则参考了距离的定义,(注意:距离跟范数是两个概 ...

  6. tensorflow分类的loss函数_Tensorflow Keras的loss函数总结

    一.二分类与多分类交叉熵损失函数的理解 交叉熵是分类任务中的常用损失函数,在不同的分类任务情况下,交叉熵形式上有很大的差别, 二分类任务交叉熵损失函数: 多分类任务交叉熵损失函数: 这两个交叉熵损失函 ...

  7. 一文总结Keras的loss函数和metrics函数

    Loss函数 定义: keras.losses.mean_squared_error(y_true, y_pred) 用法很简单,就是计算均方误差平均值,例如 loss_fn = keras.loss ...

  8. 【文献阅读】医学图像分割中的loss函数选择-Loss odyssey in medical image segmentation loss

    参考文献:Loss odyssey in medical image segmentation loss 函数代码库 github-SegLoss 本文在四个典型的三维分割任务上对20个一般的损失函数 ...

  9. 利用RNN神经网络自动生成唐诗宋词

             RNN(Recurrent Neural Networks)在处理长序列有很强的优势,加上近来前向反馈算法的成功,导致RNN在长文本上得到了很好的应用. 简单来说RNN神经网络能够记 ...

  10. 聊一聊CNN中的感受野、优化函数、激活函数、Loss函数等

    目录: 1.感受野 2.优化函数 3.激活函数 4.loss 函数. 前言 文章有点长,内容有点丰富,基本涵盖整个深度卷积神经网络,涉及 网络中的感受野.激活函数.loss函数以及各种相关知识. Pa ...

最新文章

  1. GitHub也会断供:美国制裁地区帐号都受限,毫无预警,个人页面直接404
  2. android XMl 解析神奇xstream 四: 将复杂的xml文件解析为对象
  3. The method getTextContent() is undefined ?
  4. 安卓进阶系列-06数据库框架(LitePal)的使用
  5. 后台(27)——文件上传
  6. 武大94年暖男型博士入选华为“天才少年”计划,最高年薪201万
  7. 流内容html,为什么,和元素属于html中的流内容?
  8. 【华为云技术分享】Spark如何与深度学习框架协作,处理非结构化数据
  9. php-ews发送邮件,使用php-ews在特定日期之后收到电子邮件(Exchange Web服务)
  10. java 查询sql_Java 中如何使用 SQL 查询文本
  11. Alluxio部署(local模式)
  12. JLU数据结构第六次上机实验解题报告
  13. 最新AxureUX WEB端交互原型通用组件模板库 组件仍然是这套作品的核心内容,这套作品的组件由通用组件、数据录入、数据展示、信息反馈
  14. android webview最新版下载,Android WebView 支持文件下载的几种方式
  15. windows系统无法启用网络发现
  16. Android封装支付宝支付
  17. 找坏球——面试智力题
  18. JAVA工作日历天数(工作日/非工作日)- 基于法定节假日
  19. Spring Data Redis 多源
  20. CSS学习笔记2字体属性和文本属性

热门文章

  1. 足球比赛两强相遇概率
  2. 【机器学习系列】变分推断第三讲:基于随机梯度上升法SGD的变分推断解法
  3. 训练一个简单的游戏AI(Deep Q Network)
  4. 题目1003:A+B 使用大数相加方法解法
  5. 一台电脑安装多个Chrome
  6. php5.6 mongo 扩展,docker php5.6镜像创建,包括常用扩展安装
  7. 最简单的使用nginx实现动静分离
  8. 2 Linux基本命令复习2
  9. Redis 在Golang中使用遇到的坑
  10. NPOI导出EXCEL报_服务器无法在发送 HTTP 标头之后追加标头