感谢原文作者!原文地址:http://eletva.com/tower/?p=186

一、Loss Function

什么是Loss Function?wiki上有一句解释我觉得很到位,引用一下:The loss function quantifies the amount by which the prediction deviates from the actual values。Loss Function中文损失函数,适用于用于统计,经济,机器学习等领域,虽外表形式不一,但其本质作用应是唯一的,即用于衡量最优的策略。本章只从机器学习(ML)领域来对其进行阐述,机器学习其实是个不停的模拟现实的过程,比如无人驾驶车,语音识别,流感预测,天气预报,经济周期行为等众多领域,是互联网发展过程中“科学家”(暂且这么称呼吧)对于人类文明进步的另一个贡献,其本质就是要建立一个数学模型用于模拟现实,越接近真实越好,那么转化为数学语言即LF越小越好,因为LF值代表着现实与学习预测的差距,这个不停的缩小LF值的过程就称为优化,如果理解这些的话,就不难理解优化问题对于ML来说的重要性了,如水之于鱼,魂之于人!

二、几种Loss Function概述

如上一节所述,LF的概念来源于机器学习,同时我们也知道机器学习的应用范围相当广泛,几乎可以涵盖整个社会领域,那么自然不同的领域多少会有不同的做法,这里介绍在一般的机器学习算法中常见的几种,具有概括性。

2.1 一般形式

LF分为两部分:L+R,L表示loss term,其中,y(i)∈{−1,1},w表示学习出来的权重,该公式的作用很明显了,用来收集现实与学习结果的差距,是LF的核心部分,LF的不同大部分也是指的loss term的不同;R表示范式,范式存在的意思是进行约束,以防止优化过偏。

2.2 一般的loss term有5种,分别用于5种常见的机器学习算法

Gold Standard(标准式)于理想sample,这种一般很少有实践场景,这个方法的作用更多的是用来衡量其他LF的效用;Hinge于soft-margin svm算法;log于LR算法(Logistric Regression);squared loss于线性回归(Liner Regression)和Boosting。

1)Gold Standard loss,一般我们称这个LF为L01,从公式中可以看出该公式的主要职责是在统计多少个错误的case,很明显现实数据不允许如此简单的统计方式

从公式我们可以很清楚的看出,当m<0的时候L=1,m<0说明预测失败,那么Loss则加1,这样将错误累加上去,就是Gold Standard loss的核心思想。

2)hinge loss,常用于“maximum-margin”的算法,公式如下

这个公式也很好理解,其中mi(w)在前面介绍过,表示样本i在模型下的预测值和样本i的类标记{-1,1}的乘积,这个乘积可以用来检验预测与真实结果是否一致来表示分类是否正确,当乘积大于0时表示分类正确,反之亦然。

3) log loss(一般又称为基于最大似然的负log loss)

likelihood=

其中 是log函数

最大似然思想指的是使得某种情况发生的概率最大的思想,根据LR的思想(参考这篇文章logistic回归深入篇(1)),我们知道g(w)对应的simod图,其将实域上的值映射到区间{0,1},因此我们可以把g(w)看作事件A发生的概率,那么1-g(w)可以看作事件A不发生的概率,那么公式likelihood表达的含义就很明显了,y也是一个概率值,可以看做是对事件A与A逆的分量配额,当然我们的期望是A发生的可能越大越好,A逆发生的可能越小越好!因此likelihood是一个max的过程,而loss是一个min的过程,因此log loss是负的likelihood。

4)square loss

这个loss很好理解,就是平方差,loss 一般也成为最小二乘法

5)boosting loss

这个loss主要是基于指数函数的loss function。

三、几种Loss Function的效果对比

上图是多LF的效果对比图,其中蓝色的是Gold loss,可以看作水平基线,其他的loss的效果可以基于与它的比较结果,首先,红色的是Hinge loss,黄色的是log loss,绿色的是boosting loss,黑色的是square loss,从上图可以看出以下结论: Hinge,log对于噪音函数不敏感,因为当m<0时,他们的反应不大,而黑线与绿线可能更爱憎分明,尤其是黑线,因此,在很多线性分类问题中,square loss也是很常见的LF之一。

转载于:https://www.cnblogs.com/summerkiki/p/5216852.html

【转】Loss Function View相关推荐

  1. Loss Function view

    [machine learning] Loss Function view Posted on October 24, 2013 有关Loss Function(LF),只想说,终于写了 一.Loss ...

  2. Loss Function总结

    开始比较纠结于Cost/Error Function和Loss Function之间的区别,后来发现它们在数学优化问题上其实是一回事,见这里.因此以下主要以LossFunction进行总结. 一.什么 ...

  3. python如何画损失函数图_Pytorch 的损失函数Loss function使用详解

    1.损失函数 损失函数,又叫目标函数,是编译一个神经网络模型必须的两个要素之一.另一个必不可少的要素是优化器. 损失函数是指用于计算标签值和预测值之间差异的函数,在机器学习过程中,有多种损失函数可供选 ...

  4. 神经网络中,设计loss function有哪些技巧?

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:视学算法 神经网络中,设计loss function有哪 ...

  5. 损失函数(Loss Function) -1

    http://www.ics.uci.edu/~dramanan/teaching/ics273a_winter08/lectures/lecture14.pdf Loss Function 损失函数 ...

  6. R语言构建xgboost模型:自定义损失函数(目标函数、loss function、object function)、评估函数(evaluation function)

    R语言构建xgboost模型:自定义损失函数(目标函数.loss function.object function).评估函数(evaluation function) 目录

  7. R语言构建xgboost模型使用早停法训练模型(early stopping):自定义损失函数(目标函数,loss function)、评估函数(evaluation function)

    R语言构建xgboost模型使用早停法训练模型(early stopping):自定义损失函数(目标函数.loss function.object function).评估函数(evaluation ...

  8. pytorch loss function 总结

    pytorch loss function 总结 参考原文:https://blog.csdn.net/zhangxb35/article/details/72464152?utm_source=it ...

  9. Person Re-Identification by Multi-Channel Parts-Based CNN with Improved Triplet Loss Function

    作者:西安交大的De Cheng, Yihong Gong, Sanping Zhou, Jinjun Wang, Nanning Zheng 主要贡献: 贡献有两个,一个是改进的网络结构,一个是改进 ...

最新文章

  1. linux单 网卡添加多个网段的ip,[转载]linux 单网卡来绑定多IP实现多网段访问以及多网卡绑定单IP实现附载均...
  2. IPv6推进将非常漫长
  3. vb 导出整数 科学计数法_可整数组的计数
  4. python ini
  5. python教程-Python2 教程
  6. cpu顶盖怎么看步进_拆解报告|360AI音箱,深度硬件解析,带你看懂360智能音箱内部...
  7. java collection_【基础篇】java-Collection集合-List和Set
  8. 软件测试方法--黑盒测试、白盒测试
  9. (附源码)ssm小米购物网站 毕业设计 261624
  10. select完还没释放可以执行其他sql语句吗
  11. 安卓桌面软件_Windows启动器v8.34安卓用上win桌面
  12. CAN通信稳定性开发分析
  13. 通过ping检测网络故障的典型次序
  14. Android 获得手机ip
  15. 浮云绘图2.0 开发手册 支持状态图、拓扑图、电路图等源码开发
  16. ctfshow摆烂杯
  17. 计算机等级证打字每分钟多少字才算合格?
  18. Java 从数据库中查找信息导入Excel表格中
  19. JAVA季度处理工具类
  20. tcpdump命令使用总结

热门文章

  1. android各个版本市场占有率(2013年3月)
  2. 官方数据:程序员年纪越大越出色、越稀有
  3. SubSonic:一个对象的引用是必需的对于非静态字段
  4. QA:Visual C# 2008 compiler could not be created.
  5. 以视频爬取实例讲解Python爬虫神器Beautiful Soup用法
  6. java 比较器类_高级编程之(Java常用类(Java比较器))
  7. 蓝桥杯 ADV-81 算法提高 数的运算
  8. android 应用搬家 分区,把安装在SD卡的应用存在DATA分区的数据移到SD卡上
  9. 常用docker命令,及一些坑
  10. Oracle客户端安装以及PL/SQL Developer安装方法