平安银行网申部分题

  • 1 前言
  • 2 笔试题
    • 2.1 混淆矩阵是什么,准确率、精准率、召回率的定义
    • 2.2 交叉熵是什么,在二分类问题中为什么引入交叉熵作为Loss function而不是直接优化准确率
    • 2.3 Early Stopping是什么
  • 参考

1 前言

最近有同学参加了平安银行在线笔试的题目,记录一下做一波~

2 笔试题

2.1 混淆矩阵是什么,准确率、精准率、召回率的定义

在分类问题中,会有混淆矩阵的概念。具体的可以参见之前的3篇博客:

  • 机器学习 | 混淆矩阵和两类错误的关系
  • 机器学习 | 评价指标
  • 分类问题 | 评价指标

截图见下:

评价指标解释见下图:

2.2 交叉熵是什么,在二分类问题中为什么引入交叉熵作为Loss function而不是直接优化准确率

首先回答什么是交叉熵。

上面公式的p和q是什么呢?在机器学习中,往往用p(x) 用来描述真实分布,q(x) 用来描述模型预测的分布。

为什么有这个公式呢?什么是熵呢?具体概念总结起来有下面几个:

1、 信息熵

定义:信息熵是消除不确定性所需信息量的度量。

公式:

具体的细节可以参见:https://blog.csdn.net/huwenxing0801/article/details/82791879#commentBox 有点太细了。

2、 相对熵(KL散度)

公式:

即相对熵可以用来衡量两个分布的差异

3、 交叉熵

公式:

4、上述三个熵之间的关系

相对熵 = 交叉熵 - 信息熵,具体推导见下图:

由于信息熵描述的是消除 p (即真实分布) 的不确定性所需信息量的度量,所以其值应该是最小的、固定的。那么:优化减小相对熵也就是优化交叉熵,所以在机器学习中使用交叉熵就可以了。

5、问题:为什么要引入交叉熵作为损失函数,而不是均方误差 作为损失函数?

首先,分类问题中,引入交叉熵作为损失函数的形式为:

问题来了,为什么要使用上面这个损失函数的形式而不是均方误差?

这个问题再往前推一步就是,为什么我们要有损失函数呢?目的是将其作为目标函数,然后不断地优化(减小)我们的目标函数,也就是让我们预测的越来越准!那如何去优化呢?可以看到公式中我们能改变的就是预测值!而预测值又与我们的权重和常数项有关,所以现在重点来了:我们需要不断调整权重w和常数项b,然后让我们的损失函数不断地减小!而这个过程就被称为梯度下降法

那我们下面分别来看下交叉熵损失函数和平方损失函数实现梯度下降的过程!

数据和原始公式准备:

梯度下降过程:

  • L为交叉熵损失函数L2时:

  • L为平方损失函数L1时:

    上述两者的区别在哪呢?

  • 可以看到L1时公式中有激活函数(这里我们认为是sigmoid函数)的导数,在x越大或越小的时候导数为0,学习速度太慢了,几乎不更新了。

  • L2的时候则不涉及sigmoid激活函数的导数问题,不存在上述问题!

  • 上述两点也就是为什么使用交叉熵而不是均方误差作为损失函数的原因!

关于为什么sigmoid导数在x越大或越小的时候为0,可以参见下图:左边是sigmoid函数,右边是其导数图像!

2.3 Early Stopping是什么

首先要回答的问题就是:什么是Early Stopping?为什么要进行Early Stopping?啥时候stop呢?也就是when?

为了获得性能良好的神经网络,网络定型过程中需要进行许多关于所用设置(超参数)的决策。超参数之一是定型周期(epoch)的数量:亦即应当完整遍历数据集多少次(一次为一个epoch)?

  • 如果epoch数量太少,网络有可能发生欠拟合(即对于定型数据的学习不够充分);
  • 如果epoch数量太多,则有可能发生过拟合(即网络对定型数据中的“噪声”而非信号拟合)。

早停法(Early Stopping)旨在解决epoch数量需要手动设置的问题。它也可以被视为一种能够避免网络发生过拟合的正则化方法(与L1/L2权重衰减和丢弃法类似)。

为什么不能一直训练下去呢?而非要提前停止?因为一直训练下去测试集上的准确率会下降!为什么会下降?可能有两个原因:

  • 过拟合
  • 学习率过大导致不收敛

注:关于过拟合的原因,定义,解决办法,详情见:面试 | vivo机器学习提前批面试题

ok,现在知道了什么是Early Stopping以及为啥要进行,那什么时候停止呢?

一般的做法是,在训练的过程中,记录到目前为止最好的验证集精度,当连续10次Epoch(或者更多次)没达到最佳精度时,则可以认为精度不再提高了

参考

  • https://blog.csdn.net/huwenxing0801/article/details/82791879#commentBox
  • early stopping 比较学术的文章:https://www.datalearner.com/blog/1051537860479157
  • 简书:https://www.jianshu.com/p/9ab695d91459

笔试 | 平安银行笔试题相关推荐

  1. mysql笔试_mysql笔试题

    user表 u_id u_name 1 王大拿 2 张二爷 3 冯三炮 fund表 f_id f_name 1001 P2P 1002 创新基金 1003 境内保险 1004 境外保险 grades表 ...

  2. 【SHEIN】校招前端岗位笔试题

    刚结束SHEIN的线上前端岗位笔试,笔试题还热乎着~ SHEIN的线上笔试是在牛客网进行的,分为两Part:选择题和问答题 SHEIN简介 SHEIN是一家成立于2008年的快时尚出口跨境电商互联网公 ...

  3. 平安外包软件测试面试题,中国平安银行软件测试笔试题 .doc

    中国平安银行软件测试笔试题 .doc 中国平安银行软件测试笔试题 导语:下面小编为你整理为了中国平安银行关于软件 测试笔试试题,欢迎阅读! 中国平安银行关于软件测试笔试试题(一) 下面是一平安银行的软 ...

  4. 大华测试笔试题_互联网校招非技术岗的这三类笔试题目你都清楚了吗?

    截至7月1日,已有10+名企开启了秋招提前批:字节跳动.京东.虎牙.浪潮.vivo.京东方.英特尔.中信证券.大华股份.正略咨询.海尔等. 根据往年经验,秋招提前批其中以互联网企业为主,提前批的开启往 ...

  5. 【笔试题】京东2017秋招笔试真题

    笔试题 京东2017秋招笔试真题 1.进制均值 时间限制 C/C++语言 1000MS;其他语言 3000MS 内存限制 C/C++语言 65536KB;其他语言 589824KB 题目描述 尽管是一 ...

  6. java笔试题_Java面试才到笔试就没有然后了?快来签收,高频笔试57题及解答

    前言 很多人面试之前,可能没有在互联网公司工作过或者说工作过但年头较短,不知道互联网公司技术面试都会问哪些问题? 再加上可能自己准备也不充分,去面试没几个回合就被面试官几个问题打蒙了,甚至笔试都过不了 ...

  7. python 笔试题 英方_4000字转型数据分析师笔试面试经验分享

    大家好,我是戴师兄~ 在上一篇文章中我分享了快速自学数据分析的经验. 本篇文章,我将跟大家分享下我的笔试和面试心得. 开头先说说我转型前的职业背景: 想看笔试面试经验的同学萌可以直接跳过这一段~ 20 ...

  8. java面向对象笔试_Java面向对象笔试题.doc

    Java面向对象笔试题 <Java面向对象>内部测试-笔试试卷 1.下列对Java中的继承描述错误的说法是(). 子类至少有一个基类 子类可作为另一个子类的基类 子类可以通过this关键字 ...

  9. 名企笔试:京东 2016 算法工程师笔试题(登楼梯)

    名企笔试:京东 2016 算法工程师笔试题(登楼梯) 2017-02-04 算法爱好者 有一段楼梯台阶有 15 级台阶,以小明的脚力一步最多只能跨 3 级,请问小明登上这段楼梯,有多少种不同的走法? ...

  10. 嵌入式Linux开发笔试,嵌入式Linux工程师笔试题

    一. 填空题: 1. 一些Linux命令,显示文件,拷贝,删除 Ls cp rm 2. do--while和while--do有什么区别? 3. Linux系统下.ko文件是什么文件?.so文件是什么 ...

最新文章

  1. 计算机视觉与深度学习 | 基于多源传感器数据融合的动态场景SLAM研究
  2. 举例详解PHP归并排序的实现
  3. Struts2中ActionContext介绍
  4. springboot并发上传文件_springboot实现单文件和多文件上传
  5. oracle还原 ora 39111,在server2008上进行impdp引发的(ORA-39070)的问题
  6. python --while 练习3
  7. 虚拟法庭、云端判案...法律行业背后的智能技术革新
  8. Wherehows项目简介
  9. 银行联行号cnasp查询(二)
  10. 简单好用的js 压缩工具
  11. Javascript构建Bingo卡片游戏
  12. android webview 本地视频播放,Android中webview html5 自动播放本地视频
  13. 有趣的数字(C++)
  14. 腾讯资深架构师干货总结:一文读懂大型分布式系统设计的方方面面
  15. 鼠标悬停下划线显示特效,html鼠标悬停显示下划线
  16. STM32 | C语言对寄存器的封装
  17. Python使用bokeh制作条形图分类对比
  18. FTP主动和被动模式区别
  19. Doris-查询(三)
  20. 【C语言数组题】字符串去重

热门文章

  1. 编译原理(第3版) 清华大学出版社 黄贤英等人著作 部分课后习题答案
  2. 一种基于复制粘贴的cam350邮票孔拼版教程(一)
  3. ARFoundation系列讲解 - 62 人脸跟踪三
  4. Win10下安装Intel Visual Fortran2019具体步骤及初始调试过程。
  5. rpcbind服务说明及关闭
  6. Elasticsearch学习--elasticsearch介绍与安装
  7. 电赛练习之旋转倒立摆
  8. 《软件评测师教程》读书心得 一
  9. C语言之父辞世引发“分号”悼念
  10. OpenGL编程指南 示例笔记(2)--独立地移动光源