本文是问题“那些深度学习《面试》你可能需要知道的”的回答,答案均以英文版Deep Learning页标标记.

1.列举常见的一些范数及其应用场景,如L0,L1,L2,L∞,Frobenius范数

答:p39-p40 ;还有p230-p236有regularization的应用

2.简单介绍一下贝叶斯概率与频率派概率,以及在统计中对于真实参数的假设。

答:p55

3.概率密度的万能近似器

答:p67:3.10上面那一段

4.简单介绍一下sigmoid,relu,softplus,tanh,RBF及其应用场景

答:sigmoid和softplus在p67页;全部的在p193-p197

5.Jacobian,Hessian矩阵及其在深度学习中的重要性

答:p86-p92

6.KL散度在信息论中度量的是那个直观量

答:p74

7.数值计算中的计算上溢与下溢问题,如softmax中的处理方式

答:p80-p81

8.与矩阵的特征值相关联的条件数(病态条件)指什么,与梯度爆炸与梯度弥散的关系

答:p82;p290

9.在基于梯度的优化问题中,如何判断一个梯度为0的零界点为局部极大值/全局极小值还是鞍点,Hessian矩阵的条件数与梯度下降法的关系

答:p86-p92

10.KTT方法与约束优化问题,活跃约束的定义

答:p93-p95

11.模型容量,表示容量,有效容量,最优容量概念

答:p111;p113;p114;p115

12.正则化中的权重衰减与加入先验知识在某些条件下的等价性

答:p119;p138

13.高斯分布的广泛应用的缘由

答:p63-p64

14.最大似然估计中最小化KL散度与最小化分布之间的交叉熵的关系

答:p132

15.在线性回归问题,具有高斯先验权重的MAP贝叶斯推断与权重衰减的关系,与正则化的关系

答:p138-p139

16.稀疏表示,低维表示,独立表示

答:p147

17.列举一些无法基于地图(梯度?)的优化来最小化的代价函数及其具有的特点

答:p155 最顶一段

18.在深度神经网络中,引入了隐藏层,放弃了训练问题的凸性,其意义何在

答:p191-192

19.函数在某个区间的饱和与平滑性对基于梯度的学习的影响

答:p160

20.梯度爆炸的一些解决办法

答:p302

21.MLP的万能近似性质

答:p198

22.在前馈网络中,深度与宽度的关系及表示能力的差异

答:p200-p201

23.为什么交叉熵损失可以提高具有sigmoid和softmax输出的模型的性能,而使用均方误差损失则会存在很多问题。分段线性隐藏层代替sigmoid的利弊

答:p226;p226

24.表示学习的发展的初衷?并介绍其典型例子:自编码器

答:p3-p4;p4

25.在做正则化过程中,为什么只对权重做正则惩罚,而不对偏置做权重惩罚

答:p230

26.在深度学习神经网络中,所有的层中考虑使用相同的权重衰减的利弊

答:p230

27.正则化过程中,权重衰减与Hessian矩阵中特征值的一些关系,以及与梯度弥散,梯度爆炸的关系

答:p231-234

28.L1/L2正则化与高斯先验/对数先验的MAP贝叶斯推断的关系

答:p234-p237

29.什么是欠约束,为什么大多数的正则化可以使欠约束下的欠定问题在迭代过程中收敛

答:p239

30.为什么考虑在模型训练时对输入(隐藏单元/权重)添加方差较小的噪声,与正则化的关系

答:p240-p243

31.共享参数的概念及在深度学习中的广泛影响

答:p245;p253

32.Dropout与Bagging集成方法的关系,以及Dropout带来的意义与其强大的原因

答:p258-p268

33.批量梯度下降法更新过程中,批量的大小与各种更新的稳定性关系

答:p279

34.如何避免深度学习中的病态,鞍点,梯度爆炸,梯度弥散

答:p282-p293

35.SGD以及学习率的选择方法,带动量的SGD对于Hessian矩阵病态条件及随机梯度方差的影响

答:p294;p296-p300

36.初始化权重过程中,权重大小在各种网络结构中的影响,以及一些初始化的方法;偏置的初始化

答:初始化权重:p301-p305;偏置初始化:p305-p306

37.自适应学习率算法:AdaGrad,RMSProp,Adam等算法的做法

答:AdaGrad:p307; RMSProp:p307-p308; Adam:p308-p309

38.二阶近似方法:牛顿法,共轭梯度,BFGS等的做法

答:牛顿法:p310-p313; 共轭梯度:p313-p316; BFGS:p316-p317

39.Hessian的标准化对于高阶优化算法的意义

答:p318-p321

40.卷积网络中的平移等变性的原因,常见的一些卷积形式

答:平移等变性:p338-p339;常见的一些卷积形式:p347-p358

41.pooling的做法的意义

答:p342-p347

42.循环神经网络常见的一些依赖循环关系,常见的一些输入输出,以及对应的应用场景

答:p378-p395

43.seq2seq,gru,lstm等相关的原理

答:seq2seq:p396-p397; gru:p411-p412; lstm:p408-p411

44.采样在深度学习中的意义

答:p469-p471

45.自编码器与线性因子模型,PCA,ICA等的关系

答:自编码器与线性因子模型:p489-p490;PCA:p490-p491;ICA:p491-p493

46.自编码器在深度学习中的意义,以及一些常见的变形与应用

答:意义:p502-p503; 常见变形:p503-p508;p509-p512; p521-p524应用:p515-p520;p524-p525

47.受限玻尔兹曼机广泛应用的原因

答:p460:想特别了解的人注意这句话: See Mohamed et al. (2012b) for an analysis of reasons for the success of these models.

48.稳定分布与马尔可夫链

答:p595-p598

49.Gibbs采样的原理

答:p599

50.配分函数通常难以计算的解决方案

答:p605,p606第一段

51.几种参数估计的联系与区别:MLE/MAP/贝叶斯

答:P134-P139

52.半监督的思想以及在深度学习中的应用

答:p541-p546

53.举例CNN中的channel在不同数据源中的含义

答:p360-p362

54.深度学习在NLP,语音,图像等领域的应用及常用的一些模型

答:p452-p485

55.word2vec与glove的比较

56.注意力机制在深度学习的某些场景中为何会被大量使用,其几种不同的情形

答:p475-p476

57.wide&deep模型中的wide和deep介绍

答:https://arxiv.org/pdf/1606.07792.pdf 此问题答案未在书中找到,为此我去找了原论文,论文图1有详细的介绍。 (若有人在书中找到,请批评指正)

58.核回归与RBF网络的关系

答:p142

59.LSTM结构推导,为什么比RNN好?

答:p408-p411

60.过拟合在深度学习中的常见的一些解决方案或结构设计

答:p230-p268;包括:Parameter Norm Penalties( 参数范数惩罚); Dataset Augmentation (数据集增强); Early Stopping(提前终止); Parameter Tying and Parameter Sharing (参数绑定与参数共享); Bagging and Other Ensemble Methods(Bagging 和其他集成方法);Dropout. 另外还有Batch Normalization。

61.怎么理解贝叶斯模型的有效参数数据会根据数据集的规模自动调整

答:关于非参数模型:p115-p116 ;非参数模型不依赖于特定的概率模型,它的参数是无穷维的,数据集的规模的大小影响着模型使用更多或者更少的参数来对其进行建模。(并未在书中找到准确的答案,若有更好的回答,请联系我改正)

本答案是根据问题在Deep Learning上找到的答案;有些答案只是自己读书后在书上做的笔记的具体页面,毕竟原po说还有另外一本书,所以该答案可能不是特别准确也不完善,答案也是给大家做个参考,若发现答案有问题,请联系我并指正,大家共同进步,谢谢!

同时谢谢 @姚凯飞 作出的问题集。

2018年3月19日:本次更新第8题梯度消失和梯度爆炸答案

ktt算法 约化_答:那些深度学习《面试》你可能需要知道的相关推荐

  1. ktt算法 约化_深度学习面试题

    1.列举常见的一些范数及其应用场景,如L0,L1,L2,L∞,Frobenius范数 答:p39-p40 ;还有p230-p236有regularization的应用 2.简单介绍一下贝叶斯概率与频率 ...

  2. ktt算法 约化_推荐系统的多目标优化(4)-PE-LTR

    目录: [toc] 1. 提出背景 电商场景下,需要同时优化GMV和CTR,但这两个优化目标并不是严格相关的,甚至是冲突的.当CTR/GMV最优时,另一个可能是次优甚至是不好的. 因此,该问题可以看作 ...

  3. ktt算法 约化_矩阵特征与特征向量的计算

    矩阵特征与特征向量的计算 第三章第三章 矩阵特征与特征向量的计算矩阵特征与特征向量的计算3.1 引言引言在科学技术的应用领域中,许多问题都归为求解一个特征系统.如动力学系统和结构 系统中的振动问题,求 ...

  4. 医学图像处理医学图像处理-卷积神经网络卷积神经网络_典型的深度学习算法(一):卷积神经网络(CNN)...

    通过上一篇文章,相信大家对深度学习的概念.原理已经有了大致了解,近期企通查将会对深度学习中的几种典型算法进行介绍. 在深度学习领域中,已经验证的典型成熟算法有卷积神经网络(CNN).循环神经网络(RN ...

  5. 基于深度学习的病理_组织病理学的深度学习(第二部分)

    基于深度学习的病理 计算机视觉/深度学习/医学影像 (COMPUTER VISION/ DEEP LEARNING/ MEDICAL IMAGING) In the last part, we sta ...

  6. Interview:算法岗位面试—2019秋招校园招聘—算法工程师【机器学习、深度学习(偏图像)】秋招感悟:初期阶段的傲娇→中期阶段的紧张→后期阶段的蜕变

    ML岗位面试:2019秋招&校园招聘-算法工程师[机器学习.深度学习(偏图像)]秋招感悟:初期阶段的傲娇→中期阶段的紧张→后期阶段的蜕变 Interview:算法岗位面试-2019秋招& ...

  7. 大数据 深度 分页_机器学习、深度学习、大数据 ?傻傻分不清楚?

    提起机器学习四个字,不知你的脑海中是否会有一丝印象?毕竟身处信息时代,在日常生活中,无论通过什么媒介,接触到这个名词概念的机会还是挺大的.与之类似,还有以下这些名词概念:数据分析.数据挖 掘.深度学习 ...

  8. 视频教程-隐马尔科夫算法:中文分词神器-深度学习

    隐马尔科夫算法:中文分词神器 在中国知网从事自然语言处理和知识图谱的开发,并负责带领团队完成项目,对深度学习和机器学习算法有深入研究. 吕强 ¥49.00 立即订阅 扫码下载「CSDN程序员学院APP ...

  9. 深度学习英文缩写_机器学习、深度学习……人工智能那些名词你知道几个?

    原标题:机器学习.深度学习--人工智能那些名词你知道几个? 这一次,小KE带你了解几个火爆的"人工智能"名词儿,这样在撸串炸鸡啤酒时,可以跟小伙伴吹嘘吹嘘,提高提高自己的人格档次. ...

最新文章

  1. 1.NetDh框架之数据库操作层--Dapper简单封装,可支持多库实例、多种数据库类型等(附源码和示例代码)...
  2. 如果CRC等于炒鸡蛋,那么...
  3. Cisco Catalyst交换机密码恢复策略
  4. python线程(二)代码部分Threading模块
  5. 【渝粤题库】陕西师范大学200221 中国思想史 作业(高起专)
  6. codeforces 732/D 二分
  7. html:(28):后代选择器和通用选择器
  8. clocks_per_sec 时间不正确_测血糖的正确做法:这4步一定别搞错了
  9. oracle 10g rac 包root.sh报错,案例:Oracle Rac root.sh报错 Failed to create keys in the OLR
  10. 在Docker上部署NGINX和NGINX Plus
  11. 开源商业模式是万恶之本?
  12. 网络间谍组织 SideCopy 攻击印度政府和军队组织
  13. mac下安装nginx及相关配置
  14. matlab版本和yalmip兼容,科学网—matlab cvx + yalmip - 吴锐的博文
  15. php 银行卡二三四要素验证接口
  16. git 创建邮箱 用户名_初次安装git配置用户名和邮箱及密钥
  17. 一个 pcie 插槽损坏的 h77n-wifi(BIOS添加nvme模块实现pcie启动操作系统)
  18. Java方法--汉字数字转阿拉伯数字
  19. windows 打印机管理机制(任务后台等待机制)
  20. 中秋测试大礼包来了,送一个测试流量app~

热门文章

  1. Mina中的zkApp交易snark
  2. Java进阶之路~适配器设计模式amp;字符串方法
  3. hxxp://www.hao923.com.cn/劫持浏览器
  4. errno ETIMEDOUT npm ERR! network request to https://registry.npmjs.
  5. Android studio 中使用GeenDao
  6. ECCV2020超分辨率方向论文整理笔记
  7. vue报错[wds] disconnected
  8. Obsidian media extended以及bilibili插件链接总是打开外部网页以及退回编辑视图会弹出另外一个相同文件
  9. 使用Telerik控件搭建Doubanfm频道部分
  10. 深入探究知道创宇主动防御体系:云蜜罐因何诞生?