1.带核的SVM为什么能分类非线性问题?  
  核函数的本质是两个函数的內积,而这个函数在SVM中可以表示成对于输入值的高维映射。注意核并不是直接对应映射,核只不过是一个內积

2.常用核函数及核函数的条件:  
  核函数选择的时候应该从线性核开始,而且在特征很多的情况下没有必要选择高斯核,应该从简单到难的选择模型。我们通常说的核函数指的是正定和函数,其充要条件是对于任意的x属于X,要求K对应的Gram矩阵要是半正定矩阵。
RBF核径向基,这类函数取值依赖于特定点间的距离,所以拉普拉斯核其实也是径向基核。
线性核:主要用于线性可分的情况
多项式核

3.Boosting和Bagging
(1)随机森林 
  随机森林改变了决策树容易过拟合的问题,这主要是由两个操作所优化的:
  1)Boostrap从袋内有放回的抽取样本值
  2)每次随机抽取一定数量的特征(通常为sqr(n))。 
  分类问题:采用Bagging投票的方式选择类别频次最高的

  回归问题:直接取每颗树结果的平均值。

(2)Boosting之AdaBoost 
  Boosting的本质实际上是一个加法模型,通过改变训练样本权重学习多个分类器并进行一些线性组合。而Adaboost就是加法模型+指数损失函数+前项分布算法。Adaboost就是从弱分类器出发反复训练,在其中不断调整数据权重或者是概率分布,同时提高前一轮被弱分类器误分的样本的权值。最后用分类器进行投票表决(但是分类器的重要性不同)。 
(3)Boosting之GBDT 
  将基分类器变成二叉树,回归用二叉回归树,分类用二叉分类树。和上面的Adaboost相比,回归树的损失函数为平方损失,同样可以用指数损失函数定义分类问题。但是对于一般损失函数怎么计算呢?GBDT(梯度提升决策树)是为了解决一般损失函数的优化问题,方法是用损失函数的负梯度在当前模型的值来模拟回归问题中残差的近似值。 
  注:由于GBDT很容易出现过拟合的问题,所以推荐的GBDT深度不要超过6,而随机森林可以在15以上。 
(4)Xgboost 
这个工具主要有以下几个特点:
支持线性分类器
可以自定义损失函数,并且可以用二阶偏导
加入了正则化项:叶节点数、每个叶节点输出score的L2-norm
支持特征抽样
在一定情况下支持并行,只有在建树的阶段才会用到,每个节点可以并行的寻找分裂特征。

4.逻辑回归相关问题
(1)公式推导一定要会
(2)逻辑回归的基本概念 
  这个最好从广义线性模型的角度分析,逻辑回归是假设y服从Bernoulli分布。
(3)L1-norm和L2-norm 
  其实稀疏的根本还是在于L0-norm也就是直接统计参数不为0的个数作为规则项,但实际上却不好执行于是引入了L1-norm;而L1norm本质上是假设参数先验是服从Laplace分布的,而L2-norm是假设参数先验为Gaussian分布,我们在网上看到的通常用图像来解答这个问题的原理就在这。 
  但是L1-norm的求解比较困难,可以用坐标轴下降法或是最小角回归法求解。
(4)LR和SVM对比 
  首先,LR和SVM最大的区别在于损失函数的选择,LR的损失函数为Log损失(或者说是逻辑损失都可以)、而SVM的损失函数为hinge loss

  其次,两者都是线性模型。 
  最后,SVM只考虑支持向量(也就是和分类相关的少数点) 
(5)LR和随机森林区别 
  随机森林等树算法都是非线性的,而LR是线性的。LR更侧重全局优化,而树模型主要是局部的优化。 
(6)常用的优化方法 
  逻辑回归本身是可以用公式求解的,但是因为需要求逆的复杂度太高,所以才引入了梯度下降算法。 
  一阶方法:梯度下降、随机梯度下降、mini 随机梯度下降降法。随机梯度下降不但速度上比原始梯度下降要快,局部最优化问题时可以一定程度上抑制局部最优解的发生。 
  二阶方法:牛顿法、拟牛顿法: 
  这里详细说一下牛顿法的基本原理和牛顿法的应用方式。牛顿法其实就是通过切线与x轴的交点不断更新切线的位置,直到达到曲线与x轴的交点得到方程解。在实际应用中我们因为常常要求解凸优化问题,也就是要求解函数一阶导数为0的位置,而牛顿法恰好可以给这种问题提供解决方法。实际应用中牛顿法首先选择一个点作为起始点,并进行一次二阶泰勒展开得到导数为0的点进行一个更新,直到达到要求,这时牛顿法也就成了二阶求解问题,比一阶方法更快。我们常常看到的x通常为一个多维向量,这也就引出了Hessian矩阵的概念(就是x的二阶导数矩阵)。缺点:牛顿法是定长迭代,没有步长因子,所以不能保证函数值稳定的下降,严重时甚至会失败。还有就是牛顿法要求函数一定是二阶可导的。而且计算Hessian矩阵的逆复杂度很大。 
拟牛顿法: 不用二阶偏导而是构造出Hessian矩阵的近似正定对称矩阵的方法称为拟牛顿法。拟牛顿法的思路就是用一个特别的表达形式来模拟Hessian矩阵或者是他的逆使得表达式满足拟牛顿条件。主要有DFP法(逼近Hession的逆)、BFGS(直接逼近Hession矩阵)、 L-BFGS(可以减少BFGS所需的存储空间)。

机器学习和深度学习面试题相关推荐

  1. 机器学习与深度学习常见面试题(上)

    本文及其它机器学习.深度学习算法的全面系统讲解可以阅读<机器学习与应用>,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造,自2019年1月出版以来已重印3次. 书的购买链接 书的勘 ...

  2. 机器学习和深度学习资料汇总【02】

    <Image Scaling using Deep Convolutional Neural Networks> 介绍:使用卷积神经网络的图像缩放. <Proceedings of ...

  3. 【总目录】人工智能、机器学习、深度学习总结大全----目录.未完待续...

    文章目录 @[toc] 一.Python 二.爬虫 三.Mysql 四.MongoDB 五.Numpy 六.Scipy 七.Pandas 八.其他常用工具 九.可视化工具Matplotlib 十.数理 ...

  4. GitHub上AI岗位面试笔记(机器学习算法/深度学习/ NLP/计算机视觉)

    目录 机器学习 深度学习 自然语言处理与数学 算法题和笔试题 推荐阅读 工具 最近在GitHub上淘到一个很棒的AI算法面试笔记,特地分享给小伙伴们~ GitHub地址:https://github. ...

  5. 人工智能、机器学习、深度学习从入门到进阶学习资料整理

    最近整理了下在这里分享给大家,欢迎大家点赞收藏. 学习社区 神力AI(MANA):国内最大的AI代码平台. Learn AI:一个AI学习交流中心. AI研习社:一个专注于AI开发者和学术青年求知求职 ...

  6. 机器学习、深度学习、神经网络学习资料集合(开发必备)

    最近整理了下AI方面的学习资料,包含了学习社区.入门教程.汲取学习.深度学习.自然语言处理.计算机视觉.数据分析.面试和书籍等方面的知识.在这里分享给大家,欢迎大家点赞收藏. 学习社区 神力AI(MA ...

  7. 人工智能、机器学习、深度学习学习资料整理(开发必备)

    最近整理了下AI方面的学习资料,包含了学习社区.入门教程.汲取学习.深度学习.自然语言处理.计算机视觉.数据分析.面试和书籍等方面的知识.在这里分享给大家,欢迎大家点赞收藏. 学习社区 神力AI(MA ...

  8. Github深度学习面试题答案

    Github深度学习面试题答案(一)-- 深度学习相关 本文是对于github上一篇关于无人驾驶的深度学习方面提问的 ''部分个人见解+论坛内外对该问题的解答'' 本文属于搬运+整合的笔记贴,主要是为 ...

  9. 深度学习 autoencoder_面试宝典之深度学习面试题(下)

    点击上方"Python全家桶","星标"或"置顶" 关键时刻,第一时间送达 今天已经是三月十一号,金三银四的金三已经过了三分之一,不知道大家 ...

最新文章

  1. Enum类的非一般用法汇总(工作中遇到时持续更新)
  2. Jzoj3625 旅行(travel)
  3. 2.0 自动梯度 - PyTorch学习笔记
  4. 粤桂协作消费对接活动 农业大健康·李喜贵:功能性农业合作研究
  5. python函数包_python-函数包和模块
  6. 【常用】数学符号及读法大全
  7. 俄罗斯方块 Tetris
  8. 三千多天之前我没有编辑完的技术文档
  9. MyEclipse连接MySQL
  10. java 自定义注解_Java注解
  11. SQLite允许向一个integer型字段中插入字符串
  12. Matplotlib 基本用法
  13. IDEA用maven创建springMVC项目和配置(XML配置和Java配置)
  14. Android 开发 | ImageView 与 ImageButton
  15. java实现归并排序
  16. WIN7开机欢迎界面后黑屏
  17. APP开发流程都有哪些?
  18. 利用浏览器制作一款包含3D效果的演示文案
  19. 大赞!像 Github 一样管理你的 Word 文档
  20. 软考中级-结构化开发

热门文章

  1. 字符串 数组 字符串数组 php,php字符串转数组的简单示例(支持中文)
  2. Sencha SDK 工具之 Slicer 简介
  3. 护士服务规范与礼仪PPT模板
  4. 一路狂奔的硅谷钢铁侠,终于露出脆弱与疲倦,压力焦虑直播吸大麻
  5. Verycd上.net一些教程,自己留着做备忘..
  6. CAN通讯-使用Python收发CAN数据保姆级教程(包含完整代码)
  7. matlab旧版比新版好用,MATLAB新版本及新功能介绍matlab2012b.PDF
  8. 全国计算机一级选择题免费,全国计算机一级考试选择题试题与详细答案(免费).doc...
  9. linux系统 、Docker(简单了解)
  10. 中小企业选择ERP注意事项