机器学习与算法面试太难?

来源:
https://mp.weixin.qq.com/s/GrkCvU2Ia_mEaQmiffLotQ
作者:石晓文

八月参加了一些提前批的面试,包括阿里、百度、头条、贝壳、一点资讯等。整理了一些面试题,分享给大家。

一、机器学习基础题

1、LSTM的公式

2、RNN为什么出现梯度消失及BPTT的推导

3、DQN的基本原理么

4、GBDT和随机森林有什么区别

5、GBDT的原理,如何做分类和回归

6、随机森林的随机体现在哪方面

7、Wide &Deep的原理

8、GBDT+LR是怎么做的?

9、DQN模型为什么要做经验回放

10、数据之间如果不是独立同分布的会怎样

11、AUC的原理介绍一下

12、XGBOOst和GBDT的区别。

13、强化学习和监督学习的区别

14、神经网络里面的损失函数有哪些

15、机器学习中常见的激活函数有哪些?为什么通常需要零均值?

16、DeepFM介绍

17、FM推导

18、boosting和bagging的区别?

19、bagging为什么能减小方差?

20、交叉熵损失函数,0-1分类的交叉熵损失函数的形式。什么是凸函数?0-1分类如果用平方损失为什么用交叉熵而不是平方损失?

21、L1和L2有什么区别,从数学角度解释L2为什么能提升模型的泛化能力。

22、深度学习中,L2和dropout有哪些区别?

23、L1正则化有哪些好处

24、如果有一万个地理坐标,转换成1-10000的数,可以用决策树么?

25、CART分类树和ID3以及C4.5有什么区别?

26、树集成模型有哪几种实现方式:Bagging和Boosting,回答过程中又问到了很多细节。随即森林的随机体现在哪些方面,AdaBoost是如何改变样本权重,GBDT分类树拟合的是什么?

27、Dueling DQN和DQN有什么区别

28、early stop对参数有什么影响?

二、数据结构算法题

1、K个有序数组,找一个长度最小的区间,在这个区间里至少包含每个数组各一个数

2、n个[0,n)的数,求每个数的出现次数(不能开辟额外空间)

3、数组的全排列(空间复杂度O(1))

4、一堆钞票,尽可能均分(利用背包问题的思想)

5、无向无环图中,最短路径的最大值(Floyd算法)

6、层次遍历二叉树

7、字符串的最长公共子序列(动态规划)

8、树的前序遍历和zigzag遍历(非递归)

9、一个数组,所有数组都出现了两次,只有一个数出现了一次,返回这个数(位运算)

10、一个数组,一个数出现了超过一半次数,返回这个数

11、将除法的结果用字符串返回,如果能够除尽,则返回相除的结果,如果不能除尽,则无限循环部分用[]标记。

12、数组排序,假设数组排序后的位次和排序前的位次绝对值差值小于K,有什么比快排好的算法?

13、树中两个节点的第一个的公共祖先。

14、判断是否是回文链表

15、判断两个链表中是否有相同节点

三、实践题

1、如果你想往模型中加入一个特征,如何判定这个特征是否有效?

2、LR和FM的区别?FM需要进行交叉特征的选择么?如果在LR选了一部分特征做交叉之后,取得了比FM更好的效果,这是为什么?如果FM变成DeepFM之后,效果超过了LR,这又是为什么?

3、如果逻辑回归的所有样本的都是正样本, 那么它学出来的超平面是怎样的?

4、哪些场景下的分类问题不适用于交叉熵损失函数?

5、推荐系统中你认为最重要的环节是什么?

6、多臂tiger machine中,有许多方法,比如e-greedy,timponson采样,UCB,这些方法都有哪些适用场景?

7、如何预测一家店分品类的销量

8、信息流采样,有n份数据,但是n的长度并不知道,设计一个采样算法,使得每份被选择的概率是相同的。

9、模型在线下评估和线上使用时,往往出现线上实际效果不如线下效果的情况,请分析可能的原因。

10、在CTR预估问题中,假设训练数据的正负样本数为1:4,测试数据中的正负样本数也为1:4,那么此时模型对测试集,学到的平均点击率为1/(1+4),假设此时采取了欠采样策略,使正负样本数为1:1,对同样的测试集进行预测,平均点击率应该是多少?(样本量很大,初始总样本数为10亿)

转载于:https://www.cnblogs.com/DicksonJYL/p/9596062.html

机器学习与算法面试太难?相关推荐

  1. 算法实现太难了?机器学习也需要开源软件

    作者 | Soren Sonnenburg等 译者 | 刘畅 出品 | AI科技大本营(ID:rgznai100) 导读:开源工具已经趋于成熟,这使其能构建大规模的自然场景下的系统.与此同时,机器学习 ...

  2. 深度学习(机器学习)算法面试(一)

    1.请简要介绍下SVM. SVM,全称是support vector machine,中文名叫支持向量机.SVM是一个面向数据的分类算法,它的目标是为确定一个分类超平面,从而将不同的数据分隔开. 扩展 ...

  3. iOS岗位招聘标准水涨船高,五年iOS程序员表示面试太难了

    人才济济的iOS开发者,你凭什么脱颖而出? 与岗位要求相去甚远,如何挑战极限? 想去心怡公司,如何马到成功? 那么,你的绝招是什么呢? 在这个iOS岗位供不应求的市场,对iOS开发者对要求日益增长,面 ...

  4. 今年做开发面试太难了!面试面到我心态爆炸!

    有个朋友,上个月准备从 Java 转做大数据,一个月过去了,一份面试都没约到,来问我怎么回事. "我一看简历,深度不够,没有实战经验,更重要的是缺乏行业认知" 我们做大数据的,虽说 ...

  5. 【机器学习】算法面试知识点整理(持续更新中~)

    1.监督学习(SupervisedLearning):有类别标签的学习,基于训练样本的输入.输出训练得到最优模型,再使用该模型预测新输入的输出: 代表算法:决策树.朴素贝叶斯.逻辑回归.KNN.SVM ...

  6. 这些算法工程师,他们真的是太难了!

    现在的算法工程师真的是太难了! 要让AI会看人眼都分辨不清的医疗影像 数据又不够,还得用前沿技术 好不容易学会看片,还要让AI会分析病理 赋予AI诊断疾病的使命 然后 几十种模型,N次计算 只给一张显 ...

  7. 清华大一Python作业太难上热榜!只上3节课,手撸AI算法,网友:离本科毕设只差一篇万字论文...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 太难了! ...

  8. 13个月才跑通GitHub模型,机器学习科研入门太难了吧

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 金磊 萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI & ...

  9. 本地缓存需要高时效性怎么办_太难为我了,为了这份P7岗offer,我承受了7轮面试...

    前言 今年的大环境非常差,互联网企业裁员的现象比往年更严重了,可今年刚好是我的第一个"五年计划"截止的时间点,说什么也不能够耽搁了,所以早早准备的跳槽也在疫情好转之后开始进行了.但 ...

最新文章

  1. SAP MM 明明有维护源清单,还是不能下PO?
  2. Linux下/dev/null 21 相关知识说明
  3. 华为HCIE RS都考什么?(含选择及面试题)
  4. 提取pfx证书公钥和私钥
  5. 单片机实现环形队列_稀疏数组和队列(二)
  6. 甲骨文中国裁员已定,补偿为N+6;VMware联手云平台合作伙伴AsiaPac,闪耀狮城;对标英伟达,寒武纪新货曝光……...
  7. 直接在线查看github里的jupyter notebook
  8. perl处理Excel(跨平台)
  9. tarjan 算法模板
  10. apple pay充游戏后退款_iOS退款内幕
  11. 2018私塾在线高级java软件架构师实战培训最新
  12. hadoop权威指南笔记
  13. 算法入门之lowB三人组---冒泡排序、选择排序、插入排序 【python版-详解】
  14. 做程序员,需要学习哪些专业知识?
  15. 整理了46个python人工智能库,详细介绍(含资源),建议收藏
  16. Object.freeze()
  17. IT项目管理 PPT 选择题【太原理工大学】
  18. 重视“互联网+政务服务”改革工作 推进智慧城市建设
  19. 通过rustlings源码了解rust如何从命令行参数里面获取值的方式
  20. ipad好用的思维导图软件有哪些

热门文章

  1. 妙用postman系列——postman建组、分享
  2. docker :open /var/lib/docker/tmp/GetImageBlob318829910: no such file or directory异常解决
  3. Linux 运维常用命令 find、awk、sed、grep、vi、ps、lsof、rpm
  4. 2018 Google kickstart Problem A. Planet Distance
  5. LeetCode简单题之子数组最大平均数 I
  6. JIT Compiler编译器
  7. CVPR 2020目标跟踪多篇开源论文(下)
  8. [JAVAEE] Thymeleaf 基本语法:常用表达式
  9. react控制 input 框回车之后内容清空
  10. grep 使用 nsr 实现查找