点击上方,选择星标置顶,每天给你送干货

阅读大概需要7分钟

跟随小博主,每天进步一丢丢

来自 数据挖掘机养成记

作者 穆文

导读

作为一名新晋菜鸟面试官,最近替部门面了3、40个人(大多来自国内top5学校,包括校招社招),小小总结下我的相人之术,希望能帮上大家

------------硬插入-----------

先插个话,你遇到的面试官,可能是亲切温和的大神,也可能是滔滔不绝掉书袋的教条主义者,你一定要记住

面试是一场双向选择的过程,对方考察你的同时,你也在考察他以及他的团队。当遇到以下情形时,说明你们不合适,不要想太多,换下一个

  • 面试官不问你擅长的领域,而是抓住些边边角角不放,多半是他不懂你做的东西,但又不想在你面前失去威信。甭理他,心里竖个中指然后走人

  • 面试官对着电脑找现成的应试题,然后你做题他干自己事。这种懒人,多半自己肚子也没啥货,做法同上

  • 面试官跟你话不投机,进入尬聊阶段。这种情况请原谅他把,多半是你投错岗位了,以后记得打听清楚岗位需求,再投简历

进入正题

面试别人时,我主要遵循『两原则』和『三方面

『两原则』指:

  • 绝不网上现搜应试题(一不尊重面试者,二这种题大多考察不了真水平),确保所问问题是自己认真思考过的

  • 在自己能力范围内,不停追问面试者所做的项目、所掌握的理论细节,看他掌握到什么程度以及评判简历内容的真实性

『三方面』包括:

  • 理论功底

  • 代码能力

  • 项目能力

----------下面进入废话时间-------

把三方面展开:

【理论功底】主要考察对机器学习模型的理解,会根据面试者的经历选择性提问(如果遇到面试者的研究方向是自己不了解但感兴趣的领域,会很欣喜,趁机学习一个哈哈)这块儿的问题会比较细碎,都是我实际问过的,在此全部手敲

  • 过拟合欠拟合(举几个例子让判断下,顺便问问交叉验证的目的、超参数搜索方法、EarlyStopping)、L1正则和L2正则的做法、正则化背后的思想(顺便问问BatchNorm、Covariance Shift)、L1正则产生稀疏解原理、逻辑回归为何线性模型(顺便问问LR如何解决低维不可分、从图模型角度看LR和朴素贝叶斯和无监督)、几种参数估计方法MLE/MAP/贝叶斯的联系和区别、简单说下SVM的支持向量(顺便问问KKT条件、为何对偶、核的通俗理解)、 GBDT随机森林能否并行(顺便问问bagging boosting)、 生成模型判别模型举个例子、聚类方法的掌握(顺便问问Kmeans的EM推导思路、谱聚类和Graph-cut的理解)、梯度下降类方法和牛顿类方法的区别(顺便问问Adam、L-BFGS的思路)、半监督的思想(顺便问问一些特定半监督算法是如何利用无标签数据的、从MAP角度看半监督)、常见的分类模型的评价指标(顺便问问交叉熵、ROC如何绘制、AUC的物理含义、类别不均衡样本)

  • CNN中卷积操作和卷积核作用、maxpooling作用、卷积层与全连接层的联系、梯度爆炸和消失的概念(顺便问问神经网络权值初始化的方法、为何能减缓梯度爆炸消失、CNN中有哪些解决办法、LSTM如何解决的、如何梯度裁剪、dropout如何用在RNN系列网络中、dropout防止过拟合)、为何卷积可以用在图像/语音/语句上(顺便问问channel在不同类型数据源中的含义)

  • 如果面试者跟我一样做NLP、推荐系统,我会继续追问 CRF跟逻辑回归 最大熵模型的关系、CRF的优化方法、CRF和MRF的联系、HMM和CRF的关系(顺便问问 朴素贝叶斯和HMM的联系、LSTM+CRF 用于序列标注的原理、CRF的点函数和边函数、CRF的经验分布)、WordEmbedding的几种常用方法和原理(顺便问问language model、perplexity评价指标、word2vec跟Glove的异同)、topic model说一说、为何CNN能用在文本分类、syntactic和semantic问题举例、常见Sentence embedding方法、注意力机制(顺便问问注意力机制的几种不同情形、为何引入、seq2seq原理)、序列标注的评价指标、语义消歧的做法、常见的跟word有关的特征、factorization machine、常见矩阵分解模型、如何把分类模型用于商品推荐(包括数据集划分、模型验证等)、序列学习、wide&deep model(顺便问问为何wide和deep)

【代码能力】主要考察实现算法和优化代码的能力,我一般会先看面试者的github repo(如果简历给出来),看其代码风格、架构能力(遇到大神会认真学习一个哈哈),如果没有github,我会避免问典型的应试题,而是问一些 我本人从实际问题中抽象出的小算法题,比如:

  • 给出节点的矩阵和边的矩阵,求路径和最大的路径(来源于 Viterbi 算法,本质就是个动态规划),至少给个思路和伪代码(顺便聊聊前向传播和反向传播)

  • 给出一数组,数组元素是pair对儿,表示一个有向无环图的<父亲节点, 孩子节点>,用最优的方法,将其变成一个新的有序数组,数组元素是该有向无环图所有节点,数组的有序性体现在:父亲节点在孩子节点前面(来源于 贝叶斯网络实现时的小trick)

【项目能力】主要考察解决实际问题的思路、填坑能力,这部分其实最考验面试官功底,要能从面试者浮夸的描述中寻找有意义的点,并一步步深挖

最后,我会问面试者:『有没有我刚没问到、但你特别想分享的项目经历』。此问题是给面试者一个展现自我的机会,同时也是挖掘出之前遗漏的问题。

以上问题能答完美的,请私信我~

。。。

。。。

。。。

。。。

我要向你学习

推荐阅读:

一大批历史精彩文章啦

详解Transition-based Dependency parser基于转移的依存句法解析器

干货 | 找工作的经验总结(一)

经验 | 初入NLP领域的一些小建议

学术 | 如何写一篇合格的NLP论文

干货 | 那些高产的学者都是怎样工作的?

是时候研读一波导师的论文--一个简单有效的联合模型

近年来NLP在法律领域的相关研究工作


好文!在看!

干货 | 我如何考察面试者的机器学习水平相关推荐

  1. [干货]我如何考察面试者的机器学习水平

    作为一名新晋菜鸟面试官,最近替部门面了3.40个人(大多来自国内top5学校,包括校招社招),小小总结下我的相人之术,希望能帮上大家 ------------硬插入----------- 先插个话,你 ...

  2. 面试官如何判断面试者的机器学习水平?

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 文 | 陈然@知乎 整理:夕小瑶的卖萌屋 本文已获作者授权,禁止二次 ...

  3. 大厂AI面试官一语中的:一场面试暴露了你的机器学习水平

    https://www.toutiao.com/a6621033976142234115/ 2018-11-07 16:33:22 从事机器学习就业方向有很多,比如有些公司侧重数据挖掘,而有些则更倾向 ...

  4. abap 取日期最大_Pointer干货分享:SQL面试50题思路解答与分类整理(下)CASE与日期函数...

    这是POINT小数点的第 368篇文章点点写在前面:SQL技能是数据分析师面试中必不可少的环节,小数点数据社区也给大家提供了练习SQL题目的地方,以下是pointer Yongfan整理的SQL50题 ...

  5. 腾讯面试官分享面试经验,如何考察面试者技术及个人综合素质,给正在面试的你一点建议

    前言 这两天小编有幸结识了一位腾讯的大佬,并面试过很多人,遂向他请教了站在面试官角度上是如何看待面试这件事的.接下来文章将会以第一口吻为大家分享大佬的面经. 一般面试(无论几轮),我都会从三个角度来考 ...

  6. 面试 | 22道机器学习常见面试题目

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自|视觉算法分享22道常考的机器学习面试题,给正在准备面试的朋 ...

  7. 纯干货!程序员面试的超实用技巧

    其实有很多文章说面试相关的问题,有国内也有国外的,但是我相信不少人,特别是新人看完后还是觉得比较虚比较泛,似乎好像懂了,但是一遇到面试还是有些手无足措或者重复犯一些错误.本篇文章正是结合实际经验,为广 ...

  8. 干货|全面介绍微软开源可解释机器学习框架InterpretML

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送 转自:机器之心 起初,机器于黑暗之中学习,为解释它们,数据科学家于虚空之中挣扎. 然后, ...

  9. AI工程师面试知识点:机器学习算法类

    AI工程师面试知识点:机器学习算法类   (帮助你选择合适的机器学习算法 https://docs.microsoft.com/zh-cn/azure/machine-learning/stu ...

  10. GitHub上AI岗位面试笔记(机器学习算法/深度学习/ NLP/计算机视觉)

    目录 机器学习 深度学习 自然语言处理与数学 算法题和笔试题 推荐阅读 工具 最近在GitHub上淘到一个很棒的AI算法面试笔记,特地分享给小伙伴们~ GitHub地址:https://github. ...

最新文章

  1. ffmpeg源码分析:transcode_init()函数
  2. Local模式下Spark程序只输出关键信息
  3. 学渣该不该学java_为什么很多学霸不愿给学渣讲题?不是因为高冷,而是学渣太难带...
  4. I.MX6 Android 5.1 回到 Android 4.2 emmc 启动
  5. python入门视频教程推荐-python入门学习哪个书比较好(python视频教程知乎)
  6. 「追根溯源」Ruby数组的uniq方法
  7. Java数组在内存中是如何存放的
  8. 更改结构体的内存字节对齐方式--经典
  9. SpringMVC+Mybatis基础知识和配置
  10. 高中生计算机创新大赛作品,2017 第十届“英特尔杯”全国大学生软件创新大赛获奖作品...
  11. Mac 上 Sublime Text3-Package control-console安装失败解决方案
  12. 使用代码删除IBASE object component
  13. php怎么把png转化为doc文件,怎么把PNG图片转换成Word文字
  14. 梁念坚:“云计算”福音
  15. macbook air从win10回到macOS Sierra
  16. 如何搭建Hyperledger fabric网络
  17. 阿里云上克隆代码的两种方法
  18. 金仓数据库KingbaseES客户端编程接口指南-ODBC(6. KingbaseES ODBC 的扩展属性)
  19. python从右侧向左第三个字符_字符串是一个字符序列,例如,字符串s,从右侧向左第3个字符用什么索引?_学小易找答案...
  20. Unity-3d Day03 做了一个吃粑粑豆的小游戏 hiahia~~

热门文章

  1. Exception.ToString()使用及其他方法比较
  2. Silverlight.XNA(C#)跨平台3D游戏研发手记:(七)向Windows Phone移植之双向交互
  3. 【转载】SQL Server 2005关于数据类型最大值(3)
  4. Hadoop的基本结构介绍(原创)
  5. 把一个下拉框中的选项添加到另一个中
  6. numpy基础1多维数组对象
  7. [笔试面试题] 10-C和C++区别相关
  8. unity3d点击屏幕选中物体
  9. cookie与Session的区别,以及jQuery怎样操作cookie和Session
  10. ae 地理坐标与投影坐标转换 [转]