1. 直接介绍一个最近做过的项目:

  • 用到哪些预处理步骤?
  • 为什么选用CNN?
  • 对CNN的结构和参数有哪些修改?

刚开始有点懵,语言组织有些着急,只说了个大概,后来进一步问的时候,才详细介绍了流程。

应该快速整理一下思路,然后有条理的说出来,并且要说出本身项目的难点和创新点,主导面试,向自己擅长的方向;

2. 又看到一个关于京东算法大赛的项目:

  • 说一下对于数据的预处理是怎么做的,就是特征提取的步骤,有哪些特征?
  • 评价标准,有没有想过对提高得分,哪些操作会比较有用?
  • 提到一个关于时间的衰减,具体衰减是怎么做的?
  • 用到XGboost,他与Adaboost有什么不同,在精度上有什么区别么?

1. Adaboost一般用于分类,XGBoost既能用于分类也能用于回归

2. Adaboost是一阶泰勒展开,XGBoost还用到了二阶泰勒展开的信息

3. 方差和偏差的角度(现在才明白面试官说的精度应该是指这个不同)

【精度方面的区别主要应该是说Adaboost主要是减小偏差,而XGboost即能够减小偏差又能减小方差】

  • XGboost与随机森林又有什么区别?

1. bagging与boosting

2. CART分类器,线性分类器相当于带L1,L2正则化的逻辑回归或者线性回归

3. 分类器权重一样,权重由分类准确率来确定

4. 减小方差,偏差和方差都减小;

3. 看到简历中有提到聚类算法,说说常见的聚类算法有哪些?

  • 聚类算法的应用场景分别是什么?

新闻聚类、用户购买模式(交叉销售)、图像与基因技术

  • 关于k-means聚类和DBSCAN有什么区别?

 K-means: 

1.确定聚类个数K

2.选定K个D维向量作为初始类中心

3.对每个样本计算与聚类中心的距离,选择最近的作为该样本所属的类

4.在同一类内部,重新计算聚类中心(几何重心) 不断迭代,直到收敛:

缺点:

1.对初始聚类中心敏感,缓解方案是多初始化几遍,选取损失函数小的。

2.必须提前指定K值(指定的不好可能得到局部最优解),缓解方法,多选取几个K值,grid search选取几个指标评价效果情况

3.属于硬聚类,每个样本点只能属于一类 4.对异常值免疫能力差,可以通过一些调整(不取均值点,取均值最近的样本点)

5.对团状数据点区分度好,对于带状不好(谱聚类或特征映射)。

优点:

速度快,适合发现球形聚类,可发现离群点

尽管它有这么多缺点,但是它仍然应用广泛,因为它速度快,并且可以并行化处理。

DBSCAN聚类:
基于密度的算法,之前的一些算法都是考虑距离,而DBscan是考虑的密度,只要样本点的密度大于某阈值,则将该样本添加到最近的簇中(密度可达的簇)

核心点:在半径eps内含有超过Minpts数目的点,则该点为核心点。

边界点:在半径eps内含有小于Minpts数目的点但是在核心点的邻居。

核心点1连接边界点2,边界点2又连接核心点2,则核心点1和边界点2密度可达。

噪音点:任何不是核心点或是边际点的点。

密度:在半径eps内点的数目。

Python中可调的参数:eps(半径)和m(密度), eps为半径,m为要求的半径内点的个数即密度,m越大聚出的类越多,因为即要求成某个类的密度要比较高,一旦中间比较稀疏的就不算一个类了;eps越大,类的个数越少。

优点:相对抗噪音(可发现离群点),可以发现任意形状的样本。不用确定聚类的个数,只需要确定eps(半径)和m(密度)。

缺点:但计算密度单元的计算复杂度大,不能很好反应高维数据,高维数据不好定义密度。

  • 关于一个机场人流密度预测的比赛,有了解吗?

4. 平时用python么,对于SQL语句熟练么,平时处理查询数据怎么来做?

解释了为什么没用SQL。

5. 除了经典的XGboost和CNN还实践或者用过哪些机器学习算法?

说没太用过其他的,其实还用过KNN,随机森林也用到过,只是没有深入研究。参加过的相关比赛,或者尝试也可以。

总共面试时间为23分钟,应该是电话面试时间最短的一次了吧。说基本情况已经了解了,明天会通知结果。水~~~

京东商城-商城研发部 算法岗面试相关推荐

  1. 卖萌屋算法岗面试手册上线!通往面试自由之路

    一只小狐狸带你解锁 炼丹术&NLP 秘籍 作为算法工程师,基础知识的重要性自然不必多说.虽然在有些项目中比较难感受到基础的作用,但扎实的coding能力,对算法本质和适用情况的理解,始终是决定 ...

  2. 算法岗面试必读-机器学习面试实战

    本书介绍 本书是许多人的集体智慧的结果,他们花了很多时间思考招聘过程.这本书是为求职者写的,但看到早期草稿的招聘经理告诉我,他们发现了解其他公司是如何招聘的,并重新思考自己的流程是有帮助的. 这本书由 ...

  3. 【2022】计算机视觉算法岗面试题目和复习知识点汇总

    计算机视觉算法岗面试题目和复习知识点汇总 1.讲一下BN.LN.IN.GN这几种归一化方法 2.为什么Transformer 需要进行 Multi-head Attention 3.讲一下self a ...

  4. 算法岗面试常见问题大集合

    1.参考博客 算法岗面试常见问题大集合 算法工程师手册 2.模型过拟合的解决方法 L1/L2正则化(原理奥卡姆剃刀):L2正则化也叫作权重衰减,目标函数中增加所有权重w参数的平方之和,迫使所有w可能趋 ...

  5. 2020计算机视觉(cv)算法岗面试题目及答案汇总(一)

    2019计算机视觉(cv)算法岗面试题目及答案汇总(一) 今日头条: 拼多多: 虹软科技: 小红书: 海康威视: 网易: 招银网络科技: 关注我的公众号: 今日头条: 输入为 L ∗ L ∗ c L* ...

  6. 6 年大厂面试官,谈谈我对算法岗面试的一些看法

    文 | 不敢透露姓名的 Severus 和小轶 面试官坐在那撇着大嘴的,"咳,给你一机会,最短的时间内让我记住你."这个我会,我抡圆了"啪!",扭头我就走.我刚 ...

  7. 算法岗面试复盘:阿里,百度,作业帮,华为

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:苏young,整理:NewBeeNLP 写在前面 先介绍下个人情况 ...

  8. 算法岗面试复盘 | 阿里、百度、作业帮、华为

    来源:NewBeeNLP.小小挖掘机 本文约1500字,建议阅读5分钟. 本文作者为你总结7月至今的各种面试. 写在前面 先介绍下个人情况,本科金融,辅修数学,研究生转应用统计,主要申算法去岗,从今年 ...

  9. 如何高效准备2021届秋招算法岗面试?

    作为一名程序员,你肯定想过:编程最本质的知识是什么?很多人都会说是算法与数据结构.为什么是算法?算法如何帮助程序员升级打怪?进大厂.升职加薪.找到女朋友..... 1 算法是去国内一线互联网公司的必要 ...

最新文章

  1. C++中const——由一个例子想到的
  2. 使用Silverlight for Embedded开发绚丽的界面(3)
  3. iphone11屏比例_华为P50Pro概念图:回归经典的直面屏
  4. 《炉石传说》建筑设计欣赏(7):采用Google.ProtocolBuffers处理网络消息
  5. 程序员遇到bug时常见的30种反应
  6. Django报错NameError: name ‘ListView‘ is not defined
  7. qq传文件 udp_软考网络工程师备考-10:网络互连与互联网3-TCPUDP
  8. 吴恩达课后作业学习1-week4-homework-two-hidden-layer -1
  9. 小程序如何避免多次点击,重复触发事件
  10. 计算机组成原理教案pdf,计算机组成原理教案模板.pdf
  11. 【历史上的今天】7 月 14 日:MP3 诞生日;系统动力学的开创者诞生;正面战胜 IBM 的计算机公司
  12. A4纸网页打印中对应像素的设定和换算
  13. CRM软件成功案例解析
  14. 新西兰计算机预科学费多少钱,留学新西兰预科费用及课程
  15. Java 基于JavaMail实现向QQ邮箱发送邮件(未测试)
  16. 华硕主板固态硬盘不识别_[主板] 开机后无法识别硬盘或SSD的故障排除方式
  17. 内容创业洗稿,知识付费拆书
  18. IRQL深入解析(3)--与IRQ比较
  19. 「测试人的恶梦」测试用例设计之电梯、杯子、桌子、椅子、洗衣机
  20. 在计算机英语中 update是什么意思,电脑出现windows update是什么意思?

热门文章

  1. 年薪40万,我用的是这套Python学习体系
  2. Tensorflow快餐教程(8) - 深度学习简史
  3. CoreOS的Tectonic新发行版支持Kubernetes自我管理
  4. web人力资源信息系统开发日志②
  5. python基础之协程,列表生成式,生成器表达式
  6. 剑指offer 二进制1中的个数
  7. ios Runloop
  8. JS数组方法汇总 array数组元素的添加和删除
  9. android oppo 权限,OPPO Reno可尝鲜Android Q:教程如下
  10. 二维数组更改vue_二维数组如何在vue中显示表格