铺垫

时间:9.2日中午1点钟
地点:西工大翱翔会议中心(一开始去成翱翔训练馆了= =,绕着西工大走了一大圈)
形式:现场面试,如果顺利的话,会有2-3轮技术面试,1轮HR面试,HR小哥哥不错。
面试体验:去之前看牛客上有吐槽面试体验的,我觉得还行吧,流程规范,就是一面面试官感觉也是个憨憨,我写了代码他觉得不对,然后我俩一起手动模拟 = = ,他终于相信我了!
然后二面面试馆太牛了,全面diss我,我有点难受,最后直接把我送到门口,say byebye~

问题&答案

有些记不太清了,就随便记录一下

签到后30分钟写两道题,easy难度。

  1. 求数组中,topk个最大数。
import java.util.PriorityQueue;class Solution {public int findKthLargest(int[] nums, int k) {PriorityQueue<Integer> pq = new PriorityQueue<Integer>();for(int i=0;i<nums.length;i++){if(pq.size()<k)pq.add(nums[i]);else if(nums[i]>pq.peek()){pq.remove();pq.add(nums[i]);}}return pq.peek();}
}
  1. 调整数组元素顺序,使奇数都在偶数左边。
package leetcoode;public class OddEvenSort {public static void main(String[] args) {int[] arr = {1,4,3,3,5,4};oddEvenSort(arr);for(Integer i: arr)System.out.println(i);}public static void oddEvenSort(int[] arr) {int low = 0, high = arr.length-1;while(low < high) {while(low<high && arr[low]%2==1)low++;while (low<high && arr[high]%2==0)high--;swap(arr,low,high);}}public static void swap(int[] arr, int i, int j) {int temp = arr[i];arr[i] = arr[j];arr[j] = temp;}
}

你说你在项目中使用了WOE和IV值进行特征评估,你们为什么非要用这个?还有其他的特征选择方法吗?filter中有哪几种,介绍一下?

  1. IV值和WOE的作用:IV值可以用来衡量自变量的预测能力,变量各分组的WOE和IV都隐含着这个分组对目标变量的预测能力这样的意义;
  2. 为什么使用IV而不用WOE
    1. WOE有正有负值,IV的正负与WOE的正负是相同的,乘积保证是正值,否则直接将WOE值加起来会正负抵消掉。
    2. IV值前面的(pyi−pni)(p_{y_{i}}-p_{n_{i}})pyipni其实反映出了该分组的有响应和无响应分别占总体的比例,也就是如果某个分组样本占总体数量比较低,那么对预测其实贡献也是比较低的,所以会给WOE基础上再打个折。
  3. 特征选择方法
    https://www.cnblogs.com/wzdLY/p/9689547.html

    1. wrapper(根据目标函数,每次选择若干特征,活着排除若干特征)
      递归特征消除法:使用基模型进行多轮训练,每轮训练结束后,消除若干权值系数的特征,再使用新的特征进行下一轮训练。
    2. embedded(先使用某些机器学习算法训练模型,得到各个特征的权值系数,再有大到小进行特征选择)
      基于惩罚项的特征选择法
      基于树的特征选择法
    3. filter(根据发散性活着相关性对各个特征进行评分,设定阈值或者特征个数,选择特征)
      1. 卡方检验(作为分类问题的分类变量的筛选方法)

      2. 互信息(作为分类问题的分类变量的筛选方法)

      3. 方差选择法(连续变量):计算每个特征的方差,根据阈值,选择方差大于阈值的特征进行训练;

      4. 相关系数(皮尔森相关系数)

LR的损失函数是什么?线性回归损失函数是什么?

  1. LR在估计参数的时候常用是极大似然估计,其损失函数对数损失函数
  2. 对数似然函数和交叉熵函数在二分类的情况下形式是几乎一样的;
  3. 注意⚠️:LR的损失函数是对数似然函数加负号
  4. 线性回归的损失函数是平方损失函数
  5. 为什么线性回归使用平方损失函数?是因为使用平方形式的时候,使用的是“最小二乘法”的思想,这里的“二乘”指的是用平方来度量观测点与估计点的距离(远近),“最小”指的是参数值要保证各个观测点与估计点的距离的平方和达到最小
  6. 最小二乘法以估计值与观测值的平方和作为损失函数,在误差服从正态分布的前提下,与极大似然估计的思想在本质上是相同。(推导)

朴素贝叶斯公式是什么,前提条件是什么?


前提:朴素贝叶斯法假设条件概率分布条件独立的。

然后指出我之前项目中,由于训练样本较少,又用的NB算法,效果肯定不会这么好(明里暗里质疑我项目的真实性,项目都上线了,有什么好争辩的)

word2vec介绍一下,其中投影矩阵是如何求得的?

总结

这次面试在面试问题之外,我还发现了以下几个问题:

  1. 面试官瞧不起专硕的,瞧不起没发文章的,瞧不起实验室不是做算法的(没错说的就是我)
  2. 尽可能多的给面试官展现自己的优势,自己实验室的优势,有时候实话实说未必是好事

【2020秋招】提前批陌陌机器学习算法工程师面试经验相关推荐

  1. 华为车BU机器学习算法工程师面试经验

    作者:Klause 来源:投稿 编辑:学姐 首先是机考 机考一共600分,三道题.一道100分,一道200分,一道300分.只要拿够一百分就算过. 第1题:数组 给定一个数组,数组各个元素代表每个礼物 ...

  2. 机器学习算法工程师面试集锦(更新中)

    机器学习算法工程师面试集锦(更新中) 面试问题汇总 常用的损失函数 介绍交叉验证 特征选择方法 机器学习项目的一般步骤 经验风险最小化与结构风险最小化 训练决策树时的参数是什么 在决策树的节点处分割标 ...

  3. 机器学习算法工程师面试知识点汇总

    机器学习算法工程师面试知识点汇总 机器学习 梯度下降 k-means 1 × 1卷积核 模型 SVM Bagging & Boosting 随机森林 激活函数 Sigmod tanh ReLU ...

  4. 平安银行薪资职级表_秋招提前批!平安银行总行公告发布!薪资拿到手软~

    扫码立刻加入银行秋招备考群 后台福利 回复 春招考题 领取 60页历年考题+考情分析回复 易错题 领取 银行考试易错600题回复 20家 领取 20家银行考试试卷回复 入行包 领取 20云南银行13家 ...

  5. 2018年机器学习算法工程师求职经验搬运

    机缘巧合下遇到了这篇文章... ---------------------  作者:GeekZW  来源:CSDN  原文:https://blog.csdn.net/zichen_ziqi/arti ...

  6. 机器学习-算法工程师 -面试/笔试准备-重要知识点梳理

    原文地址:http://blog.csdn.net/lrs1353281004/article/details/79529818 整理了一下机器学习-算法工程师需要掌握的机器学习基本知识点,并附上了网 ...

  7. 远景(智能/能源/动力)2023秋招提前批!内推啦

    [内推方式]: 点击下面官方网站链接投递: https://app.mokahr.com/recommendation-apply/envisiongroup/43124?recommendCode= ...

  8. 秋招在即,你准备好了吗?BAT算法工程师面试经验分享。

    本文 GitHub https://github.com/Jack-Cherish/PythonPark 已收录,有技术干货文章,整理的学习资料,一线大厂面试经验分享等,欢迎 Star 和 完善. 一 ...

  9. 机器学习算法工程师面试总结

    转自北邮人论坛 2017年即将过去,今年是忙碌的一年,从2月17还没开学就来学校,到现在12月初,工作的事情终于尘埃落定,现将这一段经历写下来,希望能帮助来年找工作的学弟学妹,同时,对自己来说,也是一 ...

最新文章

  1. 645. Set Mismatch(python)
  2. 百果园付凌峰:线上单月 1.2 亿背后的数据化运营
  3. python 垃圾回收哪时候执行_Python 中的垃圾回收机制是如何工作的?
  4. 判断字符串是否是正整数
  5. 【Python-3.5】matplotlib绘制气温折线图
  6. 如何系统的自学python-应该怎样系统的学习Python标准库?
  7. 端到端车道线检测_弱监督对象检测-端到端培训管道
  8. 说说 XcodeGhost 这个事
  9. SPSS教程——进行卡方检验的相关步骤
  10. java线程同步机制,实现同步锁
  11. Qt之QThread基本用法
  12. Python三种设计模式
  13. word文档页眉清除和页码设置
  14. ElasticSearch Cause: Cluster state has not been recovered yet, cannot write to the [null] index
  15. 几个南阳oj的STL题
  16. leetCode 108. Convert Sorted Array to Binary Search Tree JAVA
  17. linux pppd ip up 脚本,pppd拨号脚本配置
  18. CSS设置表格行列,给bootstrap table设置行列单元格样式
  19. 实现OCR语言识别Demo(一)- BottomSheet实现
  20. Spring中用@Component、@Repository、@Service和 @Controller等标注的默认Bean名称会是小写开头的非限定类名

热门文章

  1. Tomcat 10 调用Servlet提示 500 实例化Servlet类异常
  2. 一些对计算机有用的资源
  3. 树莓派利用3.5mm接口接扬声器播放语音提示
  4. 我所见过的最有创意的Flash小游戏
  5. java多级审批流程_[SharePoint 工作流] 如何设计一个通用的多级多审核工作流程(三):工作流开发...
  6. 忙里偷闲看电影《无人区》
  7. 阅读并记录别人的23岁
  8. YouTube 十岁了,这十年里视频网站改变了什么?
  9. 增强 Jupyter Notebook 的功能,这里有 4 个妙招
  10. oracle算加权平均的函数,怎样在Excel表中用函数算加权平均数?《电子表格加权平均函数》...