看大厂NLP的面试经验之后的一些思考总结
多多少少看了一些别人的面经,发现基本上都是非常相似的,说明大厂对招聘的要求也是高度一致,我分为以下几个方面进行分析总结
基础
数学基础
首当其冲是数学基础,这是一切算法的基础:
高数,线代,概率论(基础级别)
矩阵论,随机过程,高级概率论(进阶)
泛函分析,流形(理论机器学习级别,花书里面多次提到过)
机器学习基础
机器学习算法
只提几个出现率最高的:(NLP视角)
HMM ,CRF,SVM,XGBoost,TF-IDF,LDA,GBDT,bagging,boosting,stacking,LR
CRF为什么比HMM性能更优秀,二者的原理与区别,维特比算法
SVM为啥要求解对偶问题(降低求解的复杂度)
XGBoost的原理
正则化
正则化的作用
L1, L2分别用在什么情况,区别,L1满足什么分布
Dropout为什么work
Batch Normalization,Layer Normalization(特别是transformer为什么不用BN而用LN)
杂项
Sigmoid 和 ReLU 区别,ReLU 解决了什么问题
梯度爆炸梯度消失了解吗?
如何选择合适的损失函数?
如何防止过拟合
深度学习基础
CNN中pooling的作用
LSTM和GRU的原理,为什么work
LSTM里面为什么有些激活函数用sigmoid,有些用tanh
残差连接为什么work
NLP基础
关于transformer的一切
知道几种词向量的方法:
- 基于 one-hot、tf-idf、textrank;
- 主题模型:LSA(SVD)、pLSA、LDA;
- 基于词向量的固定表征:Word2vec、FastText、GloVe;
- 基于词向量的动态表征:ELMo、GPT、BERT
训练词向量时候的优化方法
是否了解常用分词方法?
BPE,word piece,Unigram
ngram共现频率为零怎么解决
BERT的Self-Attention细节,比如Q、K、V
注意力机制为什么work
bert有什么可以改进的地方
bert的mask策略
Word2vec的两种训练目标是什么,word2vec和GloVe的区别
bert的position embedding
BERT ELMO XLNET 区别
GPT和BERT的区别
文本分类,NER,文本匹配
项目
自己的项目中运用到了些什么技术,传统方法是什么样的,做了什么样的改进,遇到了什么样的问题
(感觉有项目的好像不多所以这方面比较少)
论文
介绍自己论文的模型和方法
(没看到几个有论文的…)
算法基础
由于是ACM出身,没仔细看这部分,但是题目都不难,好好刷题即可
总结
总的来说最明显的特点就是注重基础,会问一些很细的问题,基础不牢固的话一下子就会露馅,在平时学习的过程中要注重算法的理解,并且要自己思考并发现一些问题,而不是只浮于表面,用nz哥的话来说:透过现象看本质。
对项目和论文并没有太高的要求(可能是知道大部分人也没有,而且那些小项目也只是玩具),所以把重点放在加强基础的学习就好,多学习,多思考,多总结。
(持续更新ing…)
看大厂NLP的面试经验之后的一些思考总结相关推荐
- 给大家分享我的宝藏:nlp算法面试经验
(本人双非研二) 2021年.7.20日:奥维森基因科技公司: 1 svm基本原理,核函数,核函数怎么选 ,四分类的原理是什么. svm多分类的两种方法: 支持向量机原理详解(八): 多类分类SVM ...
- 软件测试BATJ大厂1000小时面试经验分享【建议收藏】
在互联网从业者中,流传着一份互联网公司名单,不是按照市值.人员规模排序,而是按照待遇. 在他们心中,排在第一梯队的是,字节跳动.腾讯.阿里,第二梯队是拼多多.快手.滴滴,其次是美团.小米.京东. 这是 ...
- 2020 BAT大厂数据开发面试经验:“高频面经”之大数据研发篇
目录 1.linux常用命令 2.Java虚拟机.垃圾回收机制 3.TCP "三次握手". "四次挥手 4.大数据常见组件 5.HDFS存储机制 6.MapReduce基 ...
- 【个人思考系列】美团点评 Java 后端新人第一年总结面试经验 | 掘金技术征文...
image.png 伴随着公司的推送,在2017年7月12日,我迎来了在公司中的第一年. 在公司的第一年,遇到了一些困难,学习到了很多知识,得到了很多人的帮助. 文字是可以传承下去的,总结一下自己过去 ...
- ♥看二本学渣如何进腾讯 分享面试经验、职场感悟、硬核知识、大厂内推♥
☆☆☆牛牛´s简介☆☆☆ 牛牛,普通二本学渣,实习进完美,毕业进腾讯,去过外企,肝过头条. 目前又继续回腾讯窝着. ☆☆☆牛牛´s公众号☆☆☆ 日常硬核输出数据库.数据结构.操作系统.分布 ...
- 【面试经验分享】十分值得一看! 研一下-算法实习-面试经验汇总
青藤云安全(2月26日) 机器学习算法实习岗 微信视频面试,15分钟.主要问了下简历上做阿里云比赛的经历,后未联系,预计已挂. 主要存在的问题: 1)做的东西太简单太基础,不够看,导致面试官其实没啥可 ...
- 大厂前端面试都问些什么问题?入职爱奇艺年薪48万,面试经验总结
前言 "金九银十"跳槽季,又到了面试求职的高峰期.好多小伙伴都会跳槽去找工作.如果你不跳槽,也建议把这篇文章看完,毕竟金九银十之后,就是金三银四了,总是逃不掉的? 你在面试的时候, ...
- 一番星大厂面试经验分享第一弹
点击上方蓝字,订阅关注我们! 前言 感谢一番星汇总本次的面试经验,给出了部分面试问题的答案,希望更多人能从中收益,不断积累经验,在面试中优异表现,斩获更多大厂offer,成为offer收割机! 也欢迎 ...
- 【每日一念经】算法岗面经,一万字面试经验你确定不看?
微信改版,加星标不迷路! 算法岗面经,一万字面试经验你确定不看? 作者:CyC 前言 2018,有过迷茫,有过努力,也有很多收获.为了记录这一年以来的感受,于是有了这篇文章. Offer 情况 经过了 ...
- 去BAT,你应该要看一看的面试经验总结(转)
来源微信公众号『easyserverdev』 http://mp.weixin.qq.com/s/UZljzFMjobo1wzCguY7NDg 说下我的面试经验吧,都是亲身经历,不喜勿喷: 我去年12 ...
最新文章
- canvas 添加 竖版文字_CSS题目系列(4) - 文字穿透遮罩层
- Java 里的泛型简介.
- centos7 ldap php,php7安装ldap扩展
- 通过ABAP代码判断当前系统类型,BYD还是S4 OP还是S4 Cloud
- 伪原创工具安全第一嘛~~
- 磁共振t1t2信号记忆顺口溜_10分钟记住脑出血核磁表现(一):T1、T2篇
- 工作记录 反射
- Android setOnPageChangeListener 过时解决
- ASCII 码表对照 2
- Python__关于列表的引用 以append操作为例
- Android 实时数据库工具Database Inspector
- 快手火山抖音视频怎么快速去重消重和去水印秒拍视频批量采集下载怎么快速去重消重去水印视频批量采...
- Spring常用注解
- Ubuntu18.04 上 ESP8285 的 esp-at release_v2.2.0.0 编译环境搭建
- (完美)华为P20pro CTL-AL00的usb调试模式在哪里打开的教程
- Axure,Justinmind以及Mockplus的交互设置方式对比
- 对吃鸡APP的逆向分析
- Android 常见的透明度颜色值ARGB 半透明 全透明
- 图片内容转文字用Java怎么实现?
- 小米生态链的战投启示
热门文章
- 删除整个目录(API)
- 云计算计算机二级,2021计算机二级office用的是哪个版本
- junit可执行但控制层无法执行_解决junit5无法使用gradle test运行测试
- ABC + DEF = GHI //递归思想的充分体现(重难点)
- 判断 失效_复合材料渐进失效Hashin模型及参数详解
- vue生成静态html文件_是否可以将Vue.js模板编译为静态HTML和CSS文件?
- 程序员离职代码交接_程序员离职大半个月,被老板命令回单位讲代码,员工:一次1万!...
- h5后台登录模板_微信公众号模板消息群发工具如何操作?
- nyoj412 Same binary weight(bitset类运用)
- 字符串替换(NYOJ)