文 | ZJU跑男F3
编 | NLP情报局

因多方面因素,2020年的秋招形式依然严峻,特别是AI相关的算法岗位,竞争十分火热,既内卷又倒挂。

为帮助读者在即将到来的2021春招中斩获心仪offer,我们将整理一系列求职文章。

本文介绍腾讯、百度、滴滴三家大厂NLP算法的最新面试经验,其中前两家公司给了ssp offer。

腾讯TEG实习

视频一面

1、自我介绍

自我介绍即开场白需要提前准备并多次练习,内容不用太多,言简意赅地讲清楚学校、专业、研究方向,概括介绍实习/论文/比赛等亮点即可,细节可以根据面试官的兴趣再深入。

2、项目/实习经历

这部分主要根据简历上的实习/项目进行,可能会问背景、怎么做、为什么这样做、最终结果、是否成功上线等,再深挖一些技术细节,或顺带考察ML、DL等知识点。

由于校招同学没有工作经验,所以项目和实习是展示自身能力的最好亮点(一堆CCF-A的大佬请忽略并接受我的膝盖)。面试官可以从介绍中了解你的工程能力、抗压能力、沟通能力、思维方式等等,如果吸引到面试官肯定能加分,要是面试官觉得索然无味估计面试也就到这儿了...

所以对于简历上的内容要滚瓜烂熟,能知其然知其所以然最佳。如果问到简历上的内容没答上或吞吞呜呜,将非常打脸,造成硬伤(简历上自己写的都不会,别的还用问吗╮( ̄▽ ̄)╭)。

切忌在简历上洋洋洒洒地写“熟悉Xgboost、SVM、Bayes、HMM、CRF、KNN、LR、CNN、Attention等算法”。是听过名字就算熟悉?还是啃过源码、理解背后原理?即便真的对这些算法理解透彻,最好也能结合例子来说明,而不是穷举。

而对于没有项目/实习/比赛经历的同学,这一部分时间只能由考察基础算法来弥补了,这样一来随机性、难度都提升了不少;所以平时尽可能多积累这方面的经验,让简历充实起来。

“项目 or 实习 or 比赛 or 论文”最好为真,这是底线。

3、介绍一个比赛

我从简历上3个比赛中,选择了一个最有亮点的比赛,从数据、模型、提分trick三方面做了介绍。

4、如何实现知识蒸馏,loss怎么选择

5、介绍TinyBert的工作原理

6-9考察机器学习基础

6、LR是线性模型吗,为什么?

7、梯度下降和随机梯度下降的区别

8、GBDT和XGBoost的区别(至少3方面)

9、偏差和方差的区别

10-11考察深度学习基础

10、怎么理解XLNet的,XLNet的输入是什么?

11、一个二分类任务,假设只有一个维度的特征,取值范围是0~正无穷,如何实现二分类?

12、手撕代码:两个数组求交集

只能使用 list,如果要用其他数据结构(比如字典)需要自己实现;时间复杂度尽可能低。

腾讯一面难度中规中矩,量比较多但基本都在考察基础。

关于手撕代码,今年应该是非常关键也是必做的环节,很多公司直接将编程题作为通过面试与否的硬性指标。刷题要趁早!

电话二面

1、询问两个实习项目,详细考察细节

2、介绍textcnn实现过程,池化时loss如何反向传播

3、假如不用bert,一大堆文本有几百万个词,直接训练词向量很困难,如何去做特征选择

4、LSTM门控机制是怎样的

5、LTSM主要解决了RNN什么问题,为什么能解决

6-9重点考察语言模型

6、介绍GPT2如何写诗、写对联

7、GPT2如何围绕一个主题/关键词写诗

8、ELMO、BERT、GPT模型彼此之间有什么区别

9、word2vec和ELMO主要有什么不同,为什么elmo效果更好

hr视频面

1、询问导师、实验室的研究方向

2、智能客服系统中,你主要负责哪些模块?

3、base在深圳能否接受,多久可以来实习?

面试结束后过了2天,成功收到TEG的offer call。

百度自然语言处理

视频一面

1、手撕代码:

给定一个字符串S和一个字符C。返回一个代表字符串S中每个字符到C的最短距离的数组。

# input
S = "paddlepaddle", C = 'd'
# output
[2, 1, 0, 0, 1, 2, 2, 1, 0, 0, 1, 2]

2、介绍简历上的2个项目和1个比赛

3、介绍bert和TinyBert

4、bert如何实现微调

5、fasttext的实现原理

6、文本匹配如何实现

7、手推信息增益、信息增益率、Gini指数公式

8、ngram如何过滤不合理的组合

9、还有什么想和我分享的?

面试官给了一个展现自我的机会,我介绍了一个最近在实验室新做的项目(简历上没有)。

视频二面

1、手撕代码:

word2vec负采样具体怎么做的(知识点:累积概率分布、二分区间查找)

2、文本匹配怎么做

3、文本匹配不当分类来做,loss怎么设计?

4、bert在中文和英文场景下使用,有什么区别

5、介绍一下在开源组织CLUE的工作

6、假如给offer,什么时候能来实习

hr视频面

聊个人特质、看重公司哪些方面、个人职业规划等

滴滴出行规划

视频一面

1、详细介绍1个项目和1个比赛

面试官让现场打开比赛链接查看排名和解决方案

2、手撕代码:

  • 因式分解

  • 判断年份是否为闰年

视频二面

1、介绍1个项目

2、介绍transformer

3、介绍常用的聚类算法(KMeans、DBSCAN、Mean Shift)

4、介绍word2vec2种实现模型、区别以及和fasttext的区别

5、手撕代码:并查集

视频三面

1、介绍1个项目

2、手撕代码:

两个有序数组,求第k大,时间复杂度尽可能低(log(m+n))

总结

近两年AI算法岗非常内卷,加上疫情影响给找好工作都增加了难度。但身边的朋友基本都在头部大厂收获了1+offer。实习和项目经验仍然很重要,ACL、NIPS等论文近些年在贬值。扎实的理论基础和coding能力可以让你进大厂后继续保持足够的竞争力。

手撕代码是面试的一道坎,要早做准备。同时,尽可能把握住可以跳过笔试(大部分公司)的提前批面试

祝大家在新的一年offer多多,好运连连。

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐两个专辑给大家:

专辑 | 李宏毅人类语言处理2020笔记

专辑 | NLP论文解读

专辑 | 情感分析


整理不易,还望给个在看!

腾讯、百度、滴滴最新NLP算法面经相关推荐

  1. 腾讯NLP算法面试题整

    大家好,这里是面经酱- 今天来帮大家梳理网上公开面经中提到的腾讯NLP算法岗相关面试题,欢迎在 面经酱(www.mjj666.cn) 搜索最新面经,有其他公司.岗位的面经梳理需求请留言哦- 编程&am ...

  2. 阿里巴巴NLP算法面试题整理

    大家好,这里是面经酱- 今天来帮大家梳理网上公开面经中提到的阿里NLP算法岗相关面试题,欢迎在 面经酱(www.mjj666.cn) 搜索最新面经,有其他公司.岗位的面经梳理需求请留言哦- 今天来帮大 ...

  3. 11月面完美团+网易+腾讯+百度+滴滴熬夜5天整理面经攒人品

    就在双十一期间,投了几十份简历,大大小小的公司不知道去了多少家,也幸运的拿到了某厂offer.加上前阵子有好多朋友问各大厂的面试过程,所以为了方便沟通交流回来熬夜5天整理很多美团/网易/腾讯/百度/滴 ...

  4. 【牛客访谈】对话何俊林:腾讯百度华为搜狗和滴滴面试题汇总

    [牛客访谈]对话何俊林:腾讯百度华为搜狗和滴滴面试题汇总 牛客访谈规则]一周内在本帖下问问题,嘉宾会在一周内给你解答 嘉宾简介: 北漂有情怀小伙,田埂上的放羊娃,农村小伙,阳光和苦难同在.csdn博客 ...

  5. 2021最新汇总数据结构与算法面试题(准备面试的可以看看)

    闲来无事整理了一下数据结构与算法面试题,准备面试的可以看看. 这份面试题汇总除了Java语言的,我还整理了C++和Golang语言的,无论你是做什么开发这份数据结构与算法面试题汇总都可以看,如果你是做 ...

  6. Linux操作系统——面试题-(腾讯,百度,美团,滴滴)

    文章目录 26 Linux 面试题-(腾讯,百度,美团,滴滴) 26.1 分析日志t.log(访问量),将各个ip 地址截取,并统计出现次数,并按从大到小排序(腾讯) 26.2 统计连接到服务器的各个 ...

  7. 2019算法面经汇总

    作者:小小桔? 链接:https://www.nowcoder.com/discuss/167046?type=2&order=0&pos=3&page=1 来源:牛客网 算法 ...

  8. 数据结构经典算法面试题

    转自:http://hi.baidu.com/geogre_jsj/blog/item/e4b98fd2aab5aa3611df9b92.html 由于这些题,实在太火了.所以,应广大网友建议要求,在 ...

  9. 史上最大规模ACL大会放榜,百度10篇NLP论文被录用!

    近日,自然语言处理(NLP)领域的国际顶级学术会议"国际计算语言学协会年会"(ACL 2019)公布了今年大会论文录用结果.根据 ACL 2019 官方数据,今年大会的有效投稿数量 ...

  10. 现实中的算法面试题(已拿Offer)赚到了,赚到了

    算法面试题 阅读目录 写在前面 算法百科 算法题目 参考答案 博客总结 博客前言 有提到分享一下面试题,最近也是才能新公司入职没多久,忙着熟悉环境,加上前不久出去玩了一趟(顺便写了篇游记,感兴趣的可以 ...

最新文章

  1. Linux之rpm包管理
  2. 动态生成能够局部刷新的验证码【AJAX技术】---看了不懂赔你钱
  3. MySQL - order by和 group by 优化初探
  4. Java LinkedList的实现原理详解
  5. jzoj2152-终极数【堆】
  6. hdu 3079水题
  7. can协议crc计算_详解CAN/CAN FD通信中的循环冗余校验(CRC)方法
  8. 换5G手机别着急!雷军:再等等,我们不赚钱
  9. python--集合概念和实战(一)
  10. 怎样使绝对定位的子元素铺满父元素并且子元素可以设置padding
  11. 智能优化算法:飞蛾扑火优化算法-附代码
  12. 求 逆矩阵 公式推导
  13. python爬虫实时转发文章新闻;微信机器人使用;
  14. 多个wordpress_40多个使用WordPress的热门大学
  15. whisper客服源码_whisper客服系统兼容HTTPS方案
  16. [艾兰岛]编辑器做传送门——kura酱长期更新
  17. SpringBoot 导出Word文档(doc\docx) Office无法打开,WPS正常等坑
  18. NANK南卡lite Pro无线蓝牙耳机上手体验
  19. USB接口鼠标接触不良的简单处理
  20. C语言捉弄人的程序,愚人节怎么捉弄人?愚人节微信红包整人方法大全

热门文章

  1. solr学习篇(三) solr7.4 连接MySQL数据库
  2. git的丰富实用经验
  3. 教你摆脱低级程序猿 项目中cocopads的安装使用
  4. myeclipse 安装svn(subeclipsesite)插件
  5. strlen()实现
  6. C语身教程第十章:文件(8)
  7. web.config中特殊字符的处理
  8. 【react】---组件传值的介绍
  9. YCOJ过河卒C++
  10. 没有upcast 也不会发生多态