【面经】字节AI Lab-NLP算法热乎面经
作者 | 我爱雪糕
整理 | NewBeeNLP
写在前面
先说下感受吧。本人在今年3月1号(周日)投递简历,隔天周一hr就约了周四的面试,结果那天是2面视频技术面+hr面直接走完了,周五内推的学长就告诉我过了,紧接着就是offer call。整体投递+面试+发录用通知函的时间不到一周,而且面试官都是和简历对口的,整体体验非常棒。
PS:offer call里说我的leader是李航,看了看手里的小蓝书,意外的惊喜
面试的岗位是“AI Lab实习生 — 自然语言处理NLP”,一共2面技术和一面hr,这里主要说下其中的技术面试。
一面
20min简历 + 30min题
先自我介绍,然后面试官说了句“好的了解”就直接进入项目了。
我的经历主要是一些竞赛,因此也是主要聊竞赛,在竞赛细节中扣一些细节提问。竞赛主要是关于机器阅读理解MRC的(百度机器阅读、莱斯杯等),面试官也刚好懂,大致问题如下:
请你描述一下竞赛背景,以及你在其中的工作/职责。
我看你数据做了很多预处理,这部分重要吗,具体是如何做的预处理。这个不同项目应该不太一样,不细说了。
我看你用了word2vec的词向量,知道它是如何训练的吗,有哪些trick。这个很基础了,trick就是负采样和分层softmax。
glove了解吗,elmo呢?
你把很多组件改成了transformer 的 multi-head attention,为什么要舍弃lstm的结构而选用它呢。我回答的是可并行+更强大的特征提取能力,顺便还解释了self attention的原理以及multi-head的作用。
说一下bidaf的匹配层,解释了bidaf的c2q和q2c的意义和具体做法。
你取得top2的成绩还有其他优化吗。这部分答了很多,当时吃了没用bert的亏,所以在很多方面进行了一定的优化。
你的第二个竞赛用roberta,它和bert的区别。动态mask+去除NSP+大力出奇迹(更大的batch,更多的数据,更多的step)。
xlnet和bert有啥不同。自回归&&自编码的知识,其中解释了xlnet排列语言模型以及双流attention。
albert了解吗?embedding层矩阵分解+参数共享 + SOP + 工程细节。
其他还有些小问题想不起来了,总体来说问的面不广,但是扣了些细节。
最后是两道算法题:
顺时针打印数组
编辑距离
很顺利的写出来了,一面结束,在线等二面。
二面
先同样是自我介绍。
然后出了一道“智力题”?
10个袋子,1000个球,你用球填充袋子,然后就固定了。现在来一个客户,无论他要1~1000哪个数量,你都能通过组装几个袋子给他。
我开始对面试官说可以动态规划:第一个袋子放1个,第二个袋子放2个,这个时候3=1+2,所以第三个袋子不用放3个,放4个;此时5=4+1,6=4+2,7=4+2+1都能组合得到,所以第四个袋子放8个,以此类推。后来一想,这不就是个1,2,4,8的等比数列吗…
因为我提到了动态规划,面试官为了使用动态规划要满足的条件是什么?什么情况下时候动态规划比较好呢?答:使用dp需要满足最优子结构性质 + 无后效性,在子问题有重叠的时候可以自顶向下的记忆化搜索,或者直接写成自底向上的dp。
问我了一个C++的问题,后来看我很懵逼,看一眼简历说哦你是会Java啊,那我们换个问题,你说一下堆和栈。我说了数据结构的堆和栈,被打断,他说是内存分配中的堆和栈。这部分答得不好。
接着是简历了,主要也是问竞赛相关,听我这些竞赛的细节,然后针对细节提问,没咋问transformer、bert相关,问了更偏传统机器学习一些, 主要是一些关于gbdt、xgb、crf。
gbdt和xgb的就不细说了。
crf部分问的很详细,例如它的具体定义?什么是马尔可夫随机场?讲讲你对crf的理解?crf和hmm的区别知道吗,为什么ner任务用crf而不是hmm?crf具体如何预测?感觉答得一般。
最后2道算法题:
口述了一道算法题,我记不起来了,是一道dp题来着,反正很快想到了方法,就pass了。
安卓手机的解码方式多少种,就是那种9个点,可以上下左右、左上、左下、右上、右下连线的解锁,最少一个第一点,最多可以全连上,一个点只能用一次。我用的dfs直接做的。
PS:时间有点久了,忘了很多…
- END -
交流学习,进群备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
【面经】字节AI Lab-NLP算法热乎面经相关推荐
- 字节AI LAB NLP算法二面凉+被捞后通过
作者 | 113767074 整理 | NewBeeNLP 面试锦囊之面经分享系列,持续更新中 欢迎后台回复『面试』加入讨论组交流噢 一面 能感觉到面试官是个水平贼高的人 对machine lea ...
- 字节AI Lab总监李磊离职加入UCSB,马维英后又一大牛回归学界
转自:新智元 [导读]近日,字节跳动 AI 实验室总监李磊离职,入职 UCSB!去年,该实验室的AI掌门人马维英从字节离开后,入职清华,如今李磊也重返高校.AI大牛从工业界返回学术界再成潮? 又一AI ...
- 腾讯AI Lab NLP团队首次曝光,张潼、俞栋带队解读ACL三大前沿
本文转载自腾讯AI Lab微信号(tencent_ailab),深度解析本届ACL热门研究.文章第一部分是三大前沿领域重点文章解析,包括信息抽取.问答系统和机器翻译等.第二部分是ACL简介及NLP团队 ...
- 岗位推荐 | 腾讯AI Lab多媒体算法组招聘正式员工和实习生
PaperWeekly 致力于推荐最棒的工作机会,精准地为其找到最佳求职者,做连接优质企业和优质人才的桥梁. 如果你需要我们帮助你发布实习或全职岗位,请添加微信号「pwbot02」. 腾讯 AI L ...
- 字节跳动AI Lab招聘算法工程师,含全职和实习
(图片来自字节跳动官网) 社招 岗位一.算法工程师 『职位描述』 负责计算机视觉和深度学习等相关算法的研发和实现,并推动该算法在字节跳动各个产品线的落地: 负责计算机视觉相关技术的前沿研究,为产品应用 ...
- 字节AL LAB nlp 日常实习面试失败
面试失败 公司:字节跳动 职位 : AL lab 的NLP方向 面试时长 :1h 一面就失败了,没有二面, 面试官非常年轻,感觉字节面试官都很年轻.面试官因为疫情也是在居家远程办公,虽然最后没面过,但 ...
- ACL 2022 | 字节AI Lab联合UCSB提出MOSST:基于单调切分的端到端同传
研究背景和动机 随着信息技术的发展,流媒体和多媒体成为信息传递的主要媒介,逐渐应用在我们生活的方方面面.即时的信息传递需求也在日益增加.特别地,在跨国交流和文化传播场景中,为了消除语言沟通障碍,即时语 ...
- 2021年各家大厂的AI Lab现状如何?
点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 编辑:Amusi | 来源:知乎 https://www.zhihu.com/question/4765 ...
- AI大牛纷纷离职!2021大厂AI Lab现状盘点,网友:名存实亡
导读:2021大厂AI Lab现状如何?网友总结了四个字,名存实亡.大多数人认为,国内像BAT等互联大厂的AI Lab面临最主要的现状便是定位不清,又要科研又要落地,处境尴尬. 2021年各家大厂 A ...
- 知乎热议!2021大厂AI Lab现状盘点,网友:名存实亡
新智元报道 ,来源:知乎 2021大厂AI Lab现状如何?网友总结了四个字,名存实亡.大多数人认为,国内像BAT等互联大厂的AI Lab面临最主要的现状便是定位不清,又要科研又要落地,处境尴尬. ...
最新文章
- grunt-connect-proxy解决开发时跨域问题
- kodi教程_KODI清理缓存插件安装设置教程
- AI理论知识整理(14)-矩阵的秩
- SDN自定义网络讲解(内部学习专用)
- 华人的战场——MSU视频编码大赛
- linux与mac os程序员,程序员为什么要使用或推荐Mac OS X?[关闭]
- Python django解决跨域请求的问题
- bzoj1053: [HAOI2007]反素数ant
- html怎么控制进度条,HTML如何实现进度条?附源码
- 机器学习算法总结之支持向量机(四)
- 六款值得推荐的android(安卓)开源框架简介
- 求解最大公因子(JAVA辗转相除法)、python的最大公因子,最小公倍数
- iOS camera 相关
- RIP基础原理与实验
- kafka 0.8.2版本配置选项翻译
- ubuntu11.10 sources.list 资源
- 修改hosts文件,解决端口占用方法
- 张量Tensor@最强分析
- C语言程序输入一个三位数取个位十位百位
- flutter压缩图片上传