作者 | 乔帮主打肖邦

https://zhuanlan.zhihu.com/p/498252976

春招已经接近尾声,今年互联网大厂都在裁员,上岸也变得更加困难。尤其是算法岗,学历背景好的人太多了,导致竞争也异常激烈。但光有学历还不够,面试主要还是看能力,今天就给大家分享一位23届双非硕士成功拿到字节算法岗offer的经历,字节的面试还是有一定难度的,以下为原文。

一.面试心路历程

本人是23届校招M同学,春招累计拿到10+家公司的 算法 offer( 字节跳动、腾讯、百度、网易 、58同城、智源研究院、 CVTE、 深信服等大中小公司),想跟优秀的人做点有挑战的事~~ 近期即将入职,春招得益于牛客上大佬们的面经,趁着工作开始前也来分享一下我自己的面经。

先罗列下个人的背景信息以供参考:

学历:广东某双非,本校考研上岸
论文:中科院sci二区期刊一作在投 + 一B会三作 + 一C 会三作
实习:一段小公司的算法实习经历
比赛:CCL比赛Top5名次
代码:leetcode 100+,面试手撕代码环节基本能ac;由于投的都是提前批或者内推,几乎没有笔试过。
基础:DL和NLP的相关知识面感觉还蛮广,但是做深的较少;ML相对薄弱一些;搜广推没系统学习过。
方向:NLP领域偏摘要生成这一块(面试官重点问的也是这方面)
嘴炮:这是很容易忽视的一项, “你很优秀”和“你能让面试官觉得很优秀”是有gap的 。自我感觉这次春招嘴炮属于中等、偶尔蹿稀。临场反应和freestyle发挥都挺好(看状态和0秒反应),反问环节的面试反馈通常也比较match,反而是我的网络信号经常不好影响面试(搞得我不得不去数信九楼楼道面试)。

下面是海投的部分公司视图(飞书YYDS!!!)

投过近10多家大中厂以及结果反馈

收到的offer展示:

字节跳动的offer

二.字节NLP算法面试经历

①字节跳动-一面(02.28) 1h

面试官声音挺温柔的。先跟我说本次的面试主要是分三个环节:自我介绍+聊项目+代码环节。然后直接开面:

自我介绍:(说一下自己的方向》各方面价值》标配了)

聊项目环节:

  1. 重点聊你觉得最 深挖的项目

核心是围绕 对话摘要生成做的一系列探索 :论文调研》论文成果放到项目落地》报告生成比赛。

  1. 做的的抽取式和生成式?

  2. 现在用的 评价指标 有哪些?

  3. 生成式摘要模型整体上是怎么样?

  4. 讲一下PGN生成模型?

  5. 讲一下TDS生成模型?聊聊苏神的space模型?

  6. NTM的结构能不能详细介绍一下?与VAE的区别?

  7. 摘要领域里面常见的 TextRank

  8. 现在 抽取式生成式 哪个效果更好?

  9. 摘要领域的数据集有哪些?

  10. 有没有了解中文的摘要数据集?

  11. 长文本摘要和对话摘要有什么区别?

  12. dialogue summarization的目的是干嘛?

  13. 对话摘要里面的摘要结果有没有角色呼应?

  14. 摘要生成怎么控制长短?

beam-search ,topk词。

  1. beam search 的窗口大小有多大关系?

  2. beam search以EOS为结束解码,解码时候遇到最大长度但是还没有解码符号?

  3. coverage mechanism(覆盖机制)是怎么样?

聊比赛环节:

  1. 说一下比赛的经过?这里问了一些问题,不太记得了,总体就是模型的选择、细节、输入输出的固定、还有维度问题等。

  2. 看你说做过java研发,那多线程和多进程有什么区别?python的线程锁了解过吗?

  3. 最后代码题:

编辑距离 :直接给了道编辑距离,刚好这几天有刷到这道题,dp表格法秒解了

整数幂 :一道hard一道medium,还得面向codetop刷题才行。

②字节跳动-二面- Leader面(03.07) 1h20分钟(面试官居家隔离好像信号有点差)

开端:自我介绍

  1. 着重讲一下报告生成比赛?比赛人数?

blablabla开始从任务背景》比赛指标 》选择方案 》模型选择和细节 》线上线下效果 》top1腾讯和top2平安科技是怎么做的》总结等

  1. 评价指标的介绍?

  2. Rouge-1和Rouge-2的召回率怎么算?

  3. 摘要有长度限制吗?

  4. 生成可读性 用哪个指标来衡量?

  5. 用了什么算法和模型?用的 EDA数据增强 的哪个?

  6. 对话有没有做变动?深入聊 数据增强

  7. 如何用置信度判断? 过拟合怎么解决

  8. 伪摘要的 提升?1个点左右提升,线上线下的提升?

  9. 除了数据增强,还有什么方案?

  10. 介绍 BIO方案 ?模型的token是一个字还是一个词?

  11. PGN与seq2seq的区别?

  12. 二阶段方案怎么做的?

  13. Bert、attention、transformer 区别联系?

这里讲了很多,把transformer从输入到输出中间细节包括Encoder、Decoder、musk机制、涉及到Layer Normalization、Batch Normalization的环节都详细讲了。

  1. 为什么encoding中直接加position位置信息能work?为什么不用一个变量让他剃度学习呢?

  2. self-attention的 多头注意力 的作用?好处?是不是越多越好?

  3. Bert的优缺点 有哪些??

四个优点,缺点:长度限制,语言改进tag,

  1. 把8个头改成16个头?模型的参数数量有什么变化?QKV的矩阵维度是多少?原来和改进后是多少?

16组QKV。_16*_768。

  1. LSTM对于梯度比RNN有什么改进?RNN梯度消失的求导有什么影响?RNN梯度消失了,梯度还有吗?是否为0?

  2. LSTM 相对比RNN有什么优点?

快车道 ,上下文,Forget gate等

  1. 代码题

最长公共子序列 (因为之前提到了rouge-L指标里面有最长公共子序列,就让我手写实现了)

最长回文子串

③字节跳动-三面-主管面(03.11)

面试官给我感觉的气场很足,看上去很有远见卓识或者很会带人。面试的体验也是挺不一样。

  1. 说一下你之前 没有讲到的一个项目或者比 赛?

因为之前一二面聊的比较多是比赛的东西,然后就跟面试官说聊下项目:从任务背景》评价指标》根据背景和指标选用的方案》模型细节》线上线下效果》具体部署平台,讲了下自己之前算法项目的经历。之后大部分时间也是交流项目。因为讲之前有先概括说一下,面试官也很快理解我的东西。

  1. 为什么没有顶会论文,说了下后面在投 COLING 了,讲一下 低频算法

把将要投的论文idea给面试官说了下,又不敢透露太多毕竟还没发(艰难)

  1. 问到说有没有了解过字节范,问我如何在技术上追求极致?

聊了下在在自己垂直领域用飞书 构造领域知识库 的经历。

  1. 实现无序数组抽出其中 Topk 的一个数?

手写快排 +最后优化成O(n),基操了。

写完面试官说我说话太快了,我觉得可能是因为他是北京那边可能口音听起来有点怪,本来以为有点凉凉。然后又说可以去北京带我。感觉又被捞起来了。

ps中间一个小插曲 :三面面试官也是挺不容易的,好像是那两天刚好字节本部发生疫情其被隔离了,然后三面面试时候突然有人敲门,然后面试官被叫过去做核酸emmm回来后跟我说是做鼻拭子说很酸爽,让我等他缓一下emmm

④字节跳动-HR面 (03.16)

催了几次,然后16号中午11点多给我电话,说北京那边缺人,叫我去北京干活,待遇也是字节标配了。

也不算面试,就直接说待遇,然后说去就给发offer。

大概1点多收到入职邮件,就这样前后花了近2周多面了三次终于斩获了字节算法offer。(三次面试的经历就字节和百度了,百度那个也oc了,个人感觉 字节百度 算是效率最快的了)

三.总结:

  1. 简历非常重要,非常重要,非常重要 ,可能要改自己的简历几十次并且让大牛或者导师帮忙看改简历,且一定要在面试前把自己简历上的东西确保都弄懂了。面试只有最多不超过1小时的时间,面试官要在有限的时间考察一个应试者,只能从简历入手提问。尽管技术知识千千万但总有自己不会的,这时候就要善于把会的放前面,不会的尽量不写或者不引导面试官问,而是把面试官引导到你会的技术的层面来发问(这里又涉及面试的大学问,篇幅有限就不赘述了)。

  2. 简历没问题了,就把涉及的比赛、项目、论文分别用 一张纸(杰哥推的秘籍) 写满相关的可能问题并做好提前的回答。基本上面试都是先聊比赛、项目、论文,或者面试官问你觉得做的最深入的是哪个然后深挖,这时候尽可能聊久点。聊久点点好处是能压缩后面面试官问算法八股的时间(如果论文、比赛、项目、实习全都没有,那就只能做好面试大半小时聊算法八股的问题,感觉最好还是争取搞个小项目放在简历上好给面试官聊更好,不然人家就只能跟你聊八股了(摊手))。

  3. AI算法基础八股这个就靠自己记忆实践了,无非就是Attenton、Transformer、Bert、LSTM、RNN、CNN、ML各种模型细节讲解以及一些常见 炼丹问题 的解决办法,特别是Attention必考八股了。这里不得不提一下我的同门biu,他提出的 paper式面试八股秘籍 思想很有料,核心原理是用写论文的思想来在面试回到问题,比如问到transformer为什么要用position encoding,他教我说在表达的时候要突出你与其他面试者在思考上的异同点,相当于让你在不同时空与竞争者pk,要怎么表达对于这个问题的理解才能比其他人讲的更出彩是个好问题。即“能按照八股回答好这个问题”和“能对比竞争者的八股回答讲解得出自己船新的理解并在不同时空对比其他竞争者在面试官的记忆里讲的更好”是有gap的。

  4. 字节内部有字节范(不懂的可以去搜下),在面试时候结合字节范来回答有加分,在主管面的时候亲测有加分。

  5. 据说字节的coding难度国内很顶了,上来就是leetcode-hard级别,但是其实出的题也有些也是高频的,把常见 贪心、动规dp问题(卡哥动规五板斧yyds)、链表、二叉树 搞懂,做点高频的编程题如 编辑距离、接雨水、子串子序列、topK问题 并深挖不同的解法有益处。个人强推 卡神随想录codetop编程 网站。

  6. 一定要早投简历,早做准备。话虽如此,但是准备肯定是不可能有充分的时候,所以一旦简历搞完》即刻就海投,先投2-3家小公司面试试试手,然后直接面大厂中厂积累经验。

  7. 春招的努力好比是跑毒初赛,有了实习,等秋招才有机会撬动更好的offer!

  8. 又回到简历:切记简历上的东西尽可能垂直,感觉会有加分。

最后引用一句话自勉:“ 年轻人,你的职责是平整土地,而非焦虑时光。做三四月的事,八九月自会有答案 ”。

附录:

ToC、ToB、ToG 联系区别[1]

不同产品的面相人群

如果觉得写的不错对你有一丢丢帮助到话,欢迎点赞收藏噢~~~

等你面试或者你关心的人面试的时候可以分享点滴经验~~

一起交流

想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定o要备注信息才能通过)

本文参考资料

[1]

ToC、ToB、ToG 联系区别: https://coffee.pmcaff.com/article/2348791734756480/pmcaff%3Futm_source%3Dforum

从双非渣硕到字节NLP算法,很强!相关推荐

  1. 【面试招聘】双非渣硕的秋招路

    NewBeeNLP原创出品 作者 | 带带大兄弟 写在前面 双非渣硕,0实习,3篇水文,三个给老板当打工仔的nlp横向项目,八月份开始准备秋招,纠结开发还是算法,开发的话菜而自知,算法也是菜而自知,最 ...

  2. 双非渣硕校招总结+Java面经(网易阿里百度等)

    作者:异地阳光. 链接:https://www.nowcoder.com/discuss/134850?type=0&order=0&pos=128&page=1 来源:牛客网 ...

  3. 一个双非渣硕的自我救赎之路

    AI尽在AI蜗牛车,关注我没毛病!! 作者:算法才是灵魂   转自:https://www.nowcoder.com/discuss/328830  授权文章,转载请联系作者 编辑:Che_Hongs ...

  4. 双非渣硕的秋招之路总结(已拿抖音研发岗SP)

    前言 最近应邀在牛客网写 C++ 求职专栏,又把以前的秋招总结补充了很多东西,现在想想还是发出来,希望能够帮助更多的新手小伙伴们. 个人情况简介 楼主本硕均读于双非院校(普通二本学校).本硕都是计算机 ...

  5. 双非渣本的实习秋招路

    大家好,我是阿豪,双非渣本菜鸡一枚,没颜值,没技术,没存款,没对象........ 步入正题: 生活篇: 刚开始,我是在亲戚家住,距离公司比较远,每天上下班都要坐一个多小时的地铁,早上六点多起床,洗漱 ...

  6. 双非渣本小Android四年磨一剑,秋招大厂(字节、腾讯、B站)面经分享

    前言 笔者2016年双非不知名小本科毕业,到今年6月已经开发4年啦,毕业后一直辗转于各种小公司做小开发.但是闲鱼也有翻身梦,一直想去大厂康康.就蹭蹭,不进去也行啊.于是计划几年年初金三银四的时候去碰碰 ...

  7. “双非”渣本投岗爱奇艺(Java),三轮技术面等消息,侥幸通过!

    01 个人情况 非211本科非计算机专业,没有任何实习经验 大大小小的公司一共投递60多家,不过也放弃了很多家(这里一定不要嫌麻烦,集中投简历确实是一件很枯燥的事情,但是为了增加求职成功的概率,是必须 ...

  8. 多所“双非”跻身软科高校排名百强,特斯拉上海工厂复工在即,余承东嫌汽车芯片单价太贵,今日更多大新闻在此...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 日报君 发自 凹非寺 量子位 | 公众号 QbitAI 大噶好,今天 ...

  9. 揭秘!双非渣本Android四年磨一剑,学习路线+知识点梳理

    第一次观看我文章的朋友,可以关注.点赞.转发一下,每天分享各种干货技术和程序猿趣事 由于涉及到的面试题较多导致篇幅较长,我根据这些面试题所涉及到的常问范围总结了并做出了一份学习进阶路线图​​​​​​​ ...

最新文章

  1. Eclipse 用Hibernate Tools 生成 .hbm cfg.xml等文件
  2. 香农定理和奈奎斯特定理区别_「中考复习」三大变换之旋转(旋转的构造-托勒密定理)...
  3. 肖婧医生直播讲稿整理
  4. Android之Dialog提示Unable to add window -- token is not valid; is your activity running?
  5. ROADS POJ - 1724(限制条件的最短路)【邻接表+深搜】
  6. Android studio Error occurred during initialization of VM 问题解决
  7. python eval函数格式_Python函数中eval函数知识点
  8. oracle的globalname后缀,在Oracle 11g下查看数据库的global_name
  9. 如何在 iPhone、iPad、Mac 和 PC 上设置 iCloud 照片共享?
  10. Linux系统中的nmap命令与netstat命令
  11. mac上面使用siege并发测试工具
  12. vehicle架构的想法
  13. Ubuntu下搭建SVN与Apache权限控制
  14. 前端面试官常问的问题
  15. [Go]获取当前时间戳秒/毫秒/纳秒 转成字符串string
  16. 上市连续12季高增长的秘密|多肽链对话1药网于刚
  17. kubernetes HPA使用及测试
  18. python灰帽编程_灰帽Python的Python
  19. 音乐多媒体播放的三种方式
  20. 绿豆APP源码苹果CMS影视插件版本原生JAVA源码

热门文章

  1. 常见的均值不等式的使用技巧
  2. 2022年蓝桥杯:第十三届蓝桥杯大赛软件赛省赛C/C++大学B组真题(考后回顾,文末附真题链接)
  3. spring-mybatis源码解析
  4. HTML Hover 的巧用。
  5. 使用Nexus搭建Maven私服教程(附:nexus上传、下载教程)
  6. python+openCV 自适应阈值分割
  7. coursera无法播放视频
  8. 【Canvas】js如何设置canvas绕图形中心旋转
  9. 激光导引头电子舱测试系统软件的研究与开发
  10. LTE 终端如何申请 RB 资源以及现实面临的问题