第一面:上来三道题,然后问基础知识

算法题:

  • 链表反转 简单题
  • 寻找字符串中最长的无重复的子串
    Leetcode 3. Longest Substring Without Repeating Characters
  • 选择字符串中最长的所有字母出现次数>=k的子串
    Leetcode 395. Longest Substring with At Least K Repeating Characters

基础知识:

  • 对C++熟悉吗?用过boost库吗?hive呢? 指针和引用有啥区别

  • 你对Linux熟悉什么?

  • 数据库中 having与where的区别(对数据库的SQL语句的了解)

    • “where”是一个约束声明,在查询数据库结果返回之前对数据库的查询条件做一个约束,即返回结果之前起作用,“where”后面不能跟聚合函数;
    • “having”是一个过滤声明,在查询数据库结果返回之后进行过滤,即返回结果之后起作用,“having”后面可以加聚合函数;
  • Xgboost对于lightgbm的改进? Gbdt or 随机森林呢?

  • LR的损失函数(极大似然估计+交叉熵损失函数)

  • LR为什么用极大似然估计,损失函数为什么是log损失函数(交叉熵)
    https://www.cnblogs.com/stAr-1/p/9020537.html

  • 交叉熵损失函数的公式,与极大似然损失的异同点呢?
    https://blog.csdn.net/weixin_37567451/article/details/80895309
    https://blog.csdn.net/b1055077005/article/details/100152102

第二面:上来先问项目,里面的实现的细节,最后做算法题

  • K-means算法的基本思想?项目中Kmeans中k是怎么确定的?什么时候迭代结束?
  • tf-idf的含义
  • 爬虫模块有延迟怎么办?
  • 你熟悉哪些深度学习中的算法? (围绕着深度学习问的)
  • Adam优化器的原理,深度学习中的其他优化器? (有哪些优化方法)
    mini-batch梯度下降法,Momentum梯度下降法,RMSprop以及Adam优化算法
  • 深度学习中如何解决梯度爆炸和梯度消失?
    batch normalazation,吴恩达上课说的初始化权重可以有效缓解这个问题
  • 如何防止过拟合呢?你用过哪些?
  • Bert原理,解决什么问题?
  • attention原理。为何你项目里不用maxpooling而是用attention(有什么好处),这里你是如何实现的?怎么设计的?
  • Sigmoid的公式?用它有啥优点或好处?

算法:

  • 二叉搜索树中查找比指定值小的最大值(考虑各种情况)
    https://www.cnblogs.com/xiayy860612/archive/2012/10/16/2726861.html

写代码需要更快,而且是最优解。(也有需要和面试官稍微沟通,但是面试官希望的是直接做题,告诉他正确思路直接写代码,然后给代码给他看)

学习相关知识

  • 一文搞懂极大似然估计 https://zhuanlan.zhihu.com/p/26614750

L2正则化为何能避免过拟合?

  • 一:直觉上,正则化参数设置很大,让参数W很小,甚至很多为0,减少许多隐藏单元的影响,最终这个网络会变得更简单。
  • 二:如果正则化参数(W^2前的系数)变得很大,参数W很小,z也会相对变小,此时忽略b的影响,z会相对变小,实际上,z的取值范围很小,这个激活函数,也就是tanh曲线函数会相对呈线性,整个神经网络会计算离线性函数近的值,这个线性函数非常简单,并不是一个极复杂的高度非线性函数,不会发生过拟合。

dropout为何能避免过拟合?

  • 直观上理解:不要依赖于任何一个特征,因为该单元的输入可能随时被清除,因此该单元通过这种方式传播下去,并为单元的四个输入增加一点权重,通过传播所有权重,dropout将产生收缩权重的平方范数的效果,和之前讲的L2正则化类似;实施dropout的结果实它会压缩权重,并完成一些预防过拟合的外层正则化;L2对不同权重的衰减是不同的,它取决于激活函数倍增的大小
  • 第二个直观认识是,我们从单个神经元入手

batch normalization

Z = WX + b
a = sigmoid(Z)

对每一层的Z值进行归一化,然后服从某种分布,比如均值为beta, 方差为gama的分布(两个参数),每一层的分布可以不同。

Batch Norm 为什么奏效?

  • 原因一:
  • 原因二:

抖音算法实习生面经(一面+二面)相关推荐

  1. 抖音推荐机制算法,抖音算法推荐模式,抖音算法机制流程图

    大家好!我是依然,不同的平台有不同的算法规则和玩法,抖音平台的算法规则是指引大家创作视频内容的风向标,也是打造爆款视频必不可少的入门钥匙.如果在创作内容的过程中忽略了这些算法规则和推荐机制,那么个账 ...

  2. 抖音算法揭秘,百万粉丝的背后逻辑

    抖音算法揭秘,百万粉丝的背后逻辑 抖音如何让上热门? 百度有百度的算法.微信有微信的算法.头条也头条的算法,算法是任何平台必不可少的机制,今天就来分享一下抖音的算法机制. 一.科普 算法是什么? 简单 ...

  3. 抖音算法推荐机制详解

    抖音算法推荐机制详解!(科普向) 众所周知抖音的流量分配是去中心化的,这种去中心化算法,让每个人都有机会爆红,可为什么别人几个粉玩抖音,就能轻松获得10w+点赞?而你怒拍几十条也枉然? 抖音的游戏规则 ...

  4. 抖音算法推荐机制详解!(科普向)

    点击上方,选择星标或置顶,每天给你送干货! 文 | 金钱兽@知乎 编 | 夕小瑶的卖萌屋 众所周知抖音的流量分配是去中心化的,这种去中心化算法,让每个人都有机会爆红,可为什么别人几个粉玩抖音,就能轻松 ...

  5. 分析抖音算法推荐机制

    本文转载自知乎@金钱兽! 下面直接进入正题: 众所周知抖音的流量分配是去中心化的,这种去中心化算法,让每个人都有机会爆红,可为什么别人几个粉玩抖音,就能轻松获得10w+点赞?而你怒拍几十条也枉然? 抖 ...

  6. 抖音算法2023届秋招快上车

    Hei 同学 2023届秋招 抖音推荐算法团队了解一下     作为全球领先的短视频平台,抖音系app的日活用户数突破7亿!Data-抖音团队负责抖音的算法/数据科学,直接为用户体验负责,涉及电商,直 ...

  7. 国仁网络资讯:抖音都有哪些运营技巧;抖音算法机制是什么?

    如今许多远见卓识的公司,像小米.蒙牛.格力.海底捞等知名品牌,已经认识到抖音短视频的巨大商业价值,早已纷纷入驻抖音短视频. 那,大家该怎样把握住新时代机遇,打造出1个能挣钱的热款抖音短视频号呢? 1. ...

  8. 抖音无水印视频爬虫(二)——爬虫的实现

    抖音无水印视频爬虫(二)--爬虫的实现 前面的抖音无水印视频爬虫(一)--踩坑,已经讲了相关的原理以及实现的过程 一.环境&Python Modules 1.OS:Deepin 15.10.1 ...

  9. 11月第1周业务风控关注|抖音算法滋生群控系统:百部手机人工刷 1万播放量仅7毛

    易盾业务风控周报每周呈报值得关注的安全技术和事件,包括但不限于内容安全.移动安全.业务安全和网络安全,帮助企业提高警惕,规避这些似小实大.影响业务健康发展的安全风险. 1.抖音算法滋生群控系统:百部手 ...

最新文章

  1. RESTful之自动生成接口文档
  2. 重磅:ATT的《5G移动边缘计算白皮书》!
  3. 一文深入理解协同过滤
  4. P1305 新二叉树
  5. 8皇后以及N皇后算法探究,回溯算法的JAVA实现,递归方案(一)
  6. 使用Spring Roo进行快速云开发–第1部分:Google App Engine(GAE)
  7. mysql数据库(10):数据 备份
  8. 【Android开发坑系列】之PopupWindow
  9. Mysql:SQL语句:DML语句
  10. 解决Word 2007中更新整个目录后分节符消失问题
  11. 项目:关于分层,DAO、domain、service、servlet的一些理解
  12. 如何在一年内从零基础到前端就业?
  13. 基于matlab的音频处理论文,基于Matlab的语音信号处理与仿真设计毕业论文
  14. 计算机管理员英文是什么,超级管理员,超级管理员是什么,超级管理员英文 | 帮助信息-动天数据...
  15. 【业余无线电】-海兴通SZ-666D信道编程
  16. 英克软件结合oracle,英克科技医药行业销售管理系统
  17. lt18i android 2.3.4典藏版,索尼LT18i一键ROOT教程工具 2.3.4已亲测成功
  18. linux运行blast,linux blast
  19. 【Python学习笔记】- 06 函数式编程
  20. 公众号如何获得关注粉丝openid?

热门文章

  1. C语言实现飞翔的小鸟小游戏
  2. 一款Java神仙接私活项目,吊到不行!
  3. php - 解决百万级全站用户消息推送问题
  4. 1+X证书web前端开发(中级)部分习题整理(题源来自奥鹏教育)
  5. 465端口发邮件php,在centos上打开端口465 for smtp的问题
  6. 腾讯云通信WebIM事件回调的坑~
  7. 基于候鸟优化算法(MBO)的柔性车间调度优化研究(Matlab代码实现)
  8. Altium Designer快捷键布线无法实现网络线自动编号
  9. Android程序员春招三面蚂蚁金服,7年老Android一次坑爹的面试经历,先睹为快
  10. 在centos7中使用telnet