20220412百度笔试—机器学习/数据挖掘/自然语言

文章目录

  • 20220412百度笔试—机器学习/数据挖掘/自然语言
  • 一、选择题30道(60分)
  • 二、问答题1道(20分)
  • 三、系统设计题1道(30分)
  • 四、编程题2道(40分)

此次笔试分A卷(C++)和B卷(JAVA)。

一、选择题30道(60分)

考察内容涉及:数据结构、熟悉C++、概率论、线性代数、离散数学、计算机网络、操作系统和机器学习。

部分题目:

  • 用于多分类任务的激活函数:Softmax
  • TCP首部的确认号字段ACK
  • GMM-HMM模型
  • 朴素贝叶斯模型
  • 特征向量
  • SGD随机梯度下降法
  • 随机森林算法
  • 强连通图:n个顶点,最多有n*(n-1)条边;最少有n条边
  • 红黑树的高度
  • 完成二叉树的高度
  • 最长公共前后缀
  • 冒泡排序的比较次数
  • C4.5使用的属性划分标准:信息增益率

二、问答题1道(20分)

在离线训练点击率预估模型的过程中,验证集的AUC显著提高,但上线后效果不佳,分析其原因。

我的回答:

在离线训练点击率预估模型的过程中,题目中只提到了验证集的AUC显著提高,没有提及训练集的AUC效果如何,故从以下方面分析上线后排序效果差:
1.模型训练次数太少,泛化能力差。
2.模型过拟合:此种情况下,模型过度拟合了训练集数据的特征,导致实际使用中效果差,泛化能力差。
3.用于训练的数据过少,模型特征提取能力差,导致实际使用效果差。
4.训练集和验证集不具备代表性,或者训练数据集中的噪声影响了模型的训练。
5.所训练的模型不适合该类问题,模型设计过于复杂或者过于简单,应更换其他模型尝试解决该类问题。

三、系统设计题1道(30分)

产品还没上线,设计一个音乐引擎推荐系统,有30万首候选歌曲,无用户数据。

四、编程题2道(40分)

  1. 小明最近经常会思考一些关于整数的问题。今天他想到这么一个问题: 现在有n个整数,其中有些整数相同,也有一些整数不相同。首先需要找出其中出现次数最多的整数,如果出现次数最多的整数不唯一,则找出其中值最大的整数,记为M;然后再找出其中出现次数最少的整数,如果出现次数最少的整数不唯一,则找出其中值最小的整数,记为N;最后计算M和N的差,即输出(M-N)。 请你编写一个程序帮助小明解决这个问题。
# 样例输入
10
1 2 1 3 5 4 2 1 3 3
# 输出
-1
# 解释:1和3出现了3次,M为3;4和5出现了1次,N为4.M-N=-1
#通过率:100%
import collections
if __name__ == "__main__":# n个整数n = int(input().strip())line = input().strip().split()nums = [int(num) for num in line]count = collections.Counter(nums)ans = sorted(count.items(), key=lambda x: (x[1], x[0]))print(ans)M = ans[-1][0]N = ans[0][0]print(M - N)
  1. 小Pa无意之间得到一个长度为N的序列,但是他喜欢单调递增的序列,他找到了魔法师小Ka,想让他对于任意位置的i通过魔法将Ai变成Bi,请你告诉小Pa最少施展多少次魔法可以变成单调递增的序列,如果不可能请输出 -1。
# 样例1
5
1 2 3 4 5
2 3 4 5 6
# 输出
0# 样例2
6
1 8 3 6 7 5
1 2 3 6 9 7
# 输出
-1# 样例3
6
1 8 3 6 7 5
1 2 3 6 9 8
2
#通过率:90%
if __name__ == "__main__":# 序列长度nn = int(input().strip())# 序列aline = input().strip().split()a = [int(num) for num in line]# 序列bline = input().strip().split()b = [int(num) for num in line]ans = 0i = 0count = 0while i != n - 1:while i < n - 1 and a[i] < a[i + 1]:i += 1if i == n - 1:break# 此时a[i]>a[i+1]if b[i] < a[i + 1]:a[i] = b[i]count += 1elif b[i + 1] > a[i]:a[i + 1] = b[i + 1]count += 1else:i += 1flag = Truefor i in range(n - 1, 0, -1):if a[i] < a[i - 1]:flag = Falsebreakif not flag:count = -1print(count)

【2022春实习】百度笔试记录(机器学习/数据挖掘/自然语言)相关推荐

  1. 2022.4.19百度笔试记录

    尝试了一下百度的笔试,记录一下过程. 首先是选择题,20道选择题,考的啥都有,Java,Linux,算法,SQL语句,操作系统,很乱很杂,都记不起来了,这里就不过多说了. 然后是三道编程题. 第一题: ...

  2. 【数据挖掘】百度机器学习-数据挖掘-自然语言处理工程师 历史笔试详解

    百度:机器学习/数据挖掘工程师/自然语言处理 历史笔试题 为了准备2023届毕业生的秋招汇总的网上分享的题目,自己进行的解析整理 1.用于多分类任务的激活函数 Softmax 2.TCP首部的确认号字 ...

  3. 2023春实习笔试题记录

    文章目录 美团 3.25 1 模拟栈 2 最大美味值 I 3 每个背包最多装巧克力个数 4 类 Redis 实现 5 最大美味值 II 美团 4.1 1 计算练习 18/100 2 最小差距和 100 ...

  4. 【深度学习】李宏毅2021/2022春深度学习课程笔记 - 机器学习的可解释性

    文章目录 一.为什么我们需要可解释性的机器学习 二.可解释性的 vs 强大的(Powerful) 三.可解释性机器学习的目标 四.可解释性的机器学习 4.1 Local Explanation 局部的 ...

  5. 2020春招百度笔试之小度买果汁

    小度买果汁 代码AC了,大概是: 果汁买一送一 n个人,果汁一共有k种,每个人有各自喜欢的口味, 输入描述 第一行两个整数n,k分别表示员工人数和果汁种类数. 第二行n个整数,表示i号员工最喜欢的果汁 ...

  6. 2022春招前端实习面经【美团、钉钉、快手、字节、招行、百度、拼多多、腾讯】(未完)

    文章目录 面试心得 美团-到店事业群-餐饮SaaS 一面复盘记录 JS/前端杂项 操作系统 计算机网络 算法题 二面复盘记录 JS/前端杂项 操作系统 算法 阿里-钉钉-基础平台 一面复盘记录 JS/ ...

  7. 2022春招和暑期实习快结束了!

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 大家好,我是Amusi!2022 春招已经快结束了,2023届暑期实习已经进入中后期了!甚至有些公司的202 ...

  8. 2021网易游戏雷火2021春招游戏功能测试工程师 笔试记录----春招补录

    目录 2021网易游戏雷火2021春招游戏功能测试工程师 笔试记录----春招补录 单选题 逻辑题 问:最坏情况下,教授问到第几个学生,学生才知道自己头顶帽子的颜色? 2021网易游戏雷火2021春招 ...

  9. 李宏毅2021/2022春机器学习课程(机器学习基本概念简介)

    (强推)李宏毅2021/2022春机器学习课程_哔哩哔哩_bilibili 目录 1.机器学习是什么? 2.机器学习任务 2.1 regression回归问题 2.2 classification分类 ...

最新文章

  1. 深度文本匹配在智能客服中的应用
  2. java 成员变量 成员方法_《Java基础知识》Java成员变量,成员方法,构造方法和析构方法...
  3. apache tomcat 整合
  4. 2014编程之美热身赛 - 传话游戏
  5. Django2.2-LookupError No installed app with label admin
  6. 《 廊桥遗梦 》:用我的整个余生和全部的心来爱你 ...
  7. 你的 GNN,可能 99% 的参数都是冗余的
  8. HTML 去调table表单里面td之间的间距
  9. linux下安装VMware Tools
  10. 联想x100e linux,进化之道!ThinkPad X100e全球首发测试
  11. python小星_Python学习【第3篇】:列表魔法
  12. 面试问到处理过什么棘手问题_为什么调节人工智能如此棘手?
  13. 第七章 Git操作 7.1利用gitee提交代码
  14. latex : 常见编译错误记录
  15. linux 常见服务
  16. 老牌破解神器L0phtCrack强势回归 口令破解速度提升500倍
  17. 计算机表格大小怎么调整,excel怎么调整表格大小
  18. n张图像合成一个长图
  19. 5,10,15,20-四苯基卟啉(TPP)及金属配合物FeTPP/MnTPP/CuTPP/ZnTPP/NiTPP/CoTPP/PtTPP/PdTPP/CdTPP齐岳供应
  20. jzxx1177买蛋糕II

热门文章

  1. 2020年最新android端前沿技术架构
  2. seo是计算机专业毕业,本科计算机专业的他,在34岁时成为了银行行长
  3. pp2使用需要java_IE10 PP2新特性详情
  4. 远赴人间惊鸿宴,云台山风景区上见初雪
  5. java curses_Linux Unix C 中的curses库——curses.h
  6. 一次函数和正比例函数的介绍
  7. Android使用FFmpeg开发播发器(一)编译FFmpeg
  8. Python入门(九)正则
  9. Win7中如何卸载IE9
  10. 树莓派启用root账号