DeeCamp Exam A 2019-04-27

  • Radio: 5
  • blank: 5
  • QA: 1
  • Time: 90min

总的来说,感觉比去年简单多了(害啪 ?

update 一下 评论 已经有 dalao 给出第八题 思路 感谢 @熊怡 dalao

思路一:

转换为 d 维空间 n 刀切最多能分为多少块?

d 维空间中 n 刀切蛋糕最多能切多少块?求 f(d,n)

思路二:

从手机状态角度来看,每个手机只有(有人看过)(没人看过)两种状态,通过手机间状态的组合,能表示出 2n2^n2n 种状态。

1

在一个 0/1 二分类任务中:
我们训练了一个神经网络,对于每个样本点,其输出为样本是 1 类的概率;
通常,我们会设置一个 threshold,如果预测的概率大于此值,则分类为 1 类,反之为 0 类;
假设,当 threshold=0.5 时,预测结果的 precision 和 recall 为 0.8,0.8
此时,把 threshold 调高到 0.6 则最有可能的 P,R 分为为
A 0.9 0.9
B 0.9 0.7
C 0.7 0.9
D 0.7 0.7

二分类中 Precision, recall 均指正类的 P R

真实-预测 1 0
1 TP FN
0 FP TN

p=TPTP+FPp=\frac{TP}{TP+FP}p=TP+FPTP​
r=TPTP+FNr=\frac{TP}{TP+FN}r=TP+FNTP​

当提高 Threshold 时,预测为 1 的样本数量减少

即 TP + FP 减少, FN + TN 数量增大

  1. 若 TP 数量不变,则 P 变大,r 不变或者减少
  2. 若 TP 数量减少,则p=TPTP+FP=1−1TP/FP+1p=\frac{TP}{TP+FP}=1-\frac{1}{TP/FP+1}p=TP+FPTP​=1−TP/FP+11​
    • 可以看出 p 与TPFP\frac{TP}{FP}FPTP​成正相关
    • 当 TPFP\frac{TP}{FP}FPTP​ 增大时,p 增大
    • 反之,p 减小
    • 此情况下 recall 均会减小

初始时,TPFP=4\frac{TP}{FP}=4FPTP​=4,当 threshold 变大时 1 类中正确的比例应该增大,故 0.9 0.7 更有可能

2

下列函数不是凸函数的是
A f(z)=max⁡(0,1−z)f(z)=\max (0,1-z)f(z)=max(0,1−z)
B f(z)=z3f(z)=z^{3}f(z)=z3
C f(z)=exp⁡(−z)f(z)=\exp (-z)f(z)=exp(−z)
D f(z)=log⁡(1+exp⁡(−z))f(z)=\log (1+\exp (-z))f(z)=log(1+exp(−z))

凸函数直观的感觉就是图像往下凸的

可以用二阶导大于 0,若不可导,则判断对于任意 x,y 是否满足f(y)⩾f(x)+f′(x)(y−x)f(y) \geqslant f(x)+f^{\prime}(x)(y-x)f(y)⩾f(x)+f′(x)(y−x)

凸函数

3

GoogleNet 中 1 × 1 卷积的作用
A 降维
B 减少参数
C 跨通道通信
D 以上三项都对

  • One by One [ 1 x 1 ] Convolution - counter-intuitively useful
  • What does 1x1 convolution mean in a neural network?
  • 卷积神经网络中用 1*1 卷积有什么作用或者好处呢?

4

考虑一个 0/1 二分类模型,模型的参数为实数 w,b,输入为一个实数 X,输出 Y 的表达式为
Y={1,if w∗X+b>00,otherwise Y=\left\{\begin{array}{ll}{1,} & {\text { if } w * X+b>0} \\ {0,} & {\text { otherwise }}\end{array}\right.Y={1,0,​ if w∗X+b>0 otherwise ​
假设我们的训练集中包含 N 个样本点,(无重复点) 以及样本点对应的标签
请问当 N 最大是多少时,不论训练集 X 和 Y 的取值如何,都能得到一个训练误差为 0 的模型
A 2
B 3
C 4
D 大于 4

相当于,问最多几个点能由一根线分隔开

显然四个点就不行了

5

下面是一段 py code,当 n 很大很大的时候,输出值会趋近于何值?
A 1334323 / 1679616
B 1334324 / 1679616
C 1334325 / 1679616
D 1334326 / 1679616

import random
def foo(n):x = 6y = 1000000count = 0for i in range(n):cur = yprint(i)while cur > 0:i = random.randint(0, x - 1)if i > cur % x:breakelif i < cur % x:count += 1breakcur = cur // xreturn count /n

这道题,稍微有点意思,看代码,大概是做一个随机采样的工作

  • 当采样值 > cur % 6,停止采样
  • 当采样值 < cur % 6, count += 1 停止采样
  • 当采样值 == cur % 6, cur = cur // 6,继续采样

可以看到随着 n 的次数的增大,越接近采样的概率期望值

  • 1000000 % 6 = 4
  • 166666 % 6 = 4
  • 27777 % 6 = 3
  • 4629 % 6 = 3
    。。。

我们可以看到取余值不是一个定值,于是写个循环来计算一下期望

def mean():begin = 1000000cur = begincount = 0num = 0.0while cur > 0:temp = cur % 6num += ((temp) / 6) * pow((1/6), count)count += 1cur = cur // 6return num

6

如果你用计算机进行一项计算任务 T,其中子任务 T(a)在的计算机内部模块 A 的处理时间为整个任务处理时间的 40%
现假设模块 A 的速度提升为原来的 10 倍,其他不变,这整个计算任务回提速为原来的_ 倍(保留三位小数)

额,送分题

7

假设你训练了一个线性回归模型,y=w1×x1+w2×x2+w3×x3+by=w_1 \times x_1+w_2\times x_2+w_3 \times x_3+by=w1​×x1​+w2​×x2​+w3​×x3​+b
其中X=[x1,x2,x3]X=[x1,x2,x3]X=[x1,x2,x3]为输入,[w1,w2,w3,b][w1,w2,w3,b][w1,w2,w3,b]为模型的参数
已知,当X=[1,2,3]X=[1,2,3]X=[1,2,3]输出 1,X=[−1,1,4]X=[-1,1,4]X=[−1,1,4]时,输出 2
当X=[0.6,1.8,3.2]X=[0.6,1.8,3.2]X=[0.6,1.8,3.2],输出多少

(感觉回到了高中 hhh

  • W[1,2,3]+b=1W[1,2,3]+ b=1W[1,2,3]+b=1
  • W[−1,1,4]+b=2W[-1,1,4]+ b=2W[−1,1,4]+b=2
  • W[0.6,1.8,3.2]+b=?W[0.6, 1.8, 3.2] + b=?W[0.6,1.8,3.2]+b=?

m[1,2,3]+n[−1,1,4]=k[0.6,1.8,3.2]m[1,2,3]+n[-1, 1, 4] = k[0.6, 1.8, 3.2]m[1,2,3]+n[−1,1,4]=k[0.6,1.8,3.2]

=> 4M+N5=W[0.6,1.8,3.2]+b=1.2\frac{4 M+ N}{5}=W[0.6, 1.8, 3.2] + b=1.254M+N​=W[0.6,1.8,3.2]+b=1.2

8

老版微信中,【看一看】有【朋友阅读的原创文章】功能,当一位好友阅读某文章后,该文章就会被系统匿名推荐显示在你的微信【看一看】中。如果参数逐一删除好友,直到删除好友后该推荐文章即可消失,就可推断 TA 在看该篇文章。
假设

  1. 你有 888 位微信好友
  2. 你有多部手机,每部手机对应一个微信账号,你可以任意分配组合每部手机里面的微信好友(不限数量,可重复)
  3. 一篇推荐的文章最多只被一位好友阅读
    问; 现在你被推荐了一篇文章,在不删除好友、不进行变更好友组合的前提下,至少需要几部手机才能才能太通过便览各个手机的文章显示情况就能知道谁在看这篇文章

思路一:

转换为 d 维空间 n 刀切最多能分为多少块?

d 维空间中 n 刀切蛋糕最多能切多少块?求 f(d,n)

思路二:

从手机状态角度来看,每个手机只有(有人看过)(没人看过)两种状态,通过手机间状态的组合,能表示出 2n2^n2n 种状态。

9

小刚用 C 语言实现了一个 print——bytes 函数,输入 x 为一个无符号的 32 位整形(4 个字节),然后将这四个字节依照在内存中的存储地址,由低到高依次输出每个字节对应的数字,
数字连续,例如 0x01, 0x0a, 0x02, 0x0b, 则输出 110211
若在小端计算机中,调用该函数输出 012345,则 x 最大值为

0 一定是低位,然后依次推

10

MNIST 6w × 28 × 28 的手写字母数据集
把 4 张按 14 × 14 剪开,打乱,让你找出这 4 张具体是啥

DataSet: 链接:https://pan.baidu.com/s/1RK1Yz1hVSnFaogRsZHZ0Eg 密码:o6ui

暴力遍历,(比较奇怪的是为啥用 jit 之后还更慢了,摊手

from  numba import jit
def read_data():data = np.load('mnist.npz')x_train = data['x_train']y_train = data['y_train']crops = data['crops']return x_train, y_train, crops@jit
def load():picture_list = []for ii in x_train:picture_list.append(ii[0:14, 0:14].copy())picture_list.append(ii[14:28, 0:14].copy())picture_list.append(ii[0:14, 14:28].copy())picture_list.append(ii[14:28, 14:28].copy())return picture_list# @jit
def search(picture_list, corps):result = []for ii, jj in enumerate(picture_list):for kk, mm in enumerate(crops):if (jj == mm).all():result.append((ii, kk, y_train[ii // 4]))# print(ii, kk, y_train[ii // 4])return resultdef judge():start = time.time()x_train, y_train, crops = read_data()picture_list = load()result = search(picture_list, corps)result_id = [ii[0] for ii in result]result_num_pre = [ii for ii in result_id if ii +1 in result_id and (ii + 2 in result_id) and (ii + 3 in result_id)]result_num = [y_train[ii//4] for ii in result_num_pre]print(result_num)print('{:.2f}s'.format(time.time() - start))

DeeCamp 2019 Exam A 纪实相关推荐

  1. 周志华、张潼亲自辅导AI课程,DeeCamp 2019正式启动

    4 月 8 日,创新工场对外宣布 DeeCamp 2019 人工智能训练营正式启动. 据介绍,DeeCamp 2019 将于 7 月 15 日至 8 月 23 日在北京.上海.南京.广州四地同时举办. ...

  2. [胡搞]Deecamp 2019 第二次考试B卷笔试知识点回忆

    上一年的平台不稳定,掉线了没交上去.虽说是开卷,太怂了没敢上网查,哗哗翻书.这一年已知大概没时间去,参加一场看看今年出的题.然后电脑半天没充上电开不开机(愚蠢的我插在了一个没接电的插排上),一个半小时 ...

  3. DeeCamp2021启动,李开复张亚勤吴恩达等大咖喊你报名啦

    转载自 创新工场:chuangxin2009 量子位 编辑 | 公众号 QbitAI 十年后的世界是什么样的?在AI带来的X量级加速下,我们将迎来什么样的新生活? 也许那时,AI可以让说着各种不同语言 ...

  4. 李开复从不缺席的AI夏令营开营:今年周志华俞勇张潼授课,1万人报名仅600入选...

    李根 发自 雁栖湖の国科大  量子位 报道 | 公众号 QbitAI 李开复很忙,但再忙都不会缺席这个AI夏令营. 昨晚刚下国际航班,今早就如约出现在京郊雁栖湖的国科大校区,而且现场的数百个学生还不是 ...

  5. 工程师到谷歌_我如何在2020年通过Google专业数据工程师考试

    工程师到谷歌 Want to get this certification? Well it is not an easy one. You'll need to do the homework. F ...

  6. 长沙互联网活动基地2019年年会活动纪实

    长沙互联网活动基地2019年年会活动纪实 值此旧历年2018年行将结束,而新历2019年已经到来之际,作为长沙本土IT社群发起者和主要参与者的长沙互联网活动基地,广泛邀请了包括长沙联通,兴盛优选.新长 ...

  7. IBM Cloud Computing Practitioners 2019 (IBM云计算从业者2019)Exam答案

    Cloud Computing Practitioners 2019 IBM Cloud Computing Practitioners 2019 (IBM云计算从业者2019)Exam答案,加粗的为 ...

  8. 北邮计算机学院崔哲域,邂逅北邮 是最美的期待—北京邮电大学2019级本科生开学典礼采访纪实...

    8月25日,北京邮电大学2019级本科生开学典礼在沙河校区举行.19级新生们聆听了师长们的谆谆教诲与美好祝福,开启了对美好大学生活的憧憬与希望.请跟随小编的镜头走近这些充满新时代青春气息.朝气蓬勃的萌 ...

  9. DeeCamp 2020 赛题大公开!快来看你想选哪个

    DeeCamp 2020 开放性竞赛赛题来啦,快来看看有没有你感兴趣的题目!加入DeeCamp2020,你将和来自全球的优秀小伙伴组队挑战真实世界的难题,还能冲刺大奖.五大赛道,14个新颖赛题,总有一 ...

  10. AI真人表情包、斗地主AI......DeeCamp学员做了50个好玩又实用的AI项目

    8月16日,2019 DeeCamp人工智能训练营的结营仪式上,展示了600名DeeCamp学员的50个AI实践课题. 结营仪式上,由2019 DeeCamp学员组成的6个项目小组作为代表,现场展示了 ...

最新文章

  1. 无人车时代:用深度学习辅助行人检测
  2. 五种方法创建 Java 对象,你知道几种呢?
  3. 高等数理统计(part1)--随机变量及其分布函数
  4. C++20 系列(一)- Hello C++20
  5. 转储sql文件_在Linux上SQL Server中更改SQL转储文件位置
  6. 【codeforces】【比赛题解】#937 CF Round #467 (Div. 2)
  7. python科学计算之Pandas使用(三)
  8. 关卡七、家庭收支记账系统
  9. 直通车测图需要满足哪些数据?
  10. python re 替换_python字符串替换之re.sub()
  11. 单片机——A/D数模转换篇
  12. android 拼音字母语音,拼音发音点读app
  13. php动态创建菜单,php创建无限级树型菜单
  14. 堆排序(大根堆与小根堆)
  15. UART 波特率选择的认识与理解
  16. 计算机二级系统班C语言讲义,计算机二级C语言讲义8
  17. LeetCode 1 Two Sum
  18. 两个数的最大公约数和最小公倍数的求法
  19. IT业的未来主导将是软件业
  20. 【UVM实战】第五章:UVM验证平台的运行(1)phase机制(上)

热门文章

  1. html5中nav标签(导航链接)的详细介绍
  2. 摄影基础知识——焦点
  3. VNC 远程中标麒麟桌面版
  4. 七个习惯之一:积极主动
  5. 大数据新闻推送你怎么看_人工智能选角大数据推送
  6. vue设计调查问卷:换个思路解决问题
  7. 计算机中的c盘d盘,怎么把电脑中的D盘转换成C盘并删除原C盘系统
  8. python中while用法
  9. 网站视频倍速播放和进度自定义调整
  10. 如何打造一个高效的研发团队