1.简述数据库以及线程死锁产生的原理及必要条件,简述如何避免死锁。(10分)

2.请列举面向对象设计的三个基本要素及五种主要设计原则。(10分)

参考:

三个基本要素:封装、继承、多态。

五个基本原则:

1)单一职责原则:就一个类而言,应该仅有一个引起它变化的原因。

2)开放封闭原则:软件实体对外扩展开放,对修改封闭。

3)里氏替换原则:子类的实例能够替换父类的实例。

4)接口分离原则:采用多个专门的接口比使用单一的总接口要好。一个类对另一个类的依赖性建立在最小的接口上。

5)依赖倒置原则:依赖抽象不要依赖具体实现。

3.简述windows内存管理的几种方式以及优缺点。(10分)

参考:

(1)块式管理。把主存分为一大块、一大块的,当所需的程序片段不在主存时就分配一块主存空间,把程序片段加载到主存,就算所需要的程序片段只有几个字节也只能把这块分配给它。优点:易于管理;缺点:浪费空间。

(2)页式管理。把主存分为一页一页的,每一页的空间要比一块一块的空间小很多,显然这种方式的空间利用率要比块式管理高出很多。

(3)段式管理。把主存分为一段一段的,每一段的空间又要比一页一页的空间小很多,这种方法在空间利用率上比页式管理高出很多,但也有另外一个缺点,一个程序片段可能会被分为几十个段,这样很多时间就会浪费在计算每一段的物理地址上。(I/O操作)

(4)段页式管理。结合了段式管理和页式管理的优点。把主存分为若干页,每一页又分为若干段。

1.公司组织一次羽毛球比赛,采用淘汰制,假设公司共有1001个人,如果要评出“公司羽毛球第一高手”的称号,至少需要进行多少场比赛?请简述设计过程,并编写代码模拟比赛过程(语言不限,可以使用伪代码)。(15分)

def baidu1():pNum = 1001total_gNum = 0count = 0while(pNum > 1):gNum = pNum/2         # 此轮比赛的场数,也是参赛后胜出的人数direct = pNum%2       # 此轮直接晋级的人数pNum = gNum + direct  # 此轮胜出总人数count += 1            # 第几轮total_gNum += gNum    # 比赛总场数print "第 %d 轮,胜出 %d 人" % (count, pNum)return total_gNum# 测试结果
>>> baidu1()
第 1 轮,胜出 501 人
第 2 轮,胜出 251 人
第 3 轮,胜出 126 人
第 4 轮,胜出 63 人
第 5 轮,胜出 32 人
第 6 轮,胜出 16 人
第 7 轮,胜出 8 人
第 8 轮,胜出 4 人
第 9 轮,胜出 2 人
第 10 轮,胜出 1 人
1000
# 至少要进行1000场比赛才能选出最好的选手

2.一百个灯泡排成一排,第一轮将所有灯泡打开;第二轮每隔一个灯泡关掉一个,即排在偶数的灯泡都被关掉。第三轮每隔两个灯泡,将开着的灯泡关掉,关掉的灯泡打开。以此类推,第100轮结束的时候,还有几盏灯泡亮着?(15分)

def baidu2():l = [0]*100for i in range(1,101):for j in range(100):if (j+1)%i == 0:l[j] += 1r = []count = 0for k in range(100):if l[k]%2 != 0 :r.append(k+1)count +=  1return r, count
# 测试结果
>>> baidu2()
([1, 4, 9, 16, 25, 36, 49, 64, 81, 100], 10)

3.k近邻方法(k nearest neighbor)是常用的分类算法之一,给定训练数据集D=(xi,yi),i=1…n,其中xi∈Rp是一个p维实数空间中的向量,yi∈{0,1}是xi对应的类标。(15分)

①给定一个待分类样例x∈Rp,要求获得他的预测分类y∈{0,1}。请写出k邻近分类算法。

②给定一个变长的p维的立方体,训练数据D均匀的在立方体内,待预测样例x∈Rp是位于原点o。近似的,我们认为位于原点边长为l的p维立方体内的样本均为邻近,如下图所示。如果我们希望选所有数据中r(0<r<1)比例的点计算点k近邻,那么边长l应为多少? l^p = r --> l = logp(r)

③接第二问,当p=10时,分别取r=0.01和r=0.1的情况下边长l分别等于多少?通过分析l的取值以及l随p变化的趋势,试简略解释机器学习中的维数灾难问题,(参考数据:10-0.1=0.794; 10-0.2=0.631; 10-0.3=0.501; 10-0.4=0.398)r = 0.01, l10 = 0.01, l = 10-0.2=0.631;

④简要描述一种解决维灾的方法。

如何避免“维数灾难”?图1显示了分类器的性能随着特征个数的变化不断增加,过了某一个值后,性能不升反降。这里的某一个值到底是多少呢?目前,还没有方法来确定分类问题中的这个阈值是多少,这依赖于训练样本的数量,决策边界的复杂性以及分类器的类型。理论上,如果训练样本的数量无限大,那么就不会存在“维数灾难”,我们可以采用任意多的特征来训练分类器。事实上,训练样本的数量是有限的,所以不应该采用过多的特征。此外,那些需要精确的非线性决策边界的分类器,比如neural network,knn,decision trees等的泛化能力往往并不是很好,更容易发生过拟合问题。因此,在设计这些分类器时应当慎重考虑特征的数量。相反,那些泛化能力较好的分类器,比如naive Bayesian,linear classifier等,可以适当增加特征的数量。

如果给定了N个特征,我们该如何从中选出M个最优的特征?最简单粗暴的方法是尝试所有特征的组合,从中挑出M个最优的特征。事实上,这是非常花时间的,或者说不可行的。其实,已经有许多特征选择算法(feature selection algorithms)来帮助我们确定特征的数量以及选择特征。此外,还有许多特征抽取方法(feature extraction methods),比如PCA等。交叉验证(cross-validation)也常常被用于检测与避免过拟合问题。

还有正则,SVD奇异值分解

转载于:https://www.cnblogs.com/ffan/p/3965672.html

百度2013校园招聘笔试题(答案整理) – 机器学习/数据挖掘工程师相关推荐

  1. 百度2013校园招聘笔试题(欢迎高手给予指点)

    一.简答题 1.简述数据库以及线程死锁产生的原理及必要条件,简述如何避免死锁. 2.请列举面向对象设计的三个基本要素和五种主要涉及原则. 3.简述windows内存管理的几种方式及优缺点. 二.算法和 ...

  2. 360 2013校园招聘笔试题(含参考答案)

    360 2013校园招聘笔试题(含参考答案) 参考答案: 1.D  5*5*5=125 2.C  排除法 3.A  仅个人意见 4.A 5.D   ABC三语句一定保留,D不确定,EF一定删除 6.不 ...

  3. 十月下旬腾讯 网易游戏 百度迅雷校园招聘笔试题集锦 第271 330题

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 十月下旬 ...

  4. 2012九月十月腾讯,网易游戏,百度最新校园招聘笔试题

    十月下旬腾讯,网易游戏,百度最新校园招聘笔试题集锦(第271-330题) 引言 此文十月百度,阿里巴巴,迅雷搜狗最新面试十一题已经整理了最新的面试题70道,本文依次整理腾讯,网易游戏,百度等各大公司最 ...

  5. 百度2015校园招聘笔试题

    百度2015校园招聘笔试题(自己凭记忆第一时间,记录了这么多,有些描述比较简单,请大神们补充) 一 .简答题(30分) 1. 进程和线程的联系与区别. 2. 简述数据库的存储过程及其优点. 3. st ...

  6. 网易2013校园招聘笔试题集锦

    第一部分(必做):计算机基础类 (所有的选择题都是多项选择) 1.假设进栈次序是e1, e2, e3, e4,那可能的出栈次序是() A.e2, e4, e3, e1 B.e2, e3, e4, e1 ...

  7. 2014迅雷校园招聘笔试题答案

    目前暂时只做了选择题部分,不保证没有错误,仅供参考,祝愿大家和我今年都能找到满意的工作哦~ 选择题答案部分 单选题 1.B 2.A p为指针,32位地址的指针大小为4个字节 3.D str为数组,勿忘 ...

  8. 奇虎360 2013校园招聘笔试题

    转载自 http://blog.csdn.net/wanglongfei_hust/article/details/10041337 我的答案与解析: 1. D  2. C  3. B  4. A   ...

  9. 微软2013校园招聘笔试题

    1.       数据库 基于某个条件选出一个订单列表,考的是最基本的数据库语言select * from * where * 解: 详见http://blog.csdn.net/zephyr_be_ ...

最新文章

  1. 简单入门循环神经网络RNN:时间序列数据的首选神经网络
  2. EchoesWorks —— 打造下一代技术Blog/Presentation 框架(招兵买马)
  3. Latex ! Missing $ inserted error 解决方法
  4. 第二、三章:信息系统项目管理基础与立项管理-章节真题
  5. SQL Server Error 15404解决方案
  6. Mobius 一个运行在 .NET Core 上的 .NET 运行时
  7. oracle怎么从大字段中取节点,Oracle数据库 获取CLOB字段存储的xml格式字符串指定节点的值...
  8. 使用Tomcat配置域名
  9. (19)FPGA面试题设计前端流程
  10. Oracle如何根据SQL_TEXT生成SQL_ID
  11. AOP与自定义注解与反射
  12. 居家养老管理系统设计
  13. 【性能优化实战】日语java开发相关词汇
  14. paypal 付款、支出接入文档及官方示例
  15. 英尺、英寸、磅和厘米的换算
  16. 国外电子与通信教材系列最新目录单
  17. rust货轮什么时候出现_庆余年海棠朵朵什么时候出现 庆余年海棠朵朵第几集出现...
  18. [深入研究4G/5G/6G专题-22]: 5G NR开机流程3.4 - MAC层对SIB1的调度 - SIB1消息的格式与内容
  19. 语音助手——助手中用到的那些分类模型
  20. SSH (安全shell 协议)

热门文章

  1. 关于upp和lower
  2. EF学习之一:入门之新建一个EF项目
  3. BigDecimalUtil
  4. 数论——dove的疑惑
  5. Bartlett‘s sphericity test、Bartlett test
  6. Tikz 作图教程:pgfplots 宏包三维数据的可视化绘图
  7. 怎样将PNG格式的图片转成PDF格式
  8. 河北省省赛重现赛-K Multiple Longest Commom Subsequence
  9. Excel数据分析学习笔记(一)数据分析六步法和重要分析模型
  10. ubuntu操作系统安装(二) 十六进制编辑器tweak