第十天

1、在以下不同的场景中,使用的分析方法不正确的有
A
根据商家最近一年的经营及服务数据,用聚类算法判断出天猫商家在各自主营类目下所属的商家层级
B
根据商家近几年的成交数据,用聚类算法拟合出用户未来一个月可能的消费金额公式
C
用关联规则算法分析出购买了汽车坐垫的买家,是否适合推荐汽车脚垫
D
根据用户最近购买的商品信息,用决策树算法识别出淘宝买家可能是男还是女
正确答案是: B
预测消费更合适的算法是用回归模型来做。而不是聚类算法。
2、以下对k-means聚类算法解释正确的是
A
能自动识别类的个数,随即挑选初始点为中心点计算
B
能自动识别类的个数,不是随即挑选初始点为中心点计算
C
不能自动识别类的个数,随即挑选初始点为中心点计算
D
不能自动识别类的个数,不是随即挑选初始点为中心点计算
正确答案是:C
(1)适当选择c个类的初始中心;
(2)在第k次迭代中,对任意一个样本,求其到c个中心的距离,将该样本归到距离最短的中心所在的类;
(3)利用均值等方法更新该类的中心值;
(4)对于所有的c个聚类中心,如果利用(2)(3)的迭代法更新后,值保持不变,则迭代结束,否则继续迭代。
以上是KMeans(C均值)算法的具体步骤,可以看出需要选择类别数量,但初次选择是随机的,最终的聚类中心是不断迭代稳定以后的聚类中心。所以答案选C。
3、(假设precision=TP/(TP+FP),recall=TP/(TP+FN)。)在二分类问题中,当测试集的正例和负例数量不均衡时,以下评价方案哪个是相对不合理的()
A
Accuracy:(TP+TN)/all
B
F-value:2recallprecision/(recall+precision)
C
G-mean:sqrt(precision*recall)
D
AUC:曲线下面积
正确答案是:A
题目提到测试集正例和负例数量不均衡,那么假设正例数量很少占10%,负例数量占大部分90%。
而且算法能正确识别所有负例,但正例只有一半能正确判别。
那么TP=0.05×all,TN=0.9×all,Accuracy=95%。
虽然Accuracy很高,precision是100%,但正例recall只有50%
4、下列选项中,识别模式与其他不⼀样的是
A
⽤户年龄分布判断:少年、青年、中年、⽼年
B
医⽣给病⼈诊断发病类型
C
投递员分拣信件
D
消费者类型判断:⾼消费、⼀般消息、低消费
E
出⾏方式判断:步⾏、骑车、坐车
F
商家对商品分级
正确答案是:E
E属于预测问题,其他的选项属于分类问题
5、在大规模的语料中,挖掘词的相关性是一个重要的问题。以下哪一个信息不能用于确定两个词的相关性。
A
互信息
B
最大熵
C
卡方检验
D
最大似然比
正确答案是: B
最大熵代表了整体分布的信息,通常具有最大熵的分布作为该随机变量的分布,不能体现两个词的相关性,但是卡方是检验两类事务发生的相关性。所以选B【正解】
6、基于统计的分词方法为()
A
正向最大匹配法
B
逆向最大匹配法
C
最少切分
D
条件随机场
正确答案是:D
第一类是基于语法和规则的分词法。其基本思想就是在分词的同时进行句法、语义分析,利用句法信息和语义信息来进行词性标注,以解决分词歧义现象。因为现有的语法知识、句法规则十分笼统、复杂,基于语法和规则的分词法所能达到的精确度远远还不能令人满意,目前这种分词系统还处在试验阶段。

第二类是机械式分词法(即基于词典)。机械分词的原理是将文档中的字符串与词典中的词条进行逐一匹配,如果词典中找到某个字符串,则匹配成功,可以切分,否则不予切分。基于词典的机械分词法,实现简单,实用性强,但机械分词法的最大的缺点就是词典的完备性不能得到保证。据统计,用一个含有70000个词的词典去切分含有15000个词的语料库,仍然有30%以上的词条没有被分出来,也就是说有4500个词没有在词典中登录。

第三类是基于统计的方法。基于统计的分词法的基本原理是根据字符串在语料库中出现的统计频率来决定其是否构成词。词是字的组合,相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映它们成为词的可信度。

7、在下面的图像中,哪一个是多元共线(multi-collinear)特征?

A
图 1 中的特征
B
图 2 中的特征
C
图 3 中的特征
D
图 1、2 中的特征
E
图 2、3 中的特征
F
图 1、3 中的特征
正确答案是:D
在图 1 中,特征之间有高度正相关,图 2 中特征有高度负相关。所以这两个图的特征是多元共线特征。
8、线性回归的基本假设不包括哪个?
A
随机误差项是一个期望值为0的随机变量
B
对于解释变量的所有观测值,随机误差项有相同的方差
C
随机误差项彼此相关
D
解释变量是确定性变量不是随机变量,与随机误差项之间相互独立
E
随机误差项服从正态分布
正确答案是:C
9、下面哪些对「类型 1(Type-1)」和「类型 2(Type-2)」错误的描述是错误的?
A
类型 1 通常称之为假正类,类型 2 通常称之为假负类
B
类型 2 通常称之为假正类,类型 1 通常称之为假负类
C
类型 1 错误通常在其是正确的情况下拒绝假设而出现
正确答案是: B
在统计学假设测试中,I 类错误即错误地拒绝了正确的假设即假正类错误,II 类错误通常指错误地接受了错误的假设即假负类错误。
10、给线性回归模型添加一个不重要的特征可能会造成?
A
增加 R-square
B
减少 R-square
正确答案是:A

一个月刷完机器学习笔试题300题(10)相关推荐

  1. 一个月刷完机器学习笔试题300题(11)

    第十一天 1.关于 ARMA . AR . MA 模型的功率谱,下列说法正确的是( ) A MA模型是同一个全通滤波器产生的 B MA模型在极点接近单位圆时,MA谱是一个深谷 C AR模型在零点接近单 ...

  2. 一个月刷完机器学习笔试题300题(3)

    第三天 1.以下不属于影响聚类算法结果的主要因素有() A 已知类别的样本质量 B 分类准则 C 特征选取 D 模式相似性测度 正确答案是:A 都已知了,就不必再进行聚类了. 2.模式识别中,不属于马 ...

  3. 机器学习笔试题精选(四)

    https://blog.csdn.net/red_stone1/article/details/81162774 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常 ...

  4. 机器学习笔试题精选(一)

    https://blog.csdn.net/red_stone1/article/details/80982149 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常 ...

  5. 机器学习笔试题精选(二)

    https://blog.csdn.net/red_stone1/article/details/81023976 上次 机器学习笔试题精选(一)中,我们详细解析了机器学习笔试 15 道题.今天,红色 ...

  6. 机器学习笔试题精选(五)

    https://blog.csdn.net/red_stone1/article/details/81296337 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常 ...

  7. 机器学习笔试题精选(三)

    https://blog.csdn.net/red_stone1/article/details/81073650 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常 ...

  8. 机器学习笔试题精选(七)

    红色石头的个人网站:redstonewill.com 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常常会遇到各种各样的机器学习问题和知识点.为了帮助大家对这些知识 ...

  9. 终章 | 机器学习笔试题精选

    点击上方"AI有道",选择"置顶公众号" 关键时刻,第一时间送达! 读本文大约需要 9 分钟 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关 ...

最新文章

  1. 节流函数(throttle)的原理
  2. Docker 持久化存储
  3. 为什么要关心均值和哈希码
  4. TreeMap实现对中文的排序
  5. docker安装文档
  6. 一个漂亮的Bootstrap查找查询框,带下拉选择按钮
  7. 基于深度卷积神经网络的玉米病害识别
  8. snmpset对象不可写_别再问了,好吗?Java字符串一定是不可变的
  9. 语音识别技术是什么 语音识别技术应用介绍【图文】
  10. Mysql生产环境表更新方案_生产环境中,数据库升级维护的最佳解决方案flyway
  11. 未来教育计算机19二级视频百度云,未来教育 MS office二级视频讲解
  12. AB_PLC编程软件RSLogix_500_与PLC通讯详细说明
  13. 找出冲突的Windows快捷键
  14. 闪聚支付前端部署指南
  15. Android学习笔记-隐藏app图标
  16. h5画三角形_HTML5怎么画三角形?
  17. HDU 1546 Idiomatic Phrases Game 最短路
  18. 利用串口对 89S 系列单片机编程
  19. UI设计网盘资源收集
  20. 如何在Linux上部署web程序

热门文章

  1. 如何用计算机做音乐,怎么制作音乐-手把手教你用废旧物品DIY音乐道具,超好玩!...
  2. python基础学习(一)
  3. python定时发微信消息给心爱的她
  4. java导出word文档(office,wps均可)
  5. 从源码分析Android的Glide库的图片加载流程及特点
  6. 你需要一份更绝佳的文章排版与设计
  7. qt显示温度℃度数°或中文等特殊符号
  8. ElasticSearch 23 种映射参数详解
  9. 【从零开始学习YOLOv3】3. YOLOv3的数据加载机制和增强方法
  10. 墨刀和axure的区别