机器学习选择题解析加整理

项目说明,本项目是李宏毅老师在飞桨授权课程的配套问题
课程 传送门
该项目AiStudio项目 传送门

仅供学习参考!

三岁出品必是精品!
整理内容源于李宏毅老师机器学习课程群提问答疑解析内容!

单选题(一)


机器学习训练时,Mini-Batch 的大小优选为2个的幂,如 256 或 512。它背后的原因是什么?
A. Mini-Batch 为偶数的时候,梯度下降算法训练的更快
B. Mini-Batch 设为2的幂,是为了符合CPU、GPU的内存要求,利于并行化处理
C. 不使用偶数时,损失函数是不稳定的
D. 以上说法都不对

答案:B
解析:略


下列说法错误的是?
A. 当目标函数是凸函数时,梯度下降算法的解一般就是全局最优解
B. 进行 PCA 降维时,需要计算协方差矩阵
C. 沿负梯度的方向一定是最优的方向
D. 利用拉格朗日函数能解带约束的优化问题

答案:C
解析:沿负梯度的方向是函数值减少最快的方向但不一定就是最优方向。


关于 L1、L2 正则化下列说法正确的是?
A. L2 正则化能防止过拟合,提升模型的泛化能力,但 L1 做不到这点
B. L2 正则化技术又称为 Lasso Regularization
C. L1 正则化得到的解更加稀疏
D. L2 正则化得到的解更加稀疏

答案:C
解析:L1、L2 正则化都能防止过拟合,提升模型的泛化能力。L1 正则化技术又称为 Lasso Regularization。L1 正则化得到的解更加稀疏。


“增加卷积核的尺寸,一定能提高卷积神经网络的性能。” 这句话是否正确?
A. 正确
B. 错误

答案:B
解析:卷积核的尺寸是超参数,不一定增加其尺寸就一定增加神经网络的性能,需要验证选择最佳尺寸。


有 N 个样本,一般用于训练,一般用于测试。若增大 N 值,则训练误差和测试误差之间的差距会如何变化?
A. 增大
B. 减小

答案:B
解析:增加数据,能够有效减小过拟合,减小训练样本误差和测试样本误差之间的差距。


在回归模型中,下列哪一项在权衡欠拟合(under-fitting)和过拟合(over-fitting)中影响最大?
A. 多项式阶数
B. 更新权重 w 时,使用的是矩阵求逆还是梯度下降
C. 使用常数项

答案:A
解析:选择合适的多项式阶数非常重要。如果阶数过大,模型就会更加复杂,容易发生过拟合;如果阶数较小,模型就会过于简单,容易发生欠拟合。


如果我们说“线性回归”模型完美地拟合了训练样本(训练样本误差为零),则下面哪个说法是正确的?
A.测试样本误差始终为零
B.测试样本误差不可能为零
C.以上答案都不对

答案:C
解析:略

多选题(一)

下列方法中,可以用于特征降维的方法包括?
A. 主成分分析 PCA
B. 线性判别分析 LDA
C. AutoEncoder
D. 矩阵奇异值分解 SVD
E. 最小二乘法 LeastSquares

答案:ABCD
解析:主成分分析 PCA 、线性判别分析 LDA 、AutoEncoder、矩阵奇异值分解 SVD 都是用于特征降维的方法。最小二乘法是解决线性回归问题的算法,但是并没有进行降维。


下列关于极大似然估计(Maximum Likelihood Estimate,MLE),说法正确的是?
A. MLE 可能并不存在
B. MLE 总是存在
C. 如果 MLE 存在,那么它的解可能不是唯一的
D. 如果 MLE 存在,那么它的解一定是唯一的
答案:AC
解析:如果极大似然函数 L(θ) 在极大值处不连续,一阶导数不存在,则 MLE 不存在;另一种情况是 MLE 并不唯一,极大值对应两个θ。


下列哪种方法可以用来减小过拟合?
A. 更多的训练数据
B. L1 正则化
C. L2 正则化
D. 减小模型的复杂度

答案:ABCD
解析:略

单选题(二)


关于循环神经网络(RNN)描述正确的是
A.可以用于处理序列数据
B.不能处理可变长序列数据
C.不同于卷积神经网络,RNN的参数不能共享
D.隐藏层上面的unit彼此没有关联

答案:A
解析:RNN可以设置单独的句子长度参数,也能参数共享,隐藏层的神经元也是彼此作用的


下面梯度下降说法错误的是?
A.随机梯度下降是梯度下降中常用的一种
B.梯度下降包括随机梯度下降和批量梯度下降
C.梯度下降算法速度快且可靠
D.随机梯度下降是深度学习算法当中常用的优化算法之一

答案:C
解析:梯度下降一般只全量更新,效率低,所以随机梯度相比梯度下降,每次只选择部分样本做更新,效率更高,速度更快


下面关于无监督学习描述正确的是
A.无监督算法只处理“特征”,不处理“标签”
B.降维算法不属于无监督学习
C.K-meas算法和SVM算法都属于无监督学习
D.以上都不对

答案:A
解析:SVM属于监督学习算法,降维是非监督


"在一个神经网络里,知道每一个神经元的权重和偏差是最重要的一步,如果以某种方法知道了神经网络准确的权重和偏差,你就可以近似任何函数,实现这个最佳的方法是什么?
A.随机赋值,祈祷它们是正确的
B.搜索所有权重的偏差的组合,直到得到最佳值
C.赋予一个初始值,通过检查跟最佳值的差值,然后迭代更新权重
D.以上都不是

答案:C
解析:这是神经网络算法的原理


关于神经网络与深度学习的关系表述不正确的是?
A.深度学习的概念源于人工神经网络的研究
B.含有多个隐层的神经网络算法就是一种深度学习算法
C.单层神经网络也是深度学习的一种
D.卷积神经网络属于深度学习的一种

答案:C
解析:深度学习一般至少包含输入层,隐藏层,输出层,不是单层。


以下关于卷积神经网络,说法正确的是?
A.卷积神经网络只能有一个卷积核
B.卷积神经网络可以有多个卷积核,但是必须同大小
C.卷积神经网络可以有多个卷积核,可以不同大小
D.卷积神经网络不能使用在文本这种序列数据中

答案:C
解析:可以多个卷积核;大小也可以在不同的层,设置不同的值;在NLP领域也可以使用CNN做特征提取


以下关于逻辑回归的说法不正确的是?
A.逻辑回归必须对缺失值做预处理
B.逻辑回归要求自变量和目标变量是线性关系
C.逻辑回归比决策树,更容易过度拟合
D.逻辑回归只能做2值分类,不能直接做多值分类

答案:C
解析:决策树是更容易过拟合的

多选题(二)

训练误差会降低模型的准确率,产生欠拟合,此时如何提升模拟拟合度?
A.增加数据量
B.特征工程
C.减少正则化参数
D.提高模型复杂度

答案:B、C、D
解析:训练误差来自模型算法本身,和数据量大小无关


对于PCA说法正确的是?
A.我们必须在使用PCA前规范化数据
B.我们应该选择使得模型有最大variance的主成分
C.我们应该选择使得模型有最小variance的主成分
D.我们可以使用PCA在低维度上做数据可视化

答案:A、B、D
解析:主成分是能对数据产生巨大影响的,因此产生巨大影响的那么对于方差的影响肯定也很大,所以C不对


有关集成学习下列说法正确的是?
A.基本模型应尽量来自于同一算法,通过改变训练数据和参数,得到不同的基本模型
B.通常来讲,基本模型之间相关性应该低一些
C.集成的基本模型的数量越多,集成模型的效果就越好
D.bagging boosting 时常用的集成学习的方法

答案:B、D
解析:集成算法可以集成不同算法模型,这也正式集成算法有效的原因;基本模型越多,也可能导致过拟合,在模型选择上,应保证效果好的情况下再考虑集成

作者简介

作者:三岁
经历:自学python,现在混迹于paddle社区,希望和大家一起从基础走起,一起学习Paddle
csdn地址:https://blog.csdn.net/weixin_45623093/article/list/3
我在AI Studio上获得至尊等级,点亮9个徽章,来互关呀~ https://aistudio.baidu.com/aistudio/personalcenter/thirdview/284366

传说中的飞桨社区最菜代码人,让我们一起努力!
记住:三岁出品必是精品 (不要脸系列)

李宏毅老师机器学习选择题解析相关推荐

  1. 李宏毅老师机器学习第二部分:回归问题

    李宏毅老师机器学习第二部分:回归问题 Let's go! 一.回归的定义 二.回归模型建立步骤 三.一元线性模型与多元线性模型 3.1 一元线性模型 3.2 多元线性模型 四.模型评估 4.1 损失函 ...

  2. 李宏毅老师机器学习和深度学习

    李宏毅老师讲的课程很入人心,分享下相关比较好的课程链接: 李宏毅深度学习(2017): 视频:https://www.bilibili.com/video/av9770302/?from=search ...

  3. 李宏毅2022机器学习HW2解析

    准备工作:去课程github下载原始代码,kaggle下载数据集.或者关注本公众号,下载代码和数据集(文末有方法).解压数据集,出现libriphone文件夹,将文件和代码放到同一目录下. kaggl ...

  4. 李宏毅2022机器学习HW10解析

    准备工作 作业十是黑箱攻击(Blackbox Attack),完成作业需要助教代码和数据集,运行代码过程中保持联网可以自动下载数据集,已经有数据集的情况可关闭助教代码中的下载数据部分.关注本公众号,可 ...

  5. 李宏毅老师机器学习__(1)机器学习介绍

    文章目录 机器学习定义 机器学习三板斧 监督学习 Structuerd Learning 无监督学习 半监督学习 Reinforcement Learning Transfer Learning 学习 ...

  6. 李宏毅2022机器学习HW5解析

    准备工作 作业五是机器翻译,需要助教代码,运行代码过程中保持联网可以自动下载数据集,已经有数据集的情况可关闭助教代码中的下载数据部分.关注本公众号,可获得代码和数据集(文末有方法). 提交地址 这次作 ...

  7. 李宏毅老师ML_HW1——PM2.5预测

    0.处理数据之前的pre-process 观察下载的数据文件train.csv train.csv只有每个月前20天的数据,另外每个月剩下10天数据用于作业结果评估,对学生不可见 观察数据发现rain ...

  8. 李宏毅老师官方授权!《李宏毅机器学习特训营》发布,放心免费学!

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 AlphaGo战胜"石神"李世石,人工智能开始闯进大众的视野,机器学习成为同学入门人工智 ...

  9. 李宏毅老师《机器学习》课程笔记-6 GAN

    注:本文是我学习李宏毅老师<机器学习>课程 2021/2022 的笔记(课程网站 ),文中图片均来自课程 PPT.欢迎交流和多多指教,谢谢! 6 Unsupervised Learning ...

最新文章

  1. 看动画学算法之:排序-归并排序
  2. shell之a+b求和l脚本的三种写法
  3. 关于微信浏览器H5 React,Vue工程化项目input无法自动聚焦疑难杂症排查
  4. Redis底部的几种存储结构(sds、dict、ziplist、intset、skiplist)
  5. VMware中网络设置之host-only
  6. php列表排布,php全排列递归算法代码
  7. 经典机器学习系列(七)【聚类分析前序--相似性度量】
  8. 计算机黑屏什么原因,教您电脑黑屏的原因是什么
  9. python爬取图片代码可替换网站_Python爬虫(批量爬取某网站图片)
  10. centos7安装N卡驱动和conda pytorch1.7.1深度学习环境
  11. 「Python爬虫系列讲解」五、用 BeautifulSoup 爬取电影信息
  12. Jboot v1.3.8 发布,新增 JWT 和 Shiro 的整合功能
  13. 2022年河南省焊工高级技师理论知识模拟试题及答案
  14. Go 1.16中值得关注的几个变化
  15. 去除spire.doc去水印
  16. 华为云mysql端口号_远程连接华为云数据库(端口3306)
  17. 星环科技数据安全管理平台 Defensor重磅发布
  18. 阿里云云计算 24 SLB的概念
  19. 杰理之出现电压检测、ADC 检测不准【篇】
  20. 怎样记住英语单词的意思

热门文章

  1. ElasticSerach安装IK中文分词器,并在Java中使用
  2. Python入门——Day4(元组,字符串格式化,转义字符,format函数)
  3. 【陈工笔记】# 期刊 # Elsevier 期刊的投稿模板
  4. java 代码封装_封装 java代码
  5. 教你四个步骤在Word中设计毕业论文目录
  6. 实现iServer发布地图
  7. 2020.08.14【RNA-Seq流程】丨将HTseq生成的基因COUNT值转换为FPKM值
  8. 从《Java特种兵》中感知老A的世界
  9. 什么情况下JVM内存中的一个对象会被垃圾回收
  10. “98五笔字型输入法”大批量造词 (转)