机器学习常见知识点自查50问与答

  • 1.什么是机器学习
  • 2.机器学习与数据挖掘的区别
  • 3.什么是机器学习的过度拟合现象
  • 4.过度拟合产生的原因
  • 5.如何避免过拟合
  • 6.什么是感应式的机器学习
  • 7.机器学习的五个流行算法是什么
  • 8.机器学习有哪些不同的算法技术
  • 9.机器学习建立模型的三个阶段是什么
  • 10.什么是监督学习的标准方法
  • 11.什么是训练数据集和测试数据集
  • 12.机器学习的各种方法
  • 13.非机器学习有哪些类型
  • 14.什么是非监督学习的功能
  • 15.什么是监督学习的功能
  • 16.什么是算法独立的机器学习
  • 17.人工智能与机器学习的区别
  • 18.机器学习中分类器是什么
  • 19.朴素贝叶斯方法的优势是什么
  • 20.在哪些领域使用模式识别技术
  • 21.什么是遗传编程
  • 22.归纳逻辑程序设计是什么
  • 23.模型的选择是什么
  • 24.用于监督学习校准的两种方法是什么
  • 25.什么方法通常用于防止过拟合
  • 26.规则学习的启发式方法和决策树的启发式方法之间的区别是什么
  • 27.什么是感知机器学习
  • 28.贝叶斯逻辑程序的两个组成部分是什么
  • 29.什么是贝叶斯网络
  • 30.为什么基于实例的学习算法有时也被称为懒惰学习算法
  • 31.支持向量机能处理哪两种分类方法
  • 32.什么是集成学习?
  • 33.为什么集成学习被应用?
  • 34.什么使用集成学习?
  • 35.什么是集成方法的两种范式?
  • 36.什么是集成方法的一般原则,在集成方法中套袋(bagging)和爆发(boosting)指的是什么?
  • 37.什么是集成方法分类错误的偏置方差分解?
  • 38.在集成方法中什么是增量合成方法?
  • 39.PCA,KPCA和ICE如何使用?
  • 40.在机器学习中降维是什么意思?
  • 41.什么是支持向量机?
  • 42.关系评价技术的组成部分是什么?
  • 43.连续监督学习有什么不同方法?
  • 44.在机器人技术和信息处理技术的哪些方面会相继出现预测问题?
  • 45.什么是批量统计学习?
  • 46.什么是PAC学习?
  • 47.有哪些不同的类别可以分为序列学习过程?
  • 48.什么是序列学习?
  • 49.机器学习的两种技术是什么?
  • 50.你在日常工作中看到的机器学习的一个流行应用是什么?

1.什么是机器学习

机器学习是为了应对系统程序设计,属于计算机科学类的学科,能根据经验进行自动学习和提高。例如:一个由程序操控的机器人,能根据从传感器收集到的数据,完成一系列的任务和工作,能根据数据自动学习的应用程序。

2.机器学习与数据挖掘的区别

机器语言是指在没有明确的程序指令的情况下,给予计算机学习能力,使它能够自主的学习、设计和扩展相关算法。数据挖掘则是一种从非结构化数据里面提取知识或者未知的、人们感兴趣的数据,这个过程中应用了机器学习算法。

3.什么是机器学习的过度拟合现象

在机器学习中,当一个统计模型首先描述随机误差或噪声,而不是自身的基本关系时,过度拟合就会出现。当一个模型过于复杂,过拟合通常容易出现,因为相对训练数据类型的数量,模型参数过于庞大。

4.过度拟合产生的原因

由于用于训练模型的标准并不等同于判断模型效率的标准,这导致了产生过度拟合的可能性。

5.如何避免过拟合

当使用较小的数据集进行机器学习时,容易产生过度拟合,因此使用较大的数据量能避免过拟合现象。但是,当不得不使用小数据集进行建模时,可以使用交叉验证的技术,将数据分成两节即训练集和测试集。在交叉验证技术中,一个模型通常是被给定有先验知识的数据集(训练数据集)进行训练,没有先验知识的数据集进行测试。交叉验证的思想是:在训练阶段,定义一个数据集来验证模型。

6.什么是感应式的机器学习

感应机器学习涉及由实践进行学习的过程,能从一组可观测的例子,尝试推导出普遍性规则。

7.机器学习的五个流行算法是什么

  • 决策树
  • BP神经网络(反向传播)
  • 概率网络
  • 最邻近法
  • 支持向量机

8.机器学习有哪些不同的算法技术

  • 监督学习
  • 非监督学习
  • 半监督学习
  • 转导推理(Transduction):通过观察特定的训练样本,进而预测特定的测试样本的方法。
  • 学习推理(Learning to Learn)

9.机器学习建立模型的三个阶段是什么

  • 建立模型
  • 测试模型
  • 模型应用

10.什么是监督学习的标准方法

监督学习的标准方法是将一组示例数据分成训练数据集和测试数据集。

11.什么是训练数据集和测试数据集

在类似于机器学习的各个信息科学相关领域中,一组数据被用来发现潜在的预测关系,称为“训练数据集”。训练数据集是提供给学习者的案例,而试验数据集是用于测试由学习者提出的假设关系的准确度。

12.机器学习的各种方法

  • 概念与分类学习(Concept Vs Classification Learning)
  • 符号与统计学习(Symbolic Vs Statistical Learning)
  • 归纳与分类学习(Inductive Vs Analytical Learning)

13.非机器学习有哪些类型

人工智能、规则推理

14.什么是非监督学习的功能

  • 求数据的集群
  • 求出数据的低维表达
  • 查找数据有趣的方向
  • 有趣的坐标和相关性
  • 发现显著的观测值和数据集清理

15.什么是监督学习的功能

  • 分类
  • 语音识别
  • 回归
  • 时间序列预测
  • 注释字符串

16.什么是算法独立的机器学习

机器学习在基础数学领域独立于任何特定分类器或者学习算法,被称为算法独立的机器学习。

17.人工智能与机器学习的区别

基于经验数据的特性而设计和开发的算法被称为机器学习。而人工智能不但包含机器学习,还包括诸如知识表示、自然语言处理、规划、机器人技术等其他方法。

18.机器学习中分类器是什么

分类器是指输入离散或者连续特征值的向量,并输出单个离散值或者类型的系统。

19.朴素贝叶斯方法的优势是什么

朴素贝叶斯分类器会比判别模型,譬如逻辑回归收敛地更快,因此只需要更少的训练数据。主要缺点是无法学习特征间的交互关系。

20.在哪些领域使用模式识别技术

  • 计算机视觉
  • 语言识别
  • 统计
  • 数据挖掘
  • 非正式检索
  • 生物信息学

21.什么是遗传编程

遗传编程是机器学习常用的方法之一。该模型基于测试,并在一系列的结果当中,获取最佳选择。

22.归纳逻辑程序设计是什么

归纳逻辑程序设计(ILP)是利用逻辑程序设计表达的背景知识和实例,是机器学习的一个分支。

23.模型的选择是什么

在不同的数学模型中,选择用于描述相同的数据集的模型的过程被称为模型选择。模型选择被应用于统计、机器学习和数据挖掘等相关领域。

24.用于监督学习校准的两种方法是什么

  • 普拉特校准
  • 保序回归

25.什么方法通常用于防止过拟合

当有足够的数据进行等渗回归时,这通常被用来防止过拟合问题。

26.规则学习的启发式方法和决策树的启发式方法之间的区别是什么

决策树的启发式方法评价的是一系列不相交的集合的平均质量;然而规则学习的启发式方法仅仅评价在候选规则覆盖下的实例ji。

27.什么是感知机器学习

感知器是一种输入到几个可能的非二进制输出的监督分类方法。

28.贝叶斯逻辑程序的两个组成部分是什么

第一部分由一组贝叶斯条款组成,能捕捉特定领域的定性结构。
第二部分是定量的,能对量化信息进行编码。

29.什么是贝叶斯网络

贝叶斯网络是用来表示一组变量之间未概率关系的图像模型。

30.为什么基于实例的学习算法有时也被称为懒惰学习算法

基于实例的学习算法也被称为懒惰学习算法,因为它们延缓诱导或泛化过程,直到分类完成。

31.支持向量机能处理哪两种分类方法

  • 结合二分类法
  • 修改二进制纳入多分类法

32.什么是集成学习?

为了解决特定的计算程序,如分类器或专家知识等多种模式,进行战略性生产和组合。这个过程被称为集成学习。

33.为什么集成学习被应用?

集成学习能提高模型的分类,预测,函数逼近等方面的精度。

34.什么使用集成学习?

当你构建一个更准确,相互独立的分类器时,使用集成学习。

35.什么是集成方法的两种范式?

集成方法的两种范式是:

  • 连续集成方法
  • 并行集成方法。

36.什么是集成方法的一般原则,在集成方法中套袋(bagging)和爆发(boosting)指的是什么?

集成方法的一般原则是要结合定的学习算法多种预测模型,相对于单一模型,其有更强的健壮性。套袋是一种能提高易变的预测或分类方案集成方法。爆发方法被依次用来减少组合模型的偏差。爆发和装袋都可以通过降低方差减少误差。

37.什么是集成方法分类错误的偏置方差分解?

学习算法的期望误差可以分解为偏差和方差。偏置项衡量由学习方法产生的平均分类器与目标函数是否匹配。

38.在集成方法中什么是增量合成方法?

增量学习方法是一种从新数据进行学习,并能应用于后续由现有的数据集生成的分类器的算法。

39.PCA,KPCA和ICE如何使用?

PCA(主成分分析),KPCA(基于内核主成分分析)和ICA(独立成分分析)是用于降维的重要特征提取技术。

40.在机器学习中降维是什么意思?

在机器学习和统计应用中,降维是指在计算时减少随机变量数目的处理过程,并且可以分为特征选择和特征提取。

41.什么是支持向量机?

支持向量机是一种监督学习算法,适用于分类和回归分析。

42.关系评价技术的组成部分是什么?

关系评价技术的重要组成部分如下:
1.数据采集2. 地面实况采集3. 交叉验证技术4. 查询类型5. 评分标准6. 显着性检验。

43.连续监督学习有什么不同方法?

连续监督学习问题的不同解决办法如下:
1.滑动窗口方法
2. 复发性推拉窗
3. 隐藏马尔科夫模型
4. 最大熵马尔科夫模型
5. 条件随机域
6. 图变换网络

44.在机器人技术和信息处理技术的哪些方面会相继出现预测问题?

在机器人技术和信息处理技术中,相继出现预测问题的是:
1.模仿学习
2. 结构预测
3. 基于模型的强化学习。

45.什么是批量统计学习?

统计学习技术允许根据一组观察到的数据进行学习功能和预测,这可以对无法观察和未知的数据进行预测。这些技术提供的学习预测器对未来未知数据的预测提供性能保证。

46.什么是PAC学习?

可能近似正确模型 (PAC) 学习是一个已经被引入到分析学习算法和统计效率的学习框架。

47.有哪些不同的类别可以分为序列学习过程?

1.序列预测
2. 序列生成
3. 序列识别
4. 顺序决定

48.什么是序列学习?

序列学习是一种以合乎逻辑的方式进行教学和学习的方法。

49.机器学习的两种技术是什么?

机器学习的两种技术是:
1.遗传编程
2.归纳学习

50.你在日常工作中看到的机器学习的一个流行应用是什么?

各大电商网站上已部署好的推荐引擎使用的是机器学习。

机器学习常见知识点自查50问与答相关推荐

  1. 超全大厂算法岗百问百答(推荐系统/机器学习/深度学习/C++/Spark/python)

    之前在准备秋招的时候,每次看到牛客网上那些大神手握七八个大厂的offer,就羡慕到不行,那会儿自己的机器学习算法水平还没法搬上台面,顶多也就是看了几个课程.做了两个比赛的水平,然后比赛还没得到任何的名 ...

  2. 常见的机器学习数据挖掘知识点之Basis

    常见的机器学习&数据挖掘知识点之Basis SSE(Sum of Squared Error, 平方误差和) SSE=∑i=1n(Xi−X⎯⎯⎯)2 SSE=\sum_{i=1}^{n}(X_ ...

  3. 操作系统学习常见疑惑问与答

    主要看了下特权级这块,和上次看的保护模式下寻址,发现于渊的书有个问题,很多地方为了回避繁杂的理论,反而把一些要点略去了,最后自己还是不得不到网上到处查资料~ 以下内容貌似是一个即将毕业的学长做毕设所总 ...

  4. 【你问我答】机器学习遇到问题了?尽管问,我们负责解答!

    [你问我答]是由美团点评技术团队推出的线上问答服务,你在工作学习中遇到的各种技术问题,都可以通过我们微信公众号发问,我们5000+工程师会义务为你解答,欢迎大家踊跃提问.高质量.定义清晰的问题会优先获 ...

  5. 【面试复习系列】常用机器学习算法知识点及其解析,面试官会考的几乎都有,欢迎补充

    图片慢慢上传,看不到图片的请点这里: 常用机器学习算法知识点及其解析,面试官会考的几乎都有 LR:logistic regression  对数几率回归/逻辑回归 sigmoid函数的作用就是用于把输 ...

  6. 《逆袭进大厂》第十二弹之MySQL重点篇27问27答

    大家好,我是阿秀. 我来更新了,本期是 MySQL 第二期,至此 MySQL 部分就全部更新完毕了,下一弹就是 Redis 篇了. 上一篇文章中,小伙伴建议将资料按照更细粒度去整理一番,我觉得是非常不 ...

  7. 「收藏」关于机器学习的知识点,全在这篇文章里了

    尊重原创版权: https://www.qingtianxiaoshuo.com/hot/44432.html 更多内容参考: https://www.qingtianxiaoshuo.com/ 「收 ...

  8. Java面试常见知识点总结

    目录 面试常见知识点 静态代码块 代码块 构造方法之间的顺序 interface和abstract的区别 abstract能不能继承interface 反正可不可以 interface 和abstra ...

  9. Java常见知识点汇总

    Java常见知识点汇总 基础概念与常识 1.Java 语言有哪些特点? 2.JVM vs JDK vs JRE 3.什么是字节码?采用字节码的好处是什么? 4.为什么不全部使用 AOT 呢? 5.为什 ...

最新文章

  1. flink file sink
  2. python和台达plc通讯_台达PLC通信协议ModbusASCII(DVP)
  3. role menu for SAP_UI2_ADMIN_700
  4. win7系统未响应卡住_电脑怎么修复win7系统 电脑修复win7系统方法【教程详解】...
  5. 如何展示富文本_自助建站如何做出个性化效果?
  6. 那些年我们用过神级的代码注释
  7. java 数组 存储_Java-将数组存储到内存或从内存上传到磁盘
  8. 计算机能否代替老师英语作文,雅思大作文范文:电脑不可取代老师
  9. java 数据库题,JAVA数据库笔试习题(答案在最后
  10. 【环境保护网】-环保设备_环保设备网_环保产品网_中国环境保护网
  11. 微软家庭服务器,微软下一代Windows家庭服务器Vail初印象
  12. python找不到指定模块之几种可能的解决办法:
  13. ListView中如何优化图片
  14. Python爬虫笔记
  15. 淘宝运营 钻展、智钻的定义 优势所在
  16. navicat中导出数据表结构为word格式
  17. A CLOSER LOOK AT DEEP LEARNING HEURISTICS: LEARNING RATE RESTARTS, WARMUP AND DISTILLATION
  18. Prometheus自带指标整理
  19. jython 调用java_Jython简介,第1部分:Java编程变得更容易
  20. 00014__广州市来穗人员积分制服务管理申办指南

热门文章

  1. python-windows环境安装
  2. Redis的基本操作以及info命令
  3. bzoj3697 采药人的路径
  4. 【转】网络编程常见问题总结
  5. C++ sort函数的用法
  6. 她不理我了,怎么办?
  7. 计算机网络 实验 使用端口完成地址转换,Wireshark抓包工具计算机网络实验解析...
  8. java ceilingentry_java.util.TreeMap.ceilingKey()
  9. java语言程序设计你_清华大学出版社-图书详情-《Java语言程序设计》
  10. python 打包成exe 1053_Python程序打包成exe的一些坑