深度学习 vs 机器学习 vs 模式识别

模式识别:智能程序的诞生。
机器学习:从样本中学习的智能程序。
深度学习:一统江湖的架构。受宠爱最多的就是被用在大规模图像识别任务中的卷积神经网络。

1)机器学习就像是一个真正的冠军一样持续昂首而上;
2)模式识别一开始主要是作为机器学习的代名词;模式识别正在慢慢没落和消亡;

3)深度学习是个崭新的和快速攀升的领域。

1. SVM经常使用的核函数有:(1)线性核函数(2)多项式核(3)径向基核(RBF)(4)傅里叶核(5)样条核(6)Sigmoid核函数

2. 序列模式挖掘算法:指挖掘相对时间或其他模式出现频率高的模式,典型的应用还是限于离散型的序列。


Apriori类算法包括: AprioriAll和 GSP等。

在序列模式挖掘中,FreeSpan和PrefixSpan是两个常用的算法。其中,PrefixSpan是从FreeSpan中推导演化而来的。这两个算法都比传统的Apriori-like的序列模式挖掘算法(GSP)都有效。而PrefixSpan又比FreeSpan又更有效。这是因为PrefixSpan的收缩速度比FreeSpan还要更快些。

典型应用:商场挖掘即用户几次购买行为间的联系,可以采取更有针对性的营销措施。

类似于Apriori算法大体分为候选集产生、候选集计数以及扩展分类三个阶段。与AprioriAll算法相比,GSP算法统计较少的候选集,并且在数据转换过程中不需要事先计算频繁集。

3. 序列模式 VS 关联规则

问题
序列模式挖掘
关联规则挖掘
数据集
序列数据库
事务数据库
关注点
单项间在同一事务内以及事务间的关系
单项间在同一事务内的关系
. 类域界面方程法中,求线性不可分情况下分类问题近似或精确解的方法是?
神经网络处理不可分现象

5.特征选择方法:信息增益、信息增益率、基尼系数

6. 基于核的算法:支持向量机(Support Vector Machine, SVM), 径向基函数(Radial Basis Function ,RBF), 线性判别分析(Linear Discriminate Analysis ,LDA)等

7. 数据清理中,处理缺失值的方法是?


数据清理中,处理缺失值的方法有两种:

删除法:1)删除观察样本

2)删除变量:当某个变量缺失值较多且对研究目标影响不大时,可以将整个变量整体删除

3)使用完整原始数据分析:当数据存在较多缺失而其原始数据完整时,可以使用原始数据替代现有数据进行分析

4)改变权重:当删除缺失数据会改变数据结构时,通过对完整数据按照不同的权重进行加权,可以降低删除缺失数据带来的偏差

查补法:均值插补、回归插补、抽样填补等

成对删除与改变权重为一类,估算与查补法为一类

8. 下列哪个不属于CRF模型对于HMM和MEMM模型的优势( )B

A. 特征灵活  B. 速度快  C. 可容纳较多上下文信息  D. 全局最优

首先,CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模.

隐马模型一个最大的缺点就是由于其输出独立性假设,导致其不能考虑上下文的特征,限制了特征的选择

最大熵隐马模型则解决了隐马的问题,可以任意选择特征,但由于其在每一节点都要进行归一化,所以只能找到局部的最优值,同时也带来了标记偏见的问题,即凡是训练语料中未出现的情况全都忽略掉

条件随机场则很好的解决了这一问题,他并不在每一个节点进行归一化,而是所有特征进行全局归一化,因此可以求得全局的最优值。

9. KNN和K-Means的区别

KNN

K-Means

1.KNN是分类算法

2.监督学习

3.喂给它的数据集是带label的数据,已经是完全正确的数据

1.K-Means是聚类算法

2.非监督学习

3.喂给它的数据集是无label的数据,是杂乱无章的,经过聚类后才变得有点顺序,先无序,后有序

没有明显的前期训练过程,属于memory-based learning 有明显的前期训练过程
K的含义:来了一个样本x,要给它分类,即求出它的y,就从数据集中,在x附近找离它最近的K个数据点,这K个数据点,类别c占的个数最多,就把x的label设为c K的含义:K是人工固定好的数字,假设数据集合可以分为K个簇,由于是依靠人工定好,需要一点先验知识

相似点:都包含这样的过程,给定一个点,在数据集中找离它最近的点。即二者都用到了NN(Nears Neighbor)算法,一般用KD树来实现NN。

10. 以下哪个是常见的时间序列算法模型B

A. RSIB. MACDC. ARMAD. KDJ

时间序列模型是指采用某种算法(可以是神经网络、ARMA等)模拟历史数据,找出其中的变化规律

时间序列算法模型主要有:移动平均算法、指数平滑算法及ARMA、ARIMA方法。


转载于:https://www.cnblogs.com/qixiangyujj/p/5918778.html

机器学习-笔试题总结1相关推荐

  1. 机器学习笔试题精选(一)

    https://blog.csdn.net/red_stone1/article/details/80982149 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常 ...

  2. 机器学习笔试题精选(二)

    https://blog.csdn.net/red_stone1/article/details/81023976 上次 机器学习笔试题精选(一)中,我们详细解析了机器学习笔试 15 道题.今天,红色 ...

  3. 机器学习笔试题精选(三)

    https://blog.csdn.net/red_stone1/article/details/81073650 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常 ...

  4. 机器学习笔试题精选(四)

    https://blog.csdn.net/red_stone1/article/details/81162774 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常 ...

  5. 机器学习笔试题精选(五)

    https://blog.csdn.net/red_stone1/article/details/81296337 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常 ...

  6. 机器学习笔试题精选(七)

    红色石头的个人网站:redstonewill.com 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关工作岗位时,我们常常会遇到各种各样的机器学习问题和知识点.为了帮助大家对这些知识 ...

  7. 终章 | 机器学习笔试题精选

    点击上方"AI有道",选择"置顶公众号" 关键时刻,第一时间送达! 读本文大约需要 9 分钟 机器学习是一门理论性和实战性都比较强的技术学科.在应聘机器学习相关 ...

  8. 机器学习笔试题练习(08-04)【4】

    Date: 2019-08-04 一. iHandy2019校招-机器学习/算法工程师笔试题 1.  计算斐波那契数列第n项的函数定义如下: int fib(int n){ if(n==0) retu ...

  9. 简单的机器学习笔试题

    就不说是哪个公司的了 这个题目很简单,但是考察的也很细,很全面 去年做这个题目就完全被虐了,今年想起来,下面是草稿

  10. 15道AI 机器学习笔试题(暂时没有答案)

    转载于:https://www.cnblogs.com/TendToBigData/p/10501159.html

最新文章

  1. Kanade's trio 2017多校#3 trie
  2. php实现支付宝支付接口,PHP实现个人支付宝支付开发(二)
  3. Spring核心(ioc控制反转)
  4. postman根据请求内容生成对应的代码(Java、Go、C语言等)
  5. php中orm模型,模型model
  6. USACO 2.1 海明码 Hamming Codes (模拟+位运算+黑科技__builtin_popcount(n))
  7. 老师 累了,我们 泪了!
  8. 2021中国民营企业500强调研分析报告
  9. MySQL之逻辑架构和存储引擎
  10. “Talk is cheap, show me the code”你一行代码有多少漏洞?
  11. 怎样使用libmad
  12. msclass 文字滚动_MSClass (通用不间断滚动JS封装类)
  13. ASR中常用的语音特征之FBank和MFCC
  14. 使用SVM和决策树实现客户贷款逾期分析
  15. 如何去到Jquery官网下载Jquery
  16. 【蓝凌表单】流程表单JS汇总
  17. python|教你用代码画“社会人”
  18. 测试设备对电路故障判断的影响(为什么你的电源纹波那么大?)
  19. 无线局域网中iPhone无法访问IIS
  20. 56 Marvin: 一个支持GPU加速、且不依赖其他库(除cuda和cudnn)的轻量化多维深度学习(deep learning)框架介绍...

热门文章

  1. 带你十分钟了解BFC(渡一教育笔记)
  2. C语言:编写程序,打开文本文件stu.txt,读出文件内容,将其中的字符‘s’删除,将修改后的内容存到student.txt文件中。
  3. 【C++入门】从C到C++
  4. Spark StructType 类型详解
  5. 神经网络全连接层详解
  6. Java之品优购课程讲义_day12(2)
  7. android之monkey测试
  8. SQL Server2008的数据导入到SQL Server2005
  9. ArcGIS Pro 性能诊断
  10. linux sed用法