目录

1. 机器学习的概述

2. 机器学习系统的特点

3.机器学习常见分类

4.机器学习常用算法

1. 机器学习概述

机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。

2. 机器学习系统的特点

  • 解决无法直接使用 固定的规则+流程代码
  • 学习能力 从不断的经历和数据中吸取经验教训从而 应对未来的预测
  • 不断改善自身应对具体任务的能力

3. 机器学习常见分类

监督学习:

在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见应用场景如分类问题和回归问题。常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network)

无监督学习:

无监督学习(或者叫非监督学习),它与监督学习的不同之处,在于我们事先没有任何训练样本,而需要直接对数据进行建模。 在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。常见的应用场景包括关联规则的学习以及聚类等。常见算法包括Apriori算法以及k-Means算法。

强化学习:

在这种学习模式下,输入数据作为对模型的反馈,不像监督模型那样,输入数据仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型,模型必须对此立刻作出调整。常见的应用场景包括动态系统以及机器人控制等。常见算法包括Q-Learning以及时间差学习(Temporal difference learning)

深度学习:

深度学习算法是对人工神经网络的发展。 在近期赢得了很多关注, 特别是百度也开始发力深度学习后, 更是在国内引起了很多关注。   在计算能力变得日益廉价的今天,深度学习试图建立大得多也复杂得多的神经网络。很多深度学习的算法是半监督式学习算法,用来处理存在少量未标识数据的大数据集。常见的深度学习算法包括:受限波尔兹曼机(Restricted Boltzmann Machine, RBN), Deep Belief Networks(DBN),卷积网络(Convolutional Network), 堆栈式自动编码器(Stacked Auto-encoders)。

4. 机器学习常用算法

  • 决策树

决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。

决策树是一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别。根据一些 feature (特征)进行分类,每个节点提一个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的,再投入新数据的时候,就可以根据这棵树上的问题,将数据划分到合适的叶子上。

  • 随机森林算法

随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。分类器就是给定一个样本的数据,判定这个样本属于哪个类别的算法。例如在股票涨跌预测中,我们认为前一天的交易量和收盘价对于第二天的涨跌是有影响的,那么分类器就是通过样本的交易量和收盘价预测第二天的涨跌情况的算法。

  • 逻辑回归

logistic回归(逻辑回归)是一种广义的线性回归,它将数据拟合到一个logit函数(或者叫做logistic函数)中,从而能够完成对事件发生的概率进行预测。

  • SVM

SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题.简单地说,就是升维和线性化.升维,就是把样本向高维空间做映射,一般情况下这会增加计算的复杂性,甚至会引起"维数灾难",因而人们很少问津.但是作为分类、回归等问题来说,很可能在低维样本空间无法线性处理的样本集,在高维特征空间中却可以通过一个线性超平面实现线性划分(或回归).一般的升维都会带来计算的复杂化,SVM方法巧妙地解决了这个难题:应用核函数的展开定理,就不需要知道非线性映射的显式表达式;由于是在高维特征空间中建立线性学习机,所以与线性模型相比,不但几乎不增加计算的复杂性,而且在某种程度上避免了"维数灾难".这一切要归功于核函数的展开和计算理论.

  • 朴素贝叶斯

朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。

  • K最近邻算法

K最近邻(k-Nearest Neighbor,KNN)分类算法,是最简单的机器学习算法之一。所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。

机器学习的常见分类及常用算法相关推荐

  1. 【毕业设计_课程设计】基于机器学习的情感分类与分析算法设计与实现(源码+论文)

    文章目录 0 项目说明 1 研究目的 2 研究方法 3 研究结论 4 项目流程 4.1 获取微博文本 4.2 SVM初步分类 4.3 使用朴素贝叶斯分类 4.4 AdaBoost 4.4.1 二分类A ...

  2. 机器学习算法学习---处理分类问题常用算法(一)

    logistic回归是一种广义线性回归(generalized linear model),因此与多重线性回归分析有很多相同之处.它们的模型形式基本上相同,都具有 w'x+b,其中w和b是待求参数,其 ...

  3. 报童问题求解最大利润_第3章 第2节 处理分类问题常用算法(二)

    ●   分层抽样的适用范围 参考回答: 分层抽样利用事先掌握的信息,充分考虑了保持样本结构和总体结构的一致性,当总体由差异明显的几部分组成的时候,适合用分层抽样. ●   LR的损失函数 参考回答: ...

  4. 分类问题常用算法之支持向量机SVM

    支持向量机 SVM(Support Vector Machines,支持向量机)是核变换技术的代表算法之一,是一种具有精度高.运算速度快.泛化能力强等优点的统计学习新算法,其主要思想是将低维空间中的线 ...

  5. 分类问题常用算法——逻辑回归原理

    逻辑回归模型算是机器学习的一种基本方法,但也有很多细节.本篇文章从原理入手,力求化繁为简,如有错漏,烦请指正. 什么是逻辑回归: 逻辑回归是一种分类模型.给定输入X, 可以将Y的条件概率P(Y|X)形 ...

  6. 【机器学习】自然语言处理的常用算法

    目录 参考 HMM 条件随机场 RNN LSTM GRU 双向RNN 参考 华为云学院 HMM 条件随机场 RNN 不同于传统的机器翻译模型,RNN有能力将语料集中的全部前序词汇纳入模型的考虑范围.传 ...

  7. 轻松看懂机器学习十大常用算法

    本文转载自CSDN aliceyangxi1987的博客 通过本篇文章可以对机器学习(machine learning, ML)的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下, ...

  8. 机器学习中常见的六种分类算法(附Python源码+数据集)

    今天和大家学习一下机器学习中常见的六种分类算法,如K近邻.决策树.朴素贝叶斯.逻辑回归.支持向量机.随机森林 除了介绍这六种不同分类算法外,还附上对应的Python代码案例,并分析各自的优缺点. 01 ...

  9. 系统学习机器学习之总结(一)--常见分类算法优缺点

    主要是参考网上各种资源,做了整理.其实,这里更多的是从基础版本对比,真正使用的时候,看数据,看改进后的算法. 1. 五大流派 ①符号主义:使用符号.规则和逻辑来表征知识和进行逻辑推理,最喜欢的算法是: ...

  10. 机器学习中常见的分类 回归 聚类算法小结

    Date: 2019-08-15 今天开始总结和复习机器学习知识点: 一句话概括: 1. 聚类:无监督学习,学习结果将产生几个集合,集合中的元素彼此相似: 2. 分类:有监督学习,学习结果将产生几个函 ...

最新文章

  1. MSMQ(Microsoft Message Queue)介绍
  2. PHPExcel处理导入导出图片,链接
  3. 有些小银行利息高,非常受欢迎,为什么不在全国开网点?
  4. 看奥运之五:关于“鸟巢”、“水立方”的数据和内涵
  5. linux ded编译,重新编译deb包
  6. html中取消li的点击事件,jquery设置html li点击click事件为什么无法赋值到表单input value中呢?...
  7. 【项目经理之修炼】 全文索引
  8. java CMS gc解析
  9. [菜鸟自学过程] ASP.NET2.0 ClientCallback脚本回调
  10. DPDK 框架原理简介(0001转)
  11. RxBinding系列之RxTextView(二)
  12. 用批处理文件阻止win10强制更新
  13. 用Python和Pygame写游戏-从入门到精通(实战三:植物大战僵尸1)
  14. PHP 实现微信公众号网页授权登录
  15. TX2入门(10)——TensorRT(1)(tx2端inference)
  16. 阿里云OSS跨域报错:Access to XMLHttpRequest at ‘...‘ ... blocked by CORS policy: No ‘Access-Control-Allow
  17. 微价值:专访个人开发者800万用户之《系统清道夫》
  18. 【阅读论文】博-自动化眼底图像分析技术可筛查糖尿病患者的视网膜疾病--第三章--QA
  19. 高德地图 根据名称搜索坐标,坐标点呈现列表展示
  20. Android中 自定义logo二维码绘制(仿微信QQ二维码)

热门文章

  1. 【Multisim仿真+报告+演示视频】数电课设五人表决器Multisim仿真设计【全套资料】资源编号:YM5-V1.0.1-五人表决器
  2. 2020 数据中心机房建设方案
  3. 2021年电子签名政策汇总 行业研究数据公布
  4. c语言词法分析程序实验报告,词法分析器实验报告
  5. 录屏直播时,只有部分屏幕的解决办法
  6. 修改电脑微信提示音+dll文件编辑器
  7. 大神u盘工具(win10PE)UEFI纯净版启动盘制作工具
  8. KEIL5下载程序失败解决办法
  9. 微信养号防封攻略_防封群微信怎么卖
  10. Java的Appium自动化测试教程