机器学习关键步骤(二)

机器学习有四个关键步骤。

(1) 数据准备,理和准备待分析的数据。
(2) 算法选择,根据需求挑选算法为数据建立模型。
(3) 参数调优,优化模型结果。
(4) 模型评估,根据准确度评价模型选出最好的。

2算法选择

2 选择算法

如何选择算法,取决于任务类型。任务大致可以分为 3 大类,每一类对应一些算法,如表所示。
表各种算法及其对应的任务类型

2.1 无监督学习

任务目标:指出数据中隐藏的模式。

当希望找出数据集中隐藏的模式时,可以使用 k 均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法。之所以称之为无监督学习算法,是因为不知道要找的模式是什么,而是要依靠算法从数据集中发现模式。

以上表中的数据为例,可以应用无监督学习模型找出哪些商品是顾客经常搭配购买的,或者根据购买的商品对顾客进行分类、)。

通过间接手段,可以对无监督学习模型输出的结果进行验证,比如检查得到的顾客分类是否与我们熟悉的分类(如食草动物和食肉动物)相符合。

2.2 监督学习

任务目标:使用数据中的模式做预测。

当需要做预测时,就会用到回归分析、k 最近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法。之所以称之为监督学习算法,是因为它们的预测都基于已有的模式。

以上表中的数据为例,监督学习模型可以根据“顾客类别”以及“是否买鱼”(二者皆为预测变量)来预测“水果购买量”。

通过输入非表中顾客的预测变量值(“顾客类别”和“是否买鱼”),并且对比预测结果和实际的“水果购买量”,可以直接评估监督学习模型的准确度。

像“水果购买量”这样的整型数值或连续数值的预测过程,实际上是在解决回归问题,如图a所示。二元值或分类值的预测过程,如预测是否会下雨,则是在解决分类问题,如图b 所示。尽管如此,大部分分类算法也可以生成连续的概率值,比如预测“降水概率是 75%”,这种预测精度更高。

回归会产生一条趋势线,而分类则会把数据点分组。请注意,这两项任务都可能出错:在回归过程中,某些数据点可能会远离趋势线;在分类过程中,某些数据点可能被错误地分组

2.3 强化学习

任务目标:使用数据中的模式做预测,并根据越来越多的反馈结果不断改进。

无监督学习模型和监督学习模型在部署之后便无法更改。不同于此,强化学习模型自身可以通过反馈结果不断改进。

暂且抛开上表中的动物顾客,举一个实际的例子:假设要比较两个在线广告的效果。首先,让这两个广告的投放频率一样,然后确定每个广告的点击人数。接着,利用强化学习模型把点击人数作为衡量广告受欢迎程度的指标,并根据这个指标提高受欢迎广告的投放频率。通过这样的迭代过程,模型不断得到改进,最终会让广告投放取得更好的效果。

2.4 注意事项

除了要了解算法适用的任务类型之外,还要了解它们在其他方面的不同,比如各种算法对不同数据类型的分析能力,以及结果的本质。

机器学习关键步骤(二)相关推荐

  1. 机器学习关键步骤(一)

    机器学习关键步骤(一) 机器学习有四个关键步骤. (1) 数据准备,理和准备待分析的数据. (2) 算法选择,根据需求挑选算法为数据建立模型. (3) 参数调优,优化模型结果. (4) 模型评估,根据 ...

  2. 机器学习关键步骤(四)

    机器学习关键步骤(四) 机器学习有四个关键步骤. (1) 数据准备,理和准备待分析的数据. (2) 算法选择,根据需求挑选算法为数据建立模型. (3) 参数调优,优化模型结果. (4) 模型评估,根据 ...

  3. ML之回归预测:机器学习中的各种Regression回归算法、关键步骤配图

    ML之回归预测:机器学习中的各种Regression回归算法.关键步骤配图 目录 机器学习中的各种回归算法 1.回归算法代码 2.各种回归算法 3.各种回归算法大PK 机器学习中的各种回归算法 1.回 ...

  4. 基于模板的通用代码生成器LKGenerator(二)-使用时的关键步骤,注意事项及实例

    通过本文,您将了解本代码生成器使用时的关键步骤,使用时的注意事项及实例. 本代码生成器的原理:提供一个可被jvm加载的class文件,然后通过java的注解和反射技术读取信息,通过本工具放入到Velo ...

  5. 机器学习关键的几门课程_互联网上每门机器学习课程,均按您的评论排名

    机器学习关键的几门课程 by David Venturi 大卫·文图里(David Venturi) 互联网上每门机器学习课程,均按您的评论排名 (Every single Machine Learn ...

  6. 谷歌VR/AR业务副总裁:Daydream是关键步骤,要解决设备摩擦问题

    [转] http://36kr.com/p/5076363.html 编者按:2017年谷歌 I/O 开发者大会开幕前,谷歌虚拟现实和增强现实副总裁 Clay Bavor 在 Medium 上分享了一 ...

  7. 经验分享:布线测试关键步骤有哪些 ?

    我们都知道在布线完成之后都免不了布线测试这一环节,但是常常会被忽略几个布线测试关键步骤.今天小编就来说说布线测试关键步骤有哪些. 布线测试关键步骤有哪些:通断测试是基础 通断测试是测试的基础,是对线路 ...

  8. ML之GB:GB算法相关论文、相关思路、关键步骤、代码实现、配图集合、案例应用之详细攻略

    ML之GB:GB算法相关论文.相关思路.关键步骤.代码实现.配图集合.案例应用之详细攻略 目录 GB算法相关文献.论文 GB算法关键步骤 GB算法代码实现 GB案例应用 1.GB用于回归 2.GB用于 ...

  9. EL:集成学习(Ensemble Learning)的概念讲解、问题应用、算法分类、关键步骤、代码实现等相关配图详细攻略

    EL:集成学习(Ensemble Learning)的概念讲解.算法分类.问题应用.关键步骤.代码实现等相关配图详细攻略 目录 集成学习Ensemble Learning 1.集成学习中弱分类器选择 ...

最新文章

  1. h5实现手机端等级进度条
  2. F​P​G​A​工​作​原​理
  3. matlab序列谱分析,基于MATLAB序列谱分析及FFT实现快速卷积.pdf
  4. LocalDateTime日期转换错误:JSON parse error: Cannot deserialize value of type java.time.LocalDateTime
  5. HttpInterceptor 拦截器 - 网络请求超时与重试的简单实现
  6. 这个机器人花盆,给你的植物长了脚脚
  7. 语音识别模块 LD3320
  8. Android BroadcastReceiver(三)
  9. Android TeaPickerView数据级联选择器
  10. 古人道中秋 | 制作一个可拖动的月球
  11. Vue中配置代理服务器
  12. 详解SOME/IP测试
  13. 一些很漂亮的字符图片
  14. 计算机网络网卡作用是什么,什么是网卡?它的作用是什么?
  15. discuz X2数据字典
  16. 曾遭周鸿祎全网封杀的360猛将 :草根打工到36岁身家上亿的逆袭!
  17. 如何实现上传图片并显示图片?
  18. Apple 公司开发者账号添加团队成员
  19. t检验与Z检验的区别★医学统计助手
  20. python pandas获取行号_python获取行号和函数名

热门文章

  1. 如何培养软件工程人才——参加“第一届高等学校软件工程人才培养高峰论坛”有感
  2. vuecli3中img src 的引入问题
  3. 【人工智能方法】简单的搜索算法
  4. 小端模式和大端模式的区别与C++代码检测
  5. 读书札记:影响日元的因素
  6. 小众却又极其实用的5款办公软件,建议收藏转发
  7. 计算机专业毕业设计之避坑指南(开题答辩选导师必看)--告诉你怎么顺利毕业,其他专业也适用
  8. 欧姆龙 CJ1W-ETN21实现Modbus TCP通讯
  9. Go快速、并行的数据库测试 | Gopher Daily (2021.10.03) ʕ◔ϖ◔ʔ
  10. 车无完车 新桑塔纳1.6L自动豪华版