机器学习关键步骤(二)
机器学习关键步骤(二)
机器学习有四个关键步骤。
(1) 数据准备,理和准备待分析的数据。
(2) 算法选择,根据需求挑选算法为数据建立模型。
(3) 参数调优,优化模型结果。
(4) 模型评估,根据准确度评价模型选出最好的。
2算法选择
2 选择算法
如何选择算法,取决于任务类型。任务大致可以分为 3 大类,每一类对应一些算法,如表所示。
表各种算法及其对应的任务类型
2.1 无监督学习
任务目标:指出数据中隐藏的模式。
当希望找出数据集中隐藏的模式时,可以使用 k 均值聚类、主成分分析、关联规则、社会网络分析等无监督学习算法。之所以称之为无监督学习算法,是因为不知道要找的模式是什么,而是要依靠算法从数据集中发现模式。
以上表中的数据为例,可以应用无监督学习模型找出哪些商品是顾客经常搭配购买的,或者根据购买的商品对顾客进行分类、)。
通过间接手段,可以对无监督学习模型输出的结果进行验证,比如检查得到的顾客分类是否与我们熟悉的分类(如食草动物和食肉动物)相符合。
2.2 监督学习
任务目标:使用数据中的模式做预测。
当需要做预测时,就会用到回归分析、k 最近邻、支持向量机、决策树、随机森林、神经网络等监督学习算法。之所以称之为监督学习算法,是因为它们的预测都基于已有的模式。
以上表中的数据为例,监督学习模型可以根据“顾客类别”以及“是否买鱼”(二者皆为预测变量)来预测“水果购买量”。
通过输入非表中顾客的预测变量值(“顾客类别”和“是否买鱼”),并且对比预测结果和实际的“水果购买量”,可以直接评估监督学习模型的准确度。
像“水果购买量”这样的整型数值或连续数值的预测过程,实际上是在解决回归问题,如图a所示。二元值或分类值的预测过程,如预测是否会下雨,则是在解决分类问题,如图b 所示。尽管如此,大部分分类算法也可以生成连续的概率值,比如预测“降水概率是 75%”,这种预测精度更高。
回归会产生一条趋势线,而分类则会把数据点分组。请注意,这两项任务都可能出错:在回归过程中,某些数据点可能会远离趋势线;在分类过程中,某些数据点可能被错误地分组
2.3 强化学习
任务目标:使用数据中的模式做预测,并根据越来越多的反馈结果不断改进。
无监督学习模型和监督学习模型在部署之后便无法更改。不同于此,强化学习模型自身可以通过反馈结果不断改进。
暂且抛开上表中的动物顾客,举一个实际的例子:假设要比较两个在线广告的效果。首先,让这两个广告的投放频率一样,然后确定每个广告的点击人数。接着,利用强化学习模型把点击人数作为衡量广告受欢迎程度的指标,并根据这个指标提高受欢迎广告的投放频率。通过这样的迭代过程,模型不断得到改进,最终会让广告投放取得更好的效果。
2.4 注意事项
除了要了解算法适用的任务类型之外,还要了解它们在其他方面的不同,比如各种算法对不同数据类型的分析能力,以及结果的本质。
机器学习关键步骤(二)相关推荐
- 机器学习关键步骤(一)
机器学习关键步骤(一) 机器学习有四个关键步骤. (1) 数据准备,理和准备待分析的数据. (2) 算法选择,根据需求挑选算法为数据建立模型. (3) 参数调优,优化模型结果. (4) 模型评估,根据 ...
- 机器学习关键步骤(四)
机器学习关键步骤(四) 机器学习有四个关键步骤. (1) 数据准备,理和准备待分析的数据. (2) 算法选择,根据需求挑选算法为数据建立模型. (3) 参数调优,优化模型结果. (4) 模型评估,根据 ...
- ML之回归预测:机器学习中的各种Regression回归算法、关键步骤配图
ML之回归预测:机器学习中的各种Regression回归算法.关键步骤配图 目录 机器学习中的各种回归算法 1.回归算法代码 2.各种回归算法 3.各种回归算法大PK 机器学习中的各种回归算法 1.回 ...
- 基于模板的通用代码生成器LKGenerator(二)-使用时的关键步骤,注意事项及实例
通过本文,您将了解本代码生成器使用时的关键步骤,使用时的注意事项及实例. 本代码生成器的原理:提供一个可被jvm加载的class文件,然后通过java的注解和反射技术读取信息,通过本工具放入到Velo ...
- 机器学习关键的几门课程_互联网上每门机器学习课程,均按您的评论排名
机器学习关键的几门课程 by David Venturi 大卫·文图里(David Venturi) 互联网上每门机器学习课程,均按您的评论排名 (Every single Machine Learn ...
- 谷歌VR/AR业务副总裁:Daydream是关键步骤,要解决设备摩擦问题
[转] http://36kr.com/p/5076363.html 编者按:2017年谷歌 I/O 开发者大会开幕前,谷歌虚拟现实和增强现实副总裁 Clay Bavor 在 Medium 上分享了一 ...
- 经验分享:布线测试关键步骤有哪些 ?
我们都知道在布线完成之后都免不了布线测试这一环节,但是常常会被忽略几个布线测试关键步骤.今天小编就来说说布线测试关键步骤有哪些. 布线测试关键步骤有哪些:通断测试是基础 通断测试是测试的基础,是对线路 ...
- ML之GB:GB算法相关论文、相关思路、关键步骤、代码实现、配图集合、案例应用之详细攻略
ML之GB:GB算法相关论文.相关思路.关键步骤.代码实现.配图集合.案例应用之详细攻略 目录 GB算法相关文献.论文 GB算法关键步骤 GB算法代码实现 GB案例应用 1.GB用于回归 2.GB用于 ...
- EL:集成学习(Ensemble Learning)的概念讲解、问题应用、算法分类、关键步骤、代码实现等相关配图详细攻略
EL:集成学习(Ensemble Learning)的概念讲解.算法分类.问题应用.关键步骤.代码实现等相关配图详细攻略 目录 集成学习Ensemble Learning 1.集成学习中弱分类器选择 ...
最新文章
- h5实现手机端等级进度条
- F​P​G​A​工​作​原​理
- matlab序列谱分析,基于MATLAB序列谱分析及FFT实现快速卷积.pdf
- LocalDateTime日期转换错误:JSON parse error: Cannot deserialize value of type java.time.LocalDateTime
- HttpInterceptor 拦截器 - 网络请求超时与重试的简单实现
- 这个机器人花盆,给你的植物长了脚脚
- 语音识别模块 LD3320
- Android BroadcastReceiver(三)
- Android TeaPickerView数据级联选择器
- 古人道中秋 | 制作一个可拖动的月球
- Vue中配置代理服务器
- 详解SOME/IP测试
- 一些很漂亮的字符图片
- 计算机网络网卡作用是什么,什么是网卡?它的作用是什么?
- discuz X2数据字典
- 曾遭周鸿祎全网封杀的360猛将 :草根打工到36岁身家上亿的逆袭!
- 如何实现上传图片并显示图片?
- Apple 公司开发者账号添加团队成员
- t检验与Z检验的区别★医学统计助手
- python pandas获取行号_python获取行号和函数名
热门文章
- 如何培养软件工程人才——参加“第一届高等学校软件工程人才培养高峰论坛”有感
- vuecli3中img src 的引入问题
- 【人工智能方法】简单的搜索算法
- 小端模式和大端模式的区别与C++代码检测
- 读书札记:影响日元的因素
- 小众却又极其实用的5款办公软件,建议收藏转发
- 计算机专业毕业设计之避坑指南(开题答辩选导师必看)--告诉你怎么顺利毕业,其他专业也适用
- 欧姆龙 CJ1W-ETN21实现Modbus TCP通讯
- Go快速、并行的数据库测试 | Gopher Daily (2021.10.03) ʕ◔ϖ◔ʔ
- 车无完车 新桑塔纳1.6L自动豪华版