机器学习基础 | 监督学习与无监督学习的快速入门指南
介绍
监督学习和无监督学习有什么区别?
对于机器学习的初学者和新手来说,这是一个常见的问题。答案是理解机器学习算法本质的核心。如果没有明白监督学习与无监督学习之间的区别,你的机器学习之旅就无法继续进行。
实际上,这是你踏上机器学习之旅之初应该学习的东西。如果我们不了解线性回归,逻辑回归,聚类,神经网络等算法的适用范围,就不能简单地跳到模型构建阶段。
如果我们不知道机器学习算法的目标是什么,我们将无法建立一个准确的模型。这就是监督学习与无监督学习的由来。
在这篇文章中,我将用例子讨论这两个概念,并回答一个大问题——如何决定何时使用监督学习或非监督学习?
什么是监督学习?
在监督学习中,计算机是通过数据来训练的。它从过去的数据中学习,并将学习到的东西应用到现在的数据中,以预测未来的事件。在这种情况下,输入数据和期望的输出数据都为预测未来事件提供帮助。
为了准确预测,输入数据被标记了正确的类别。
监督机器学习分类
重要的是要先记住,所有有监督学习算法本质上都是复杂的算法,分为分类或回归模型。
1) 分类模型:分类模型用于输出变量可以分类的问题,例如“是”或“否”、“通过”或“失败”。分类模型用于预测数据的类别。现实生活中的例子包括垃圾邮件检测、情绪分析、考试记分卡预测等。
2) 回归模型:回归模型用于输出变量为实际值的问题,例如唯一的数字、美元、工资、体重或压力。它通常用于根据先前的数据观测预测数值。一些比较常见的回归算法包括线性回归、logistic回归、多项式回归和岭回归。
监督学习算法在现实生活中有一些非常实际的应用,包括:
文本分类
人脸检测
签名识别
客户发现
垃圾邮件检测
天气预报
根据当前市场价格预测房价
股票价格预测等
什么是无监督学习?
另一方面,无监督学习是训练机器使用既没有分类也没有标记的数据的方法,这意味着不能提供任何训练数据,机器只能自己学习。机器必须能够对数据进行分类,而无需事先提供任何有关数据的信息。
其思想是将机器暴露在大量变化的数据中,并允许它从这些数据中学习,以提供以前未知的见解,并识别隐藏的模式。因此,没有必要定义无监督学习算法的结果,相反,它确定了与给定数据集不同或有趣的内容。
这台机器需要编程才能自动学习。计算机需要理解结构化和非结构化数据。以下是无监督学习的精确说明:
1)聚类是最常见的无监督学习方法之一。聚类的方法包括将未标记的数据组织到称为聚类的集群中。因此,集群是类似数据项的集合。这里的主要目标是发现数据点之间的相似性,并将相似的数据点分组到一个集群中。
2)异常检测是指识别与大部分数据有显著差异的稀有项、事件或观测值的方法。我们通常在数据中寻找异常或异常值,因为它们是可疑的。异常检测常用于银行诈骗和医疗差错检测。
无监督学习算法的应用
无监督学习算法的一些实际应用包括:
欺诈检测
恶意软件检测
数据输入过程中人为错误的识别
进行精确的购物篮分析等
你应该怎么选择监督学习和无监督学习?
在制造业中,哪种机器学习方法最适合给定的任务受着有许多因素的影响。而且,由于每个机器学习问题都是不同的,决定使用哪种技术是一个复杂的过程。
一般来说,磨练正确机器学习方法的一个好策略是:
评估数据。它有标签吗?是否有专家知识支持附加标签?这将有助于确定是否应使用有监督、无监督、半监督或强化的学习方法
明确目标。这个问题是反复出现的吗?或者,该算法是否有望预测新的问题?
回顾在维数(特征、属性或特征的数量)方面可能适合该问题的现有算法。候选算法应该适合整个数据量及其结构
研究算法类型在相似问题中的成功应用
最后的话
监督学习和非监督学习是机器学习领域的关键概念。在学习不同的机器学习算法之前,对基础知识的正确理解是非常重要的。
原文链接:https://www.analyticsvidhya.com/blog/2020/04/supervised-learning-unsupervised-learning/
☆ END ☆
如果看到这里,说明你喜欢这篇文章,请转发、点赞。微信搜索「uncle_pn」,欢迎添加小编微信「 mthler」,每日朋友圈更新一篇高质量博文(无广告)。
↓扫描二维码添加小编↓
机器学习基础 | 监督学习与无监督学习的快速入门指南相关推荐
- 【机器学习基础】通俗易懂无监督学习K-Means聚类算法及代码实践
K-Means是一种无监督学习方法,用于将无标签的数据集进行聚类.其中K指集群的数量,Means表示寻找集群中心点的手段. 一. 无监督学习 K-Means 贴标签是需要花钱的. 所以人们研究处理无标 ...
- 【51单片机快速入门指南】2.2:任意位/任意长度数码管显示数字、小数
目录 源码 Tube.c Tube.h main.c 效果 8位数码管 正整数 负整数 正小数 负小数 6位数码管 正整数 负整数 正小数 负小数 4位数码管 正整数 负整数 正小数 负小数 普中51 ...
- 机器学习概念 — 监督学习、无监督学习、半监督学习、强化学习、欠拟合、过拟合、后向传播、损失和优化函数、计算图、正向传播、反向传播
1. 监督学习和无监督学习 监督学习 ( Supervised Learning ) 和无监督学习 ( Unsupervised Learning ) 是在机器学习中经常被提及的两个重要的学习方法. ...
- 吴恩达机器学习之引言:入门、机器学习是什么、监督学习、无监督学习、推荐Octave软件进行开发
吴恩达机器学习栏目清单 专栏直达:https://blog.csdn.net/qq_35456045/category_9762715.html 文章目录 引言(Introduction) 1.1 欢 ...
- 机器学习一 -- 什么是监督学习和无监督学习?
机器学习中的监督学习和无监督学习 说在前面 最近的我一直在寻找实习机会,很多公司给了我第一次电话面试的机会,就没有下文了.不管是HR姐姐还是第一轮的电话面试,公司员工的态度和耐心都很值得点赞,我也非常 ...
- 机器学习丨监督学习与无监督学习
较为通俗易懂的参考:2 监督学习与无监督学习 表述比较清晰的参考:监督学习和无监督学习的区别 前言 机器学习算法最主要两个分类就是监督学习.无监督学习.(此外强化学习和推荐系统也都是机器学习算法的一员 ...
- 机器学习系列 1:监督学习和无监督学习
https://www.toutiao.com/a6690813539747103246/ 2019-05-15 09:31:00 机器学习系列 1:监督学习和无监督学习 机器学习就是通过一大堆数据集 ...
- 监督学习与无监督学习的区别_机器学习
最近发现很多人还是不能真正分清机器学习的学习方法,我以个人的愚见结合书本简单说一下这个 机器学习中,可以根据学习任务的不同,分为监督学习(Supervised Learning),无监督学习(Unsu ...
- Coursera机器学习笔记(一) - 监督学习vs无监督学习
转载 http://daniellaah.github.io/2016/Machine-Learning-Andrew-Ng-My-Notes-Week-1-Introduction.html 一. ...
最新文章
- Python中的super()函数
- SecureCRT上传和下载文件
- 分析开源项目源码,我们该如何入手分析?(授人以渔)
- 【深度学习】GPU选型调研!3090依旧是性价比之王
- SwiftUI3.0用户登录输入非空校验经典案例
- 鸿蒙系统起飞!Flutter 完全适配指南
- 移动端页面兼容性问题解决方案整理
- 隨身碟檔案救援軟體救援刪除的檔案/丟失的資料
- 五边形组合包络图matlab,华中赛基于遗传算法的钢构件排料问题.docx
- Apache2 MPM 模式了解
- python生成随机字符串和数字
- 带你了解Google搜索引擎的竞价排名是怎样实现的?
- 微星B450M安装ubuntu 18.04 BIOS更改启动顺序
- web的一些基本名词概念
- [转]为何我们这样一个“丑陋”的种族,能够屹立……
- CentOS 7 下安装 chrome
- Windows7 64位环境下Python-igraph环境配置
- P1000 超级玛丽游戏 题解
- 运营商大数据:什么是人群画像分析?如何做到精准获客?
- 彩虹监控网站商用源码修复版
热门文章
- 3分钟读懂机器人视觉:单目、双目、多目、全景、混合...
- 麻将胡牌算法,带癞子
- Android Gallery2流程分析
- python 图形界面“诈金花”游戏,更新了!附完整代码
- Rust Rocket框架跨域设置
- 美国IT行业软件开发经理收入最高?程序员是不是最后非得转管理?
- python实现借助360加固保代码实现批量、断点再续等功能
- 搭建外卖服务器系统,本地外卖系统如何更好的搭建
- java ean13_Android/java EAN-13 数字码转条形码
- SSO单点登录教程(四)自己动手写SSO单点登录服务端和客户端