区分回归问题和分类问题
回归问题和分类问题的区别
- 回归问题
用一个经典的问题来解释:假设你想买房子,手头上仅有的是之前出售的房子的占地面积大小和房子的价格,你想凭借手头上的这些数据来买一套不错的房子,那么你仅有的关于房子的信息是房子的占地大小,也就是就一个特征,那么这样的问题被称为单一特征回归问题。
再假设一下,还是买房子,如果此时你手头上除了房子的占地大小这一个信息之外,还有房子邻街的距离、房子的高度、房子的周围的环境等等信息,你想凭借这些信息来选一套房子,那么此时你所拥有的是关于房子的多个特征,这样的问题是多特征回归问题。
总结一下,除了特征的数量不同,这两种描述都是回归问题,回归问题的特点是你所预测的量是一个连续的值,比如这里是预测房屋价格,价格是一个连续的值。 - 分类问题
用一个简单的例子:西瓜的好坏。给定西瓜的若干特征,需要你根据这些特征来判断这个西瓜是好是坏。所给的特征可以是一个也可以是多个。
分类问题的最大的特点是所预测的值是离散的,比如这里的西瓜的好坏,两种情况,不是好就是坏。再比如是否生病,不是生病就是不生病。当然这两个例子都是两种情况的分类问题即二分类,如果多分类问题呢?比如手写数字识别,就是多分类问题,对于一张照片传进来,只能判断是0~9之间的一个数字,其他的就不会预测。
说完两者的简单介绍以及区别之后,思考为什么多数线性回归不适合用在分类问题上(为了好理解我们拿线性假设函数来说明)?
比如下面的这个图:
是一个回归问题,因为因变量是一个连续的值,我们可以使用一条一线来拟合它。看看下面这张图:
假设它的横坐标的含义是肿瘤的大小,纵坐标代表是否有癌症,那么这样的问题是一个二分类问题,如果数据量不多,如这个图一样,用一条直线来拟合还说的过去,如果在x=30的地方有一个值,毫无疑问,很遗憾这位病人患了癌症,这个值能去掉吗?不能,它仍然有意义,这样的情况下如果还是用线性回归来拟合会很不适合。其实其他的例子也可以说明线性回归不适合用来预测分类问题。
区分回归问题和分类问题相关推荐
- 【机器学习基础】(三):理解逻辑回归及二分类、多分类代码实践
本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇.本文的概念相对简单,主要侧重于代码实践. 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题.我们可以从 ...
- 降维后输入分类器分类时报错_逻辑回归解决多分类方法及其优缺点分析
众所周知,逻辑回归常用于解决二分类任务,但是在工作/学习/项目中,我们也经常要解决多分类问题.本文总结了 3 种逻辑回归解决多分类的方法,并分析了他们的优缺点. 一.One-Vs-Rest 假设我们要 ...
- 机器学习:理解逻辑回归及二分类、多分类代码实践
作者 | caiyongji 责编 | 张红月 来源 | 转载自 caiyongji(ID:cai-yong-ji) 本文的概念相对简单,主要侧重于代码实践.现实生活中不止有预测的问题还有分类的问 ...
- 机器学习(三):理解逻辑回归及二分类、多分类代码实践
本文是机器学习系列的第三篇,算上前置机器学习系列是第八篇.本文的概念相对简单,主要侧重于代码实践. 上一篇文章说到,我们可以用线性回归做预测,但显然现实生活中不止有预测的问题还有分类的问题.我们可以从 ...
- 贝叶斯岭回归(BayesianRidge)、自动关联决策回归、高斯过程、核函数、及高斯回归、高斯过程分类
贝叶斯岭回归(BayesianRidge).自动关联决策回归.高斯过程.核函数.及高斯回归.高斯过程分类 目录
- 【深度学习】Keras实现回归和二分类问题讲解
[深度学习]Keras实现回归和二分类问题讲解 文章目录 [深度学习]Keras实现回归和二分类问题讲解 1 回归问题1.1 波士顿房价预测数据集1.2 构建基准模型1.3 数据预处理1.4 超参数 ...
- Keras【Deep Learning With Python】逻辑回归·softmax多分类与交叉熵
文章目录 1 逻辑回归 1.2 Sigmod函数 1.2 逻辑回归损失函数 2 交叉熵 3 softmax分类 1 逻辑回归 回答0或1 1.2 Sigmod函数 0.9是好人 0.1是坏人 二分类 ...
- stanford coursera 机器学习编程作业 exercise 3(逻辑回归实现多分类问题)
本作业使用逻辑回归(logistic regression)和神经网络(neural networks)识别手写的阿拉伯数字(0-9) 关于逻辑回归的一个编程练习,可参考:http://www.cnb ...
- 用二项逻辑斯蒂回归解决二分类问题
逻辑斯蒂回归: 逻辑斯蒂回归是统计学习中的经典分类方法,属于对数线性模型.logistic回归的因变量可以是二分类的, 也可以是多分类的 基本原理 logistic 分布 折X是连续的随机变量,X服从 ...
最新文章
- Delphi_01_控制台版HelloWorld
- VScode中Python的交互式命令环境使用笔记
- 六、WebApp 二手信息站点页面制作(IVX 快速开发教程)
- java 8 排序_一遍记住 8 种排序算法与 Java 代码实现
- 超详细在Ubuntu下安装JDK图文解析
- python-day74--知识总体总结
- Java 设计模式 之 访问者模式
- 计算机网络及标准化组织
- js中this指向的四种规则+ 箭头函数this指向
- 系统学习机器学习之cox模型
- 计算机操作系统32位,电脑操作系统中32位和64位的区别
- Mac删除软件之后图标还在怎么办?
- 【javaEE】网络编程套接字
- linux下安装以太坊(ETH/ETC)节点
- validate.js
- superset 1.3 地图 汉字 展示,省市编码 ISO3166
- SQLServer 2008中事务日志已满问题处理
- 三层网络渗透测试实验
- 博弈论——非合作博弈 什么是纳什均衡
- java oxygen下载_Eclipse 下载 安装 (Oxygen版本)
热门文章
- matlab contourf设置范围,如何使用matlab contourf绘制二维决策边界
- Webpack前端源码泄露漏洞
- pywinauto 使用
- 什么样的程序员在 35 岁以后依然被公司抢着要?
- zynq-7000系列基于zynq-zed的linux-uboot的编译
- Java实现多线程的几种方式
- HTML5 +Java基础 大一结业认证考试试题 - 云南农业职业技术学院 - 互联网技术学院 - 美和易思校企合作专业
- java获取两个日期之间的所有日期(包括开始日期和结束日期)
- Java泛型Generics
- iOS 字典转模型纯swift框架HandyJSON使用实例:本地存取