回归和分类的区别

首先假设线性回归是个黑盒子,那按照程序员的思维来说,这个黑盒子就是个函数。我们只要往这个函数传一些参数作为输入,就能得到一个结果作为输出。那回归是什么意思呢?其实就是这个黑盒子输出的结果是个连续的、不固定的值。如果输出不是个连续值而是个离散、固定的那就叫分类。那什么叫做连续值呢?非常简单,举个栗子:比如我告诉你我这里有间房子,这间房子有40平,然后你来猜一猜我的房子总共值多少钱?这就是连续值,因为房子可能值80万,也可能值80.2万,也可能值80.21万。再比如,我告诉你我有间房子,120平,总共值180万,然后你来猜猜我这间房子会有几个卧室?那这就是离散值了。因为卧室的个数只可能是1, 2, 3,4,充其量到5个封顶了,这样预测的值就是固定的那几个,而且卧室个数也不可能是什么1.1, 2.9个。所以只要知道我要完成的任务是预测一个连续值的话,那这个任务就是回归问题,离散值的话就是分类问题。

机器学习中的回归和分类是什么?

数据科学家使用许多不同类型的机器学习算法来发现大数据中的模式,这些模式可带来切实可行的见解。 从较高的层次上讲,这些不同的算法可以根据它们“学习”数据进行预测的方式分为两类:监督学习和无监督学习。

有监督的机器学习:大多数实际的机器学习都使用有监督的学习。 在监督学习中,您具有输入变量(x)和输出变量(Y),并使用一种算法来学习从输入到输出的映射函数Y = f(X)。 目标是很好地近似映射函数,以便在拥有新的输入数据(x)时可以预测该数据的输出变量(Y)。

监督机器学习算法的技术包括线性和逻辑回归,多类分类,决策树和支持向量机。 有监督的学习要求用于训练算法的数据已被正确答案标记。 例如,分类算法将在经过训练的图像数据集上学会识别动物,该图像数据集已正确标记了动物的种类和某些识别特征。

监督学习问题可以进一步分为回归和分类问题。 这两个问题的目标都是构建一个简洁的模型,该模型可以根据属性变量来预测从属属性的值。 两项任务之间的区别在于,从属属性对于回归而言是数值的,而对于分类则是分类的。

回归

回归问题是当输出变量是实数或连续值时,例如“工资”或“权重”。 可以使用许多不同的模型,最简单的是线性回归。 它试图使数据适合通过这些点的最佳超平面。

举些例子:
以下哪项是回归任务?

预测一个人的年龄
预测一个人的国籍
预测公司的股价明天是否会上涨
预测文件是否与目击不明飞行物有关?

答案:预测一个人的年龄。

分类

分类问题是当输出变量是类别时,例如“红色”或“蓝色”或“疾病”和“没有疾病”。 分类模型试图从观测值得出一些结论。 给定一个或多个输入,分类模型将尝试预测一个或多个结果的价值。
例如,当过滤电子邮件为“垃圾邮件”或“非垃圾邮件”时,在查看交易数据时为“欺诈性”或“授权”。 简而言之,分类要么预测分类类别标签,要么根据训练集和分类属性中的值(分类标签)对数据分类(构建模型),并将其用于分类新数据。 有许多分类模型。 分类模型包括逻辑回归,决策树,随机森林,梯度提升树,多层感知器,朴素贝叶斯。

例如 :
以下哪个是分类问题?

通过他/她的笔迹样式预测一个人的性别

根据面积预测房价

预测明年的季风是否正常

预测下个月将出售音乐专辑的份数

答案:预测一个人的性别预测明年的季风是否正常。 另外两个是回归。

参考:

  • 通俗理解线性回归(一)
  • 回归问题简介以及与分类问题的区别
  • 数据科学&机器学习

机器学习_回归和分类的区别相关推荐

  1. 浅谈机器学习-回归与分类的区别

    前言 机器学习的主要任务便是聚焦于两个问题:分类和回归.本文将浅谈下两者的区别. 区别 回归会给出一个具体的结果,例如房价的数据,根据位置.周边.配套等等这些维度,给出一个房价的预测.         ...

  2. 人人都能看懂的机器学习!3个案例详解聚类、回归、分类算法

    导读:机器是怎样学习的,都学到了什么?人类又是怎样教会机器学习的?本文通过案例给你讲清楚各类算法的原理和应用. 机器学习,一言以蔽之就是人类定义一定的计算机算法,让计算机根据输入的样本和一些人类的干预 ...

  3. 机器学习 --- 1. 线性回归与分类, 解决与区别

     机器学习可以解决很多问题,其中最为重要的两个是 回归与分类. 这两个问题怎么解决, 它们之间又有什么区别呢? 以下举几个简单的例子,以给大家一个概念 1. 线性回归 回归分析常用于分析两个变量X ...

  4. 轻松看懂机器学习!3个案例详解聚类、回归、分类算法

    来源:大数据 本文共7300字,建议阅读10+分钟. 机器是怎样学习的,都学到了什么?人类又是怎样教会机器学习的?本文通过案例给你讲清楚各类算法的原理和应用. 机器学习,一言以蔽之就是人类定义一定的计 ...

  5. 机器学习 多变量回归算法_如何为机器学习监督算法识别正确的自变量?

    机器学习 多变量回归算法 There is a very famous acronym GIGO in the field of computer science which I have learn ...

  6. 逻辑回归是分类还是回归_分类和回归:它们是否相同?

    逻辑回归是分类还是回归 You might have come across the terms Regression and Classification, and might as well th ...

  7. 端到端机器学习_端到端机器学习项目:评论分类

    端到端机器学习 In this article, we will go through a classification problem that involves classifying a rev ...

  8. 机器学习核心总结-概念、线性回归、损失函数、泛化及数据集划分、特征工程、逻辑回归和分类

    文章目录 一.机器学习入门概念 一.基本概念 机器学习:让机器进行学习和决策 机器学习分类:无监督学习.监督学习.强化学习 深度学习:模拟人脑,自动提取输入特征,是实现机器学习的方式之一 神经网络:一 ...

  9. 机器学习_用树回归方法画股票趋势线

     本篇的主题是分段线性拟合,也叫回归树,是一种集成算法,它同时使用了决策和线性回归的原理,其中有两点不太容易理解,一个是决策树中熵的概念,一个是线性拟合时求参数的公式为什么是由矩阵乘法实现的.如需详解 ...

  10. 吴恩达机器学习之逻辑回归(二分类)

    吴恩达机器学习之逻辑回归 逻辑回归 二分类逻辑回归 二分类逻辑回归案例 python代码实现(含详细代码注释): 案例中几个问题的解析 不同于线性回归,逻辑回归的hθ(x)还需要用sigmoid函数处 ...

最新文章

  1. 2015级C++第14周程序阅读 STL中的简单容器和迭代器
  2. LVS+keepalived负载均衡
  3. 17.2?Replication Implementation 复制实施:
  4. linux top命令简介
  5. HDP安全之集成kerberos/LDAP、ranger;安装部署kerberos;安装Knox;安装LDAP;启动LDAP;验证Knox网关
  6. python电子病历数据挖掘_数据挖掘技术在基于XML的电子病历中的应用研究
  7. .NET Core 在 K8S 上的开发实践--学习笔记
  8. Tensorflow深度学习应用(进阶篇)
  9. linux平台C++开发基本知识
  10. Flink State 最佳实践
  11. lodash和debounce
  12. 《精通ArcGIS Server 应用与开发》——1.3 ArcGIS 10 Mobile新特性1
  13. 高德h5定位误差_高德地图定位JS API不准确问题
  14. LC053-最大子序和
  15. 计算机 64虚拟内存设置方法,64位的WIN7,4G内存,虚拟内存怎么设置
  16. OKHttp源码详解_tony_851122
  17. android隐藏虚拟按键的几种方式
  18. win10隐藏输入法指示器的设置方法
  19. 阿里品牌数据银行分析师认证
  20. yii2授权之ACF

热门文章

  1. maven私服nexus-bundle的安装和启动
  2. SlidingMenu第三篇 --- SlidingMenu使用介绍
  3. 洛谷P3749 [六省联考2017]寿司餐厅
  4. 【解决办法】hosts文件被劫持或者看不到办法
  5. HTTP请求报文格式
  6. centos 安装 Vagrant
  7. jquery手机模拟器
  8. Hadoop1.2.0开发笔记(九)
  9. 向日葵Gantt支持的XML 数据结构
  10. 同一个网址,根据pc跟移动端,跳到对应页面