• 无论是生成模型还是判别模型,都可作为一种分类器(classification)来使用;

1. 分类与回归

  • (1)分类的目标变量是标称型数据(categorical data),0/1,yes/no
  • (2)回归:连续型(numeric data),鲍鱼的年龄,玩具的售价

对于分类问题,监督学习从数据中学习一个分类模型或分类决策函数,称为分类器(classifier)。分类器对新的输入进行输出的预测(predication),称为分类(classification),可能的输出称为类 class。

评价分类器性能的指标一般是分类精确率(accuracy),其定义是:对于给定测试数据集,分类器正确分类的样本数和总样本数之比。也就是损失函数是 0-1 损失时测试数据集上的准确率。

L=1N∑n=1N1yn≠g(xn)

L=\frac1N\sum_{n=1}^N1_{y_n\neq g(\mathbf{x}_n)}

回归(Regression)是监督学习的另一个重要问题,回归用于预测输入变量(自变量)和输出变量(因变量)之间的关系,特别是当输入变量的值发生变化时,输出变量的值也随之发生变化。回归模型正是表示从输入变量到输出变量之间映射的函数,回归问题的学习等价于函数拟合。

回归学习最常用的损失函数是平方损失函数,在此情况下,回归问题可以由著名的最小二乘法(least squares)求解。

2. 生成模型与判别模型

  • 生成模型根据联合概率 P(X,Y)P(X,Y),然后求条件概率 P(Y|X)P(Y|X),其提供了一种生成关系,故可还原联合概率分布 P(X,Y)P(X, Y);
  • 判别模型直接学习条件概率 P(Y|X)P(Y|X) 或决策函数 f(X)f(X);

监督学习的任务就是学习一个模型,应用这一模型,对给定的输入预测相应的输出。这个模型的一般形式分为两类:

  • (1)决策函数

    Y=f(X)

    Y=f(X)

  • (2)条件概率分布

    P(Y|X)

    P(Y|X)

监督学习方法又可分为生成方法(generative approach)和判别方法(discriminative approach),所学到的模型分别为生成模型(generative model)和判别模型(discriminative model)。

生成方法由数据学习联合概率分布 P(X,Y)P(X, Y),然后求出条件概率分布 P(Y|X)P(Y|X) 作为预测的模型,即生成模型:

P(Y|X)=P(X,Y)P(X)

P(Y|X)=\frac{P(X,Y)}{P(X)}

这样的方法之所以称为生成方法,是因为模型表示了给定输入 XX 产生输出 YY 的生成关系。典型的生成模型主要有:

  • 朴素贝叶斯法(P(ci|w)=P(ci)P(w|ci)P(w)P(c_i|w)=\frac{P(c_i)P(w|c_i)}{P(w)})

    因为贝叶斯分类器,其实说明了如何通过类条件概率(class-conditional probability)(p(w|ci)p(w|c_i))以及类先验(prior,p(ci)p(c_i))来生成数据的过程和方法。

  • 隐马尔科夫模型(存在隐变量

判别方法由数据直接学习决策函数 f(X)f(X) 或者条件概率分布 P(X,Y)P(X,Y) 作为预测的模型,即判别模型。判别方法关心的是,对给定的输入 XX,应该预测什么样的输出 YY。

生成方法的特点:

  • (1)生成方法可以还原出联合概率分布 P(X,Y)P(X,Y),而判别方法则不能;
  • (2)生成方法的学习收敛速度更快,即当样本容量增加时,学到的模型可以更快地收敛到真实模型;
  • (3)当存在隐变量时,仍可以用生成方法学习,此时判别方法就不能用

判别方法的特点:

  • (1)判别方法直接学习的是条件概率 P(Y|X)P(Y|X) 或决策函数 f(X)f(X),直接面对预测,往往学习的准确率更高
  • (2)由于直接学习 P(Y|X)P(Y|X) 或 f(X)f(X),可以对数据进行各种程度上的抽象、定义特征并使用特征,因此可以简化学习问题。

机器学习基础(二十一)—— 分类与回归、生成模型与判别模型相关推荐

  1. Python机器学习基础教程——鸢尾花分类

    Python机器学习基础教程--鸢尾花分类 初识数据 训练数据与测试数据 观察数据-数据可视化 模型的建立与评估--K近邻算法 她还有一些鸢尾花的测量数据,这些花之前已经被植物学专家鉴定为属于 set ...

  2. 生成模型 VS. 判别模型 Logistic 回归 VS. Softmax 回归

    生成模型 VS. 判别模型 从概率分布的角度考虑,对于一堆样本数据,每个均有特征Xi对应分类标记yi. 生成模型:学习得到联合概率分布P(x,y),即特征x和标记y共同出现的概率,然后求条件概率分布. ...

  3. 【机器学习】生成模型与判别模型详解

    生成模型与判别模型 1.定义 2.通俗解释 例1:猫狗分类 例2:如何确定一只羊是山羊还是绵羊 例3.识别一种语言是哪种语言 例4.跟踪问题 3.如何选择哪种模型 主要来源:[白话解析] 深入浅出最大 ...

  4. 生成模型和判别模型的对比,懂这俩机器学习不在话下 最大熵模型

    决策函数:最大熵模型 最大熵模型:判别模型:构建特征和标签的映射通过计算条件熵(在已知条件下做风险最低的预测,万物熵增的规律启发) 生成:HMM,BAYES 一般来说,生成式模型需要非常充足的数据量以 ...

  5. 机器学习中的生成模型与判别模型

    1.概述 在机器学习中,对于有监督学习,它的任务就是要学习一个模型,应用这个模型,对给定的输入预测相应的输出.监督学习方法可以分为生成方法(generative approach)和判别方法(disc ...

  6. 机器学习中生成模型和判别模型

    监督学习的任务是学习一个模型,应用这一模型,对给定的输入预测相应的输出.这个模型的一般形式为决策函数: Y=f(X)Y=f(X)Y=f(X)或者条件概率分布:P(Y∣X)P(Y|X)P(Y∣X)监督学 ...

  7. 生成模型和判别模型直接的区别

    作者:JasonDing 链接:https://www.jianshu.com/p/d195b887a32e 來源:简书 简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处. 概率图分 ...

  8. [work] 生成模型和判别模型的理解

    转载自:https://blog.csdn.net/zouxy09/article/details/8195017 https://blog.csdn.net/lk7688535/article/de ...

  9. 生成模型与判别模型区别

    概念理解 监督学习方法可分为两大类,即生成方法与判别方法,它们所学到的模型称为生成模型与判别模型. 判别模型:判别模型是学得一个分类面(即学得一个模型),该分类面可用来区分不同的数据分别属于哪一类: ...

最新文章

  1. Javascript中计算脚本运行的时间
  2. Python的第一个程序 Hello world
  3. 淘宝2011.9.21校园招聘会笔试题
  4. 学习SQL数据查询,这一篇就够了!
  5. linux c之解决array subscript is not integer和AF_NET not undeclared
  6. Spring3.1.0+Quartz1.8.6整合实现计划任务
  7. (SRNTT)Image Super-Resolution by Neural Texture Transfer
  8. 在线985,211高校查询
  9. 2021年流动式起重机司机模拟考试题库及流动式起重机司机模拟考试系统
  10. java自动阅卷判断选择题,客观题型自动阅卷系统(管道过滤器模式)
  11. 2008.12.8希世软件杭州公司
  12. 软件测试习题(附答案)
  13. android google翻译,在android中施用google翻译
  14. 2304558-25-4,DBCO-PEG2-acid分子量是464.5的小分子PEG试剂带有PEG连接物和DBCO基团
  15. PHP微信公众平台开发高级篇--微信JS-SDK
  16. 计算机英语作文50词左右带翻译,找十篇英语作文,带翻译,50个词
  17. 异步FIFO基本原理(基于Verilog的简单实现)
  18. Pip/python-如何查看已安装的包有哪些版本?如何查看某个包存在哪些版本?pip list-pip freeze-pip show package
  19. python会员折扣_Python骚操作 | 用python爆破某会员网站
  20. 帮助计算机网络犯罪活动罪司法解释,帮助信息网络犯罪活动罪司法适用研究

热门文章

  1. 隐藏窗体关闭按钮_VB编程(五)按钮和窗体
  2. weui上传组件的图片封装到formdata_自定义toast-ui富文本组件的图片黏贴上传
  3. 51nod 1770 数数字
  4. 剑指offer面试题52. 两个链表的第一个公共节点(双指针法)
  5. 剑指offer面试题53 - I. 在排序数组中查找数字 I(二分查找)
  6. 图像灰度化的三种方法(matlab、C++、Python实现)
  7. ​​​​​​​CUDA ---- Shared Memory
  8. C++总结:static_cast ,reinterpret_cast
  9. 聚类算法教程(3):层次聚类算法Hierarchical Clustering Algorithms
  10. [UE4]Cast to转换数据类型