最近在学习半监督学习方面的内容,一开始便遇到了这么几个概念:主动学习(active learning)、半监督学习(semi-supervised learning)和直推学习(transductive learning)。想必刚开始大家都觉得有点迷糊,下面就让我来详细把它们之间的联系与区别讲述一下,相信读完大家一定会思路清晰,至少在概念上不会再搞错了。

  什么是主动学习?

  主动学习指的是这样一种学习方法:有的时候,有类标的数据比较稀少而没有类标的数据是相当丰富的,但是对数据进行人工标注又非常昂贵,这时候,学习算法可以主动地提出一些标注请求,将一些经过筛选的数据提交给专家进行标注。这个筛选过程也就是主动学习主要研究的地方了。

  什么是半监督学习?

  半监督学习特指的是学习算法不需要人工干预,基于自身对未标记数据加以利用,来提高学习模型的泛化性能。

  一般认为半监督学习包含纯半监督学习直推学习

  三者的联系:

  主动学习、纯半监督学习、直推学习都属于利用未标记数据的学习技术,只是其基本思想不同。

      它们的区别:

  主动学习与半监督学习的区别:

  主动学习的主动指的是主动提出标注请求,也就是说还需要一个外在的能够对其进行标注的实体(通常是相关人员),即主动学习是交互进行的。其目标是使用尽量少的“查询”(query)来获得尽量好的性能。主动学习引入了额外的专家知识,用过与外界的交互来将部分未标记样本转变为有标记样本。

  纯半监督学习与直推学习的区别:

  假设有如下的数据集,其中训练集为XL+XU,测试集为Xtest,标记样本数目为L,未标记样本数目为U,L<<U

  • 标记样本(XL,YL)={(x1:L,y1:L)}  
  • 未标记样本XU={xL+1:N},训练时可用
  • 测试样本Xtest={xN+1:},只有在测试时才可以看到

  纯半监督学习是一种归纳学习(inductive learning),可以对测试样本Xtest进行预测。也即纯半监督学习是基于“开放世界”的假设。

  直推学习是transductive学习,仅仅可以对未标记样本XU进行标记,模型不具备对测试样本Xtest进行泛化的能力。直推学习是基于“封闭世界”的假设。

  直推学习假设未标记的数据就是最终要用来测试的数据,学习的目的就是在这些数据上取得最佳泛化能力。相对应的,纯半监督学习在学习时并不知道最终的测试用例是什么。

---------------------------------

  参考:1.机器学习西瓜书 周志华著

2.Active Learning Poll的笔记

     3.半监督学习和直推学习

转载于:https://www.cnblogs.com/yanmk/p/8118864.html

主动学习、纯半监督学习、直推学习的联系与区别相关推荐

  1. 半监督学习:semi-supervised learning 直推学习:transductive learning 主动学习:active learning

    目前,利用未标记示例的主流学习技术主要有三大类:半监督学习(semi-supervised learning).直推学习(transductive learning)和主动学习(active lear ...

  2. 机器学习主动学习和半监督学习

    一.主动学习(active learning) 学习器能够主动选择包含信息量大的未标注的样例并将其交由专家进行标注,然后置入训练集进行训练,从而在训练集较小的情况下获得较高的分类正确率,这样可以有效的 ...

  3. 【深度学习】半监督学习入门:伪标签学习和无监督SVM

    一.半监督学习 1-1.什么是半监督学习 让学习器不依赖外界交互.自动地利用未标记样本来提升学习性能,就是半监督学习(semi-supervised learning). 要利用未标记样本,必然要做一 ...

  4. 深度学习入门 --- 自我学习与半监督学习

    该章节参考ufldl 1.什么是自我学习(Self-Taught Learning)与半监督学习 首先,什么是半监督学习?当你手头上拥有在大量未标注数据和少量的已标注数据,那这种场景就可以说是半监督学 ...

  5. 【深度学习】生动分析半监督学习与负相关学习算法

    [深度学习]生动分析半监督学习与负相关学习算法 文章目录 1 半监督学习1.1 定义1.2 半监督深度学习1.3 GAN1.4 应用 2 深度负相关学习算法2.1 负相关2.2 通俗解释 1 半监督学 ...

  6. 【机器学习 基本概念】监督学习、无监督学习、半监督学习与强化学习

    本文转载自:一文读懂监督学习.无监督学习.半监督学习与强化学习这四种深度学习方式 一般说来,训练深度学习网络的方式主要有四种:监督.无监督.半监督和强化学习.在接下来的文章中,计算机视觉战队将逐个解释 ...

  7. 理解监督学习、无监督学习、半监督学习、强化学习

    目录 监督学习 回归问题 分类问题 无监督学习 半监督学习 强化学习 参考链接 监督学习 监督学习简单来说就是我们给学习算法一个数据集. 这个数据集由"正确答案"组成,然后使用已知 ...

  8. 自我学习,监督学习,半监督学习和迁移学习的区别

    区别 自我学习和半监督学习一样,当前手头上只有少量训练样本,但是周围手头上还有大量无标注样本.举一个经典的例子,分离大象和犀牛. 对于监督学习来说,我们手头有大量大象的样本和犀牛的样本,接下来训练分类 ...

  9. AI之强化学习、无监督学习、半监督学习和对抗学习

    1.强化学习 文章目录 1.强化学习 1.1 强化学习原理 1.2 强化学习与监督学习 2.无监督学习 3.半监督学习 4.对抗学习 强化学习(英语:Reinforcement Learning,简称 ...

  10. 监督学习,非监督学习,半监督学习和增强学习

    分成四类 监督学习,非监督学习,半监督学习和增强学习 监督学习:给机器的训练数据拥有"标记"或者"答案" 监督学习:银行已经积累了一定的客户信息和他们的信用卡的 ...

最新文章

  1. 小米开源FALSR算法:快速精确轻量级的超分辨率模型
  2. cuda 本地内存使用_CUDA 基础知识博客整理
  3. 强化学习笔记 experience replay 经验回放
  4. 'objects' 报错问题
  5. JavaWeb网上图书商城完整项目--day02-14.登录功能的login页面处理
  6. 信息学奥赛一本通 1122:计算鞍点 | OpenJudge NOI 1.8 05:计算鞍点
  7. 前端面试题汇总(jQuery)
  8. Android开发学习笔记:浅谈ToggleButton
  9. HDU2148 Score【序列处理】
  10. windows openssl环境变量_run custom build command for `openssl-sys v0.9.55`
  11. 启发式搜索求解八数码问题(Java实现,八数码小项目已开源)
  12. 转帖:网络知识100问
  13. html表格打印分页无边框_excel怎么显示打印线-表格换页打印没有边框线
  14. 记一个typeorm问题 Main alise is not set
  15. YUI可真是个不错的东东
  16. 【博客431】接入层 汇聚层 核心层
  17. 计算机金融专业排行榜,2020金融学专业大学排名 中国金融专业大学100强
  18. 展讯6500平台架构
  19. 时钟MUX电路结构的时序约束方法分析
  20. 如何一次高效的插入200MB(50万条)的insert语句

热门文章

  1. 【更改google chrome浏览器路径的方法】
  2. 【C/C++】为什么INT_MAX(整形最大值)减去INT_MIN(整形最小值)等于-1
  3. 解决后台传入的大于js最大数值精度的问题
  4. 条形码类型和标准指南:一维、二维条码符号
  5. linux的的符号,linux特殊符号
  6. ICP算法进行点云配准
  7. isolation cell、levelshifter
  8. Flink中的时间和窗口 完整使用 (第六章)
  9. JS中用execCommand(“SaveAs“)保存页面兼容性问题解决方案
  10. IdentityServer4 去掉验证