最近在学习半监督学习方面的内容,一开始便遇到了这么几个概念:主动学习(active learning)、半监督学习(semi-supervised learning)和直推学习(transductive learning)。想必刚开始大家都觉得有点迷糊,下面就让我来详细把它们之间的联系与区别讲述一下,相信读完大家一定会思路清晰,至少在概念上不会再搞错了。

  什么是主动学习?

  主动学习指的是这样一种学习方法:有的时候,有类标的数据比较稀少而没有类标的数据是相当丰富的,但是对数据进行人工标注又非常昂贵,这时候,学习算法可以主动地提出一些标注请求,将一些经过筛选的数据提交给专家进行标注。这个筛选过程也就是主动学习主要研究的地方了。

  什么是半监督学习?

  半监督学习特指的是学习算法不需要人工干预,基于自身对未标记数据加以利用,来提高学习模型的泛化性能。

  一般认为半监督学习包含纯半监督学习直推学习

  三者的联系:

  主动学习、纯半监督学习、直推学习都属于利用未标记数据的学习技术,只是其基本思想不同。

      它们的区别:

  主动学习与半监督学习的区别:

  主动学习的主动指的是主动提出标注请求,也就是说还需要一个外在的能够对其进行标注的实体(通常是相关人员),即主动学习是交互进行的。其目标是使用尽量少的“查询”(query)来获得尽量好的性能。主动学习引入了额外的专家知识,用过与外界的交互来将部分未标记样本转变为有标记样本。

  纯半监督学习与直推学习的区别:

  假设有如下的数据集,其中训练集为XL+XU,测试集为Xtest,标记样本数目为L,未标记样本数目为U,L<<U

  • 标记样本(XL,YL)={(x1:L,y1:L)}  
  • 未标记样本XU={xL+1:N},训练时可用
  • 测试样本Xtest={xN+1:},只有在测试时才可以看到

  纯半监督学习是一种归纳学习(inductive learning),可以对测试样本Xtest进行预测。也即纯半监督学习是基于“开放世界”的假设。

  直推学习是transductive学习,仅仅可以对未标记样本XU进行标记,模型不具备对测试样本Xtest进行泛化的能力。直推学习是基于“封闭世界”的假设。

  直推学习假设未标记的数据就是最终要用来测试的数据,学习的目的就是在这些数据上取得最佳泛化能力。相对应的,纯半监督学习在学习时并不知道最终的测试用例是什么。

转自:MKYAN

半监督学习:主动学习、纯半监督学习和直推学习区别和联系相关推荐

  1. 半监督学习:semi-supervised learning 直推学习:transductive learning 主动学习:active learning

    目前,利用未标记示例的主流学习技术主要有三大类:半监督学习(semi-supervised learning).直推学习(transductive learning)和主动学习(active lear ...

  2. 机器学习主动学习和半监督学习

    一.主动学习(active learning) 学习器能够主动选择包含信息量大的未标注的样例并将其交由专家进行标注,然后置入训练集进行训练,从而在训练集较小的情况下获得较高的分类正确率,这样可以有效的 ...

  3. 【深度学习】半监督学习入门:伪标签学习和无监督SVM

    一.半监督学习 1-1.什么是半监督学习 让学习器不依赖外界交互.自动地利用未标记样本来提升学习性能,就是半监督学习(semi-supervised learning). 要利用未标记样本,必然要做一 ...

  4. 深度学习入门 --- 自我学习与半监督学习

    该章节参考ufldl 1.什么是自我学习(Self-Taught Learning)与半监督学习 首先,什么是半监督学习?当你手头上拥有在大量未标注数据和少量的已标注数据,那这种场景就可以说是半监督学 ...

  5. 【科普】半监督学习的概述与思考,及其在联邦学习场景下的应用

    关注公众号,发现CV技术之美 在现实世界中,数据往往存在各种各样的问题,例如:图片分类模型对标注数据的依赖性很强.标注图片数据难以获取.大量未标注数据存在.针对某个场景的数据量过小-等等问题. 在联邦 ...

  6. 【深度学习】有监督学习、无监督学习、半监督学习

    本文目录 有监督学习(Suspervised Learning) 常见的有监督学习 无监督学习(Unsupervised Learning) 常见的无监督学习 半监督学习(Semi-supervise ...

  7. AI之强化学习、无监督学习、半监督学习和对抗学习

    1.强化学习 文章目录 1.强化学习 1.1 强化学习原理 1.2 强化学习与监督学习 2.无监督学习 3.半监督学习 4.对抗学习 强化学习(英语:Reinforcement Learning,简称 ...

  8. 系统学习机器学习之弱监督学习(二)--半监督学习综述

    一.半监督学习 1-1.什么是半监督学习 让学习器不依赖外界交互.自动地利用未标记样本来提升学习性能,就是半监督学习(semi-supervised learning). 要利用未标记样本,必然要做一 ...

  9. 主动学习与半监督算法结合在支付宝风控的应用

    以下内容均来自互联网,系笔者汇总并总结 2018蚂蚁金服ATEC大赛 1 .赛题任务描述 在金融行业中,风控系统与黑产的攻防几乎是无时不刻的存在着,风控系统中用来实时识别风险的机器学习模型需要在黑产攻 ...

  10. 一文看懂半监督学习(Semi-supervised Learning)和自监督学习(Self-Supervised Learning)

    前言 网络上很多关于此的文章,在这里进行一个梳理 参考: https://zhuanlan.zhihu.com/p/33196506 https://zhuanlan.zhihu.com/p/1395 ...

最新文章

  1. C#抽象类和抽象方法的特征和用途
  2. linux命令之查看文件内容加上行号-nl
  3. android adb 传文件大小,使用adb在电脑和手机间传文件
  4. [OS复习]存储管理1
  5. 几何画板中可以这样选择对象
  6. Oracle入门(十四A)之PL/SQL 基本结构
  7. python queue windows_python Queue模块
  8. EasyRecovery如何恢复ps的psd文件
  9. call方法和apply方法
  10. 1060 Are They Equal (25 分)科学计数法,stl中string的各种函数用法
  11. 分享几个在线作图工具
  12. 文件同步工具 GoodSync Enterprise 破解
  13. IoT数据科学与传统数据科学的10个差异
  14. windows应用商店打不开,错误代码0x80131500
  15. moment 时间日期处理库 解析部分
  16. python协程爬取斗鱼美女图片
  17. b站推荐怎么重置_b站手机怎么上传视频
  18. 软件设计师:07-法律法规与标准化与多媒体基础
  19. 关于阿里云OSS资源STS访问控制
  20. vSphere高级功能(一)——VMotion及SVMotion的实现

热门文章

  1. OC5128欧创芯原装芯片,开关降压型恒流驱动芯片
  2. 网络层 详解,网络层功能,网络层协议,网络层设备。
  3. 翻译 Learning Unsupervised Video Object Segmentation through Visual Attention
  4. python uint8怎么定义_Python ctypes.c_uint8方法代码示例
  5. 中信证券java面试_中信证券面试问题分享
  6. 计算机光驱启动设置,光驱启动怎么设置
  7. 缓和曲线——回旋曲线的计算
  8. Steve Yegge:Google面试秘籍
  9. Arduino开发ESP8266之ADS1115模数转换
  10. (一)绪论 | 如何判断某数据结构是逻辑结构还是存储结构,是线性结构还是非线性结构