主动学习综述(ACTIVE LEARNING)
2019独角兽企业重金招聘Python工程师标准>>>
Active learning process
算法:主动学习算法伪代码描述
输入:未标记样本U,标记样本集L,学习引擎LE,采样引擎SE
输出:学习引擎SE
BeginFor:i=1,2,…,N
Train(LE,L); //通过标记样本集L训练分类器f
T=Test(LE,U);
S=Select(SE,U);
Label(S) ; //对集合S中的样本进行标记
L<—L + S
U<—U - S
Until 迭代次数达到某阈值,或达到其他终止条件
Active Learning
- Membership Query Synthesis
- Stream-Based Selective Sampling
- Pool-Based Active Learning
Membership Query Synthesis
- 实验者可以选择询问输入空间中任何一个未标识的实例,包括实验者自己创建的,而不仅仅是来自某个自然分布的实例。好的询问关系经常是易处理的或者在有限的领域内是有效的。
Stream-Based Selective Sampling
- 基于不确定度缩减的方法(熵,信息量)
- 基于版本空间(version space)的缩减方法(QBC)
- 基于泛化误差缩减的方法(损失函数,找误差缩减最大的)
基于不确定度缩减的方法
- 基准分类器选择最不能确定其分类的实例进行标识,这种方法以信息熵作为衡量样例所含信息量大小的度量。从几何角度看这种方法优先选择靠近分类边界的实例,又称为最近边界法。
基于版本空间缩减的方法
- 选择那些训练后能够最大程度缩减版本空间的实例进行标识。(QBC)
- QBC算法从版本空间中随机选择若干假设构成一个委员会,然后选择委员会中预测分歧度最大的实例进行标注。
- 分歧度:投票熵,Jensen-Shannon分歧度,Kullback-Leibler分歧度
基于泛化误差缩减的方法
- 选择能够是未来泛化误差最大程度缩小的实例。
- 首先选择一种损失函数用于估计未来错误率,然后将未标识实例集中的每一个实例都作为下一个可能的选择,分别估计其能给基准分类器带来的误差缩减,选择估计误差缩减最大的那个实例进行标识。
Uncertainty Sampling
- 选择不确定度最大样本进行标记,正类后验概率接近0.5的实例。如果小于0.5 说明接近负类。大于0.5说明接近正类。
- 支持向量机的不确定度实例选择则是选择询问最靠近线性决策边界的实例。
Query-By-Committee
- 委员会询问选择算法不直接计算分类误差,而是根据自己已标识实例集训练两个或多个分类器,组成“委员会”,利用委员会对未标识实例进行标识投票,然后选择询问投票最不一致的实例。
- 计算简单,评价未标识实例,只需要一次内积运算。
Expected Model Change
- 模型期望变化的直观理解,算法倾向于选择询问对模型变化影响最大的实例. 这种方法在实验研究中表现良好。
- 如果数据集的属性或类标识数量比较多时, 计算复杂度非常高
THREE METHODS
- Variance Reduction 通过减小方差来减小实验者的未来误差。
- Estimated Error Reduction 最小估计误差近似最优与模型无关 计算复杂度高
- Density-Weighted Methods 信息量最大实例不只是不确定的而且还是要具有代表性的。
转载于:https://my.oschina.net/u/1240964/blog/799233
主动学习综述(ACTIVE LEARNING)相关推荐
- 浅谈主动学习(Active Learning)
1背景概述 在机器学习领域有很多学习模式,比方说监督学习.半监督学习.强化学习.无监督学习等.平时大家接触比较多的一般都是监督学习,在监督学习里面,比方说要做个人和鱼的图像分类模型,假设有200张图片 ...
- 主动学习(Active learning)简介
文章目录 Labeling faster vs. labeling smarter 1. 什么是主动学习? 2. 主动学习如何运行? 2.1 Stream-based Active Learning ...
- 半监督学习:semi-supervised learning 直推学习:transductive learning 主动学习:active learning
目前,利用未标记示例的主流学习技术主要有三大类:半监督学习(semi-supervised learning).直推学习(transductive learning)和主动学习(active lear ...
- 主动学习(Active Learning)系列介绍(三)搜索假设空间(Searching Through the Hypothesis Space)
本文介绍主动学习Active Learning中的第二种query selection framework -- 搜索假设空间Searching Through the Hypothesis Spac ...
- 【论文汇总】人工智能顶会深度主动学习(Deep Active Learning)相关论文
汇总2017年至今,ICCV\CVPR\NIPS\ECCV会议上发表的深度主动学习(Deep Active Learning)相关文章,根据原文中report的实验数据集划分为 图像分类 . 语义分割 ...
- 主动学习(Active Learning)系列介绍(一)基本概念及应用场景
目录 一个小假设 有监督学习思想 主动学习思想 研究背景 主动学习 问题场景 1. Query Synthesis 2. Stream-based Selective Sampling 3. Pool ...
- 主动学习(Active Learning)简介综述汇总以及主流技术方案
0.引言 在机器学习(Machine learning)领域,监督学习(Supervised learning).非监督学习(Unsupervised learning)以及半监督学习(Semi-su ...
- 主动学习(Active Learning,AL)综述
目录 1. 基本概念 2. 基于不确定性的主动学习方法 3.基于最近邻和支持向量的分类器的方法 3.1 NNClassifier 3.2 RBF network + Gradient Penalty ...
- 主动学习(Active Learning)概述及最新研究
作者 | 你Sony@知乎 来源 | https://zhuanlan.zhihu.com/p/422180658 编辑 | 极市平台 导读 作者将自己对于主动学习的理解和最新研究的感悟都整理为这篇文 ...
最新文章
- leetcode--删除链表的倒数第N个节点--python
- 头脑风暴-如何减少软件项目对于人的依赖性。
- 策略模式(Stratety)
- 802.11协议中帧控制域中To DS and From DS 比特位的含义
- kafka数据 落盘_Kafka数据可靠性保证三板斧-ACK/ISR/HW
- linux mysql 5.6.23_MySQL 5.6.23升级到MySQL 5.7.9
- JMeter部分功能详解
- cmake生成Win64位工程
- 如何做好性能压测丨压测环境设计和搭建
- UserInfoActivity用户图像修改和退出登录
- leetcode - 617. 合并二叉树
- python如何运行程序_01
- nyoj 600——花儿朵朵——【离散化、线段树插线问点】
- 第七章_生成对抗网络(GAN)
- 【干货】移动APP测试用例设计实践经验分享
- 中国石化股票价值线分析
- 【Python】在Windows 10 中,安装django-bootstrap-modal-forms
- ZZULIOJ:1148: 组合三位数之一
- 怎么样关掉红米note开发者选项
- 「macOS无法验证此APP不包含恶意软件」的处理方式
热门文章
- Ruby的Singleton method
- matlab 线模式密度,环形腔窄线宽光纤激光器的研究
- 怎么帮java转换成类图_有把java代码直接转成uml类图的工具吗 – 手机爱问
- 为什么博图中放置按下按钮无反应_如何更好的设计按钮
- input反应慢 vue_Vue v-model实时更新带来的输入框卡顿问题
- Java学习总结:47(打印流)
- Java项目:在线高中考试系统(java+SSM+Jsp+Mysql+Maven)
- 五分钟让你搞懂什么是“构造方法”
- Ant Design Pro 跳转路由 传参数,接收参数
- iOS HitTest 机制