主动学习综述(ACTIVE LEARNING)

2019独角兽企业重金招聘Python工程师标准>>>

Active learning process

算法：主动学习算法伪代码描述

输入：未标记样本U,标记样本集L,学习引擎LE,采样引擎SE

输出：学习引擎SE

BeginFor：i=1,2,…,N

Train(LE,L); //通过标记样本集L训练分类器f

T=Test(LE,U);

S=Select(SE,U);

Label(S) ; //对集合S中的样本进行标记

L<—L + S

U<—U - S

Until 迭代次数达到某阈值，或达到其他终止条件

Active Learning

Membership Query Synthesis
Stream-Based Selective Sampling
Pool-Based Active Learning

Membership Query Synthesis

实验者可以选择询问输入空间中任何一个未标识的实例，包括实验者自己创建的，而不仅仅是来自某个自然分布的实例。好的询问关系经常是易处理的或者在有限的领域内是有效的。

Stream-Based Selective Sampling

基于不确定度缩减的方法（熵，信息量）
基于版本空间（version space）的缩减方法（QBC）
基于泛化误差缩减的方法（损失函数，找误差缩减最大的）

基于不确定度缩减的方法

基准分类器选择最不能确定其分类的实例进行标识，这种方法以信息熵作为衡量样例所含信息量大小的度量。从几何角度看这种方法优先选择靠近分类边界的实例，又称为最近边界法。

基于版本空间缩减的方法

选择那些训练后能够最大程度缩减版本空间的实例进行标识。（QBC）
QBC算法从版本空间中随机选择若干假设构成一个委员会，然后选择委员会中预测分歧度最大的实例进行标注。
分歧度：投票熵，Jensen-Shannon分歧度，Kullback-Leibler分歧度

基于泛化误差缩减的方法

选择能够是未来泛化误差最大程度缩小的实例。
首先选择一种损失函数用于估计未来错误率，然后将未标识实例集中的每一个实例都作为下一个可能的选择，分别估计其能给基准分类器带来的误差缩减，选择估计误差缩减最大的那个实例进行标识。

Uncertainty Sampling

选择不确定度最大样本进行标记，正类后验概率接近0.5的实例。如果小于0.5 说明接近负类。大于0.5说明接近正类。
支持向量机的不确定度实例选择则是选择询问最靠近线性决策边界的实例。

Query-By-Committee

委员会询问选择算法不直接计算分类误差，而是根据自己已标识实例集训练两个或多个分类器，组成“委员会”，利用委员会对未标识实例进行标识投票，然后选择询问投票最不一致的实例。
计算简单，评价未标识实例，只需要一次内积运算。

Expected Model Change

模型期望变化的直观理解,算法倾向于选择询问对模型变化影响最大的实例. 这种方法在实验研究中表现良好。
如果数据集的属性或类标识数量比较多时, 计算复杂度非常高

THREE METHODS

Variance Reduction 通过减小方差来减小实验者的未来误差。
Estimated Error Reduction 最小估计误差近似最优与模型无关计算复杂度高
Density-Weighted Methods 信息量最大实例不只是不确定的而且还是要具有代表性的。

转载于:https://my.oschina.net/u/1240964/blog/799233

主动学习综述(ACTIVE LEARNING)相关推荐

浅谈主动学习（Active Learning）
1背景概述在机器学习领域有很多学习模式,比方说监督学习.半监督学习.强化学习.无监督学习等.平时大家接触比较多的一般都是监督学习,在监督学习里面,比方说要做个人和鱼的图像分类模型,假设有200张图片 ...
主动学习（Active learning）简介
文章目录 Labeling faster vs. labeling smarter 1. 什么是主动学习? 2. 主动学习如何运行? 2.1 Stream-based Active Learning ...
半监督学习：semi-supervised learning 直推学习：transductive learning 主动学习：active learning
目前,利用未标记示例的主流学习技术主要有三大类:半监督学习(semi-supervised learning).直推学习(transductive learning)和主动学习(active lear ...
主动学习（Active Learning）系列介绍（三）搜索假设空间（Searching Through the Hypothesis Space）
本文介绍主动学习Active Learning中的第二种query selection framework -- 搜索假设空间Searching Through the Hypothesis Spac ...
【论文汇总】人工智能顶会深度主动学习(Deep Active Learning)相关论文
汇总2017年至今,ICCV\CVPR\NIPS\ECCV会议上发表的深度主动学习(Deep Active Learning)相关文章,根据原文中report的实验数据集划分为图像分类 . 语义分割 ...
主动学习（Active Learning）系列介绍（一）基本概念及应用场景
目录一个小假设有监督学习思想主动学习思想研究背景主动学习问题场景 1. Query Synthesis 2. Stream-based Selective Sampling 3. Pool ...
主动学习（Active Learning）简介综述汇总以及主流技术方案
0.引言在机器学习(Machine learning)领域,监督学习(Supervised learning).非监督学习(Unsupervised learning)以及半监督学习(Semi-su ...
主动学习（Active Learning，AL）综述
目录 1. 基本概念 2. 基于不确定性的主动学习方法 3.基于最近邻和支持向量的分类器的方法 3.1 NNClassifier 3.2 RBF network + Gradient Penalty ...
主动学习（Active Learning）概述及最新研究
作者 | 你Sony@知乎来源 | https://zhuanlan.zhihu.com/p/422180658 编辑 | 极市平台导读作者将自己对于主动学习的理解和最新研究的感悟都整理为这篇文 ...

主动学习综述(ACTIVE LEARNING)

主动学习综述(ACTIVE LEARNING)相关推荐

最新文章

热门文章