点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

在偏多标记学习中,每一个示例与一个候选标记集相关,该候选集既包含多个真实标记,也包含其它噪声标记。为了解决偏多标记学习问题,现有方法往往基于对数据结构的额外假设来对候选标记集合进行消歧。然而,在实际任务中,这些假设通常难以成立,导致学得模型难以泛化到不同偏多标记分类任务中。本文提出了一种基于元消歧的偏多标记学习方法。与以往工作基于额外假设不同,我们首次引入元学习的方法来对候选标记进行消歧。一方面,通过最小化基于置信度加权的排序损失来学习个多标记分类器;另一方面,根据候选标记在少量验证集样本上的性能来自适应地估计其置信度。为了提高优化速率,我们提出使用在线优化策略来迭代地更新这两个步骤。在不同数据集上大量的实验证明了提出方法的有效性。

本期AI TIME PhD直播间我们邀请到南京航天航空大学计算机系博士生——谢明昆,为我们带来报告《基于元消歧的偏多标记学习》。

谢明昆:

南京航空航天大学计算机专业一年级在读博士生,导师为黄圣君教授。主要研究方向为机器学习和数据挖掘,包括弱监督学习,多标记学习等。以第一作者在包括TPAMI, NeurIPS, KDD, AAAI等国际期刊和会议上发表多篇论文。

01

 背  景 

(1) 什么是多标记学习?

常规的监督学习,每个示例只有一个真实标记,而在多标记学习中,每个示例同时与多个标记相关。

(2) 多标记学习的难点

对于单标记学习,比如下面左图,我们可以很容易给出“Dog”标签;但对于多标记学习,我们很难给出一张图的所有标记,比如下面右图给出的标记有蓝天,白云,树,但还有海滩,岛屿等一些没能给出的。因此多标记学习中,获取每张图片所有可能标记是比较困难的。所以多标记学习中一个关键的问题是如何显著降低图片标注难度,从而降低图片标注代价。

一种有效的解决方案是偏标注,即从众包平台上收集许多标注者对一张图片的标注,这些标注的并集构成候选标记集合。如下图左边的例子,候选标记集合既包含像窗户,自行车等相关标记,也包含人,花等无关标记。

基于候选标记集合的样本进行学习称为偏多标记学习,具体任务是要学习一个分类器。每个样本都对应一个候选标记集合,采用偏多标记学习算法(PML)对这些样本学习,从而得到多标记模型(MLL),多标记模型在遇到新样本时可以预测出样本的所有可能的相关标记。

为了更好地辨别理解偏多标记学习算法,我们介绍几个与偏多标记相关的学习框架。多标记学习(MLL)是给定样本所有相关标记进行学习;偏标记学习是给定每一个示例一个候选标记集,该集合中有且仅有一个真实标记;弱标记学习(MLML)是给定的样本只有部分相关标记;偏多标记学习(PML)是给定每一个示例一个候选标记集,该集合中既包含多个真实标记,也包含其它无关标记。

目前主流的偏多标记学习方法是基于消歧,每个候选标记都有置信度,根据额外的假设估计置信度。但在实际问题中,这些假设很多都不成立。因此,本文提出一种元消歧的方法,通过元学习的方式估计置信度。

02

 方  法 

本文提出基于元消歧的偏多标记算法(PML-MD)来解决偏多标记分类问题。PML-MD在偏多标记候选集上采用带置信度的排序损失,在给候选集排序时,不仅考虑候选集是否与样本相关,还考虑候选集中标记的置信度。比如下图例子中,“people”、“flower”等候选集中的无关标记虽然排在了非候选集中“dog”标记之前,但也是以一个较低的置信度排在“dog”之前的。

下面介绍PML-MD方法是如何估计标记置信度的。我们根据元消歧的方式估计置信度ρ,核心思想是根据ρ在验证集上到表现为指导更新置信度,损失函数如下图所示。更新策略采用迭代优化的方式,首先固定置信度ρ,然后最小化训练损失,得到最优的模型参数θ;然后固定模型参数θ,最小化验证集上的元消歧损失,得到最优置信度ρ。

由于θ往往是神经网络的参数,因此更新复杂度较高,故本文提出一种在线近似优化机制,核心思想是采用一步梯度下降逼近上述优化过程。具体实现如下:

03

 实  验 

提出的方法:

PML-MD:验证集仅用于消歧。

PML-MD+:验证集用于消歧和训练。

数据集:采用8个多标记数据集,以一个概率将无关标记翻转为候选标记的方式来构建偏多标记数据集。包括两种翻转噪声水平,high-level label noise的反转概率有[0.5,0.6,0.7,0.8], low-level label noise的反转概率有[0.2,0.3,0.4,0.5]。

Baseline:

① PML-NI[Xie & Huang, TPAMI’21],

② PML-LRS [Sun et al., AAAI’19],

③ fPML [Yu et al., ICDM’18],

④ PARMAP

⑤ PARVLS[Zhang et al., TPAMI’20

评价指标:

◦ Hamming Loss, Ranking Loss, One Error, Coverage ↓

◦ Average Precision ↑

实验结果:

下面给出对比不同方法在不同数据集上的实验结果,加黑点表示我们的方法能显著优于该对比方法。本文提出的PML-MD在多个实验样例上都有很优秀的性能表现。

(1)low-level label noise数据集的实验结果

(2)high-level label noise的实验结果

(3)真实数据集的实验结果

点击阅读原文

即可观看分享回放哦!

整理:爱 国

审核:谢明昆

AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你!

请将简历等信息发至min.gao@aminer.cn!

微信联系:AITIME_HY

AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。

更多资讯请扫码关注

我知道你在看

点击“阅读原文”查看精彩回放

干货!基于元消歧的偏多标记学习相关推荐

  1. ICLR 2022:​PiCO,基于对比消歧的偏标签学习 丨AI Drive

    偏标签学习 (Partial Label Learning, PLL) 是一个经典的弱监督学习问题,它允许每个训练样本关联一个候选的标签集合,适用于许多具有标签不确定性和歧义的的现实世界数据标注场景. ...

  2. 基于置信度评价消歧的偏标记学习(2017)

    原文链接: https://aaai.org/ocs/index.php/AAAI/AAAI17/paper/view/14210 偏标记学习又叫模糊标记学习,超集标记学习 . 研究动机 现有分歧方法 ...

  3. 偏标记学习(大杂烩,有点乱)

    别名:模糊标记学习,超集标记学习. 传统监督学习里面有一个重要概念就是标记,通常叫做监督信息."而监督信息的质量很大程度上决定着监督学习问题的成败. 强监督 强监督假设能充分标记信息,从而在 ...

  4. 论文翻译 —— Disambiguation-Free Partial Label Learning 非消歧偏标记学习(PL-ECOC)

    标题:Disambiguation-Free Partial Label Learning 文章链接:http://aaai.org/ocs/index.php/AAAI/AAAI17/paper/v ...

  5. 基于在线百科知识库的多义词词义消歧项目

    WordMultiSenseDisambiguation WordMultiSenseDisambiguation, chinese multi-wordsense disambiguation ba ...

  6. 基于高斯消元的BATS码的改进译码算法

    基于高斯消元的BATS码的改进译码算法 摘要 BATS 码的编译码原理: 改进的高斯消元的结论: 系数矩阵不满秩下可以解码部分包的情况: 摘要 BATS码:(Batched Sparse Codes, ...

  7. 技术解读 | 基于fastText和RNN的语义消歧实战

    消歧问题的基线可以借助贝叶斯.Lesk等简单算法来设计 1.问题的引入 在我们云脑科技最近的一个项目中,需要对文本中提取的实体进行消歧(WSD, Word Sense Disambiguation), ...

  8. 【工程处理技巧一篇】基于半规则数据的命名实体消歧识别【未完】

    作者:finallyly 出处:博客园(转载请注明作者和出处) 看到这篇文章的标题,您一定会以为此篇博客要讲解一个何等高深的算法.其实不然,本篇博客旨在分享笔者在处理那些繁杂.冗踏.低端甚至于极其TM ...

  9. 【创新实训】BERT4EL,基于文本相似度的实体消歧实现

    任务描述 现有douban.mtime.maoyan三个来源的电影,包含名称.简介.导演.演员.类型等等属性. 需要相同的电影融合为一个电影条目,其中maoyan数量很少,可以合并到mtime中. 参 ...

最新文章

  1. mysql 视图 教程_MySQL VIEW(视图)
  2. Mac 完全卸载 Java
  3. linux基础命令练习,Linux常用命令练习
  4. 【生成模型】关于无监督生成模型,你必须知道的基础
  5. node.js 函数外定义的变量 函数内赋值后为什么不能带出_(44)python少儿编程之函数(五)--- 作用域...
  6. Linux下的shell语言编程入门
  7. mkdir -p命令
  8. vscode,git提交push,需要每次都输入账号密码username,password
  9. 广成 USBCAN-II Pro V502 linux下升级经验
  10. 派生类的构造复制与析构
  11. Web测试-Web界面易用性测试
  12. 微信模板消息,动态配置
  13. 《Option Volatility Pricing》阅读笔记之 Option Terminology (期权术语)
  14. Python | 使用turtle库画笑脸滑稽表情
  15. Win10中英文切换 win键+空格
  16. java必背综合知识点总结
  17. Day3-T31项目 异常处理与日志——2021-11-02
  18. python 项目架构设计
  19. 飞龙:蒙语“牵手”人工智能的拓荒者
  20. new DecimalFormat(#0.###)中0与#

热门文章

  1. 检测android 小米 系统更新,小米健康重磅更新!系统级心率检测功能来了
  2. python word.documents.open报错_Python教程:[43]Word基本操作
  3. C语言:str函数(一)
  4. JEECG3.8 全套实战视频全部开放,免费下载!
  5. 国内十大正规现货交易平台排名(2022最新榜单)
  6. 严重: Compilation error org.eclipse.jdt.internal.compiler.classfmt.ClassFormatException
  7. 关于IDEA控制台中文乱码问题的解决
  8. php无法访问_php网站无法访问可能是什么原因
  9. typora 有道云笔记_利用神器Typora+PicGo,实现有道云不用会...
  10. win10触摸板升级教程