作者|潘子琦

单位|上交BCMI实验室

来源|机器之心

现有的有监督解耦方法,比如把中间表征解耦成种类相关的表征和种类无关的表征,大多基于交换生成的经验性框架,缺乏理论指导,无法保证种类相关表征中不包含种类无关的信息。在本文中,来自上海交通大学的研究者尝试建立信息瓶颈(Information Bottleneck, IB)和有监督解耦之间的联系,为有监督解耦提供理论指导。

信息瓶颈是一种从源数据中提取出与任务目标有关信息的方法,一般通过优化权衡压缩项和预测项的 IB Lagrangian 来实现。现有文献已经指出 IB Lagrangian 存在的一些问题,比如期望的压缩水平与控制权衡的 Lagrangian 乘子之间没有因果关联,因此对于 IB Lagrangian 来说需要多次尝试优化来实现期望目标。

研究者在文中具体分析了 IB Lagrangian 中存在的权衡问题,表明随着压缩程度增大,预测性能严格减小。为了克服这些问题,研究者一方面期望在不损害预测性能的前提下能够实现最大化压缩,简称为「最大化压缩」;另一方面期望无需多次尝试优化,即模型能够一致地实现最大化压缩。

为此,研究者首先考察了最大化压缩实现时对应的量化条件,之后对优化目标给出了最大化压缩一致性的性质定义,即只要优化目标满足该性质就能够一致地实现最大化压缩。在此基础上,研究者给出自己的方案设计。

与现有的 IB Lagrangian 不同,研究者从有监督解耦的角度来实现信息压缩,这是因为他们认为信息压缩与有监督解耦本质上是同一回事:在有监督解耦任务中,需要将源数据中与给定标签有关的信息和其它信息分开,如给定图像的类别标签,将图像信息解耦为类别有关的和类别无关的信息;而类似地,在信息压缩任务中,要将源数据中与给定标签无关的信息丢弃从而实现压缩,同样需要区分出与给定标签有关的信息和与给定标签无关的信息。

基于此,研究者将有监督解耦与信息压缩相联系,提出了基于解耦的信息瓶颈算法。研究者给出了一些结论,同时在多个数据集上验证了这些结论,并验证了所提方法在包括信息压缩等多个评估指标上的性能。本文已被 AAAI 2021 会议接收。

论文标题:

Disentangled Information Bottleneck

论文作者:

Ziqi Pan / Li Niu / Jianfu Zhang / Liqing Zhang

论文链接:

http://www.paperweekly.site/papers/4771

IB Lagrangian中压缩项与预测项的权衡

研究者分析了 IB Lagrangian 中存在的压缩项与预测项之间的权衡问题。形式如下:

具体来说,本文的结论表明 IB Lagrangian 最优解对应的预测性能是随着压缩程度的增大而严格下降的。

最大化压缩一致性、方法设计

为了实现一致的最大化压缩,研究者首先给出了最大化压缩对应的量化条件。首先考虑了 I(X;Y) = H(Y)的情形,应用互信息的基本性质及信息处理不等式,可以得到:

接着给出了关于优化目标的最大化压缩一致性的性质定义:

即任意优化目标,只要满足这一性质,就会一致地实现最大化压缩,即上述量化条件。在此基础上给出了本文方法的优化目标函数:

具体来说,研究者通过最大化 I(X;S;Y)来约束 (S;Y) 能够表示出 X 的全部信息,则可知 S 至少包含了 X 中与 Y 无关的信息;通过最大化 I(T;Y)来约束 T 能够无损地预测出 Y,则可知至少 T 包含了 X 中与 Y 有关的信息。在此基础上通过最小化 I(S;T)来约束 S 与 T 中的信息互不交叠,从而精确地约束 T 保留与 Y 有关的信息而 S 保留与 Y 无关的信息。可以证明,研究者的优化目标满足最大化压缩一致性,即:

对于方案的工程实现,现有的文献提供了直接可用的方法。对于最大化 T(T;Y)和 I(X;S;Y)来说,可以采用变分逼近;而对于最小化 I(S;T)来说,可以采用 Density-Ratio Trick 并以对抗方式进行训练。

研究者的方案与信息压缩和有监督解耦两个领域有关。对于信息压缩的有关方法,大多采用了优化 IB Lagrangian 的形式,因此根据上述结论,它们的压缩项和预测项权衡无法避免,从而在信息压缩的同时带来预测性能的损失;而与有监督解耦的有关方法相比,如前所述,本文方法能够确保 T 和 S 分别精确地保留与 Y 有关和无关的信息,而它们在信息量控制方面没有保证。

实验结果

本文的主要目标是克服 IB Lagrangian 中的权衡问题,因此首先验证所提方法在 IB 平面(横轴代表 I(X;T),纵轴代表 I(T;Y))上的表现行为。结果如下图所示:

通过上图可以看出,本文方法能够在压缩信息的同时避免对预测性能的影响,最大化压缩的量化条件得以较好地逼近;而在 IB Lagrangian 的优化中,预测性能会随着压缩程度加大而下降。除此之外,参照信息压缩方法相关文献中的其它评估指标,本文方法在泛化能力、鲁棒性以及离群样本检测方面也表现良好。

本文方法额外带来的收获是能够进行有监督地解耦。通过可视化结果,本文方法可以较好地展示出解耦效果。

文章小结

总的来说,为了克服优化 IB Lagrangian 的信息压缩方法中存在的压缩项与预测项的权衡问题,研究者从有监督解耦的角度实现了信息压缩的方法,并提出了基于有监督解耦的信息瓶颈算法。研究者给出了一些结论并进行了实验验证,同时在最大化压缩、泛化能力、鲁棒性、离群样本检测、有监督解耦等方面对方法进行评估,得到了良好的实验效果。

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

AAAI 2021 | 上海交大提出基于有监督解耦的信息瓶颈算法相关推荐

  1. 什么是优秀的图表示?斯坦福提出首个信息论原则——图信息瓶颈

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来源:机器之心 对于图结构数据而言,什么是「优秀」的表示?斯坦福研究者对此进行了重新思 ...

  2. AAAI 2022 | 北航提出基于特征纯化的视线估计算法,让机器更好地“看见”

    视线估计算法基于用户的面部图片计算其视线方向.然而,面部图片中除包含有效的人眼区域信息外,仍包含众多的视线无关特征,如个人信息.光照信息. 这些视线无关特征损害了视线估计的泛化性能,当使用环境更改时, ...

  3. AAAI 2021 京东科技集团21篇论文

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:AI科技评论 AI博士笔记系列推荐 周志华<机器学习& ...

  4. 重磅!京东21篇论文入选AI顶会AAAI 2021

    点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:AI科技评论 近日,国际人工智能领域顶级学术会议AAAI 2021(第35届AAA ...

  5. 京东科技集团21篇论文高票入选国际顶会AAAI 2021

    近日,国际人工智能领域顶级学术会议AAAI 2021(第35届AAAI)正式开始.在国内AI阵营前列的京东科技集团以高达21篇论文的入选量成为本届AAAI的一大黑马.其研究方向包含了计算机视觉.联邦学 ...

  6. 16篇论文入选AAAI 2021,京东数科AI都在关注什么?(附论文下载)

    近日,国际人工智能领域顶级学术会议AAAI2021(第35届AAAI)论文收录结果出炉.在国内AI阵营前列的京东数科以高达16篇论文的入选量成为本届AAAI的一大黑马.其研究方向包含了联邦学习.对抗学 ...

  7. 把ACL论文「几乎一字不落」抄到AAAI 2021上,作者回应:属借鉴

    视学算法报道 编辑:蛋酱 AI 领域学术不端又来,一篇 AAAI 2021 论文涉嫌抄袭 ACL 2020 论文,有人还贴了查重结果. 几个月以来,学术圈不端行为屡被爆出,先是港科大硕士 ICCV 论 ...

  8. svm 图片加标签_基于半监督的SVM多标签图数据分类算法研究

    宋文广 李程文 谭建平 摘   要:传统的图数据分类研究主要集中在单标签集,然而在很多应用中,每个图数据都会同时具有多个标签集.文章研究关于多标签图数据分类问题,并提出基于半监督的SVM多标签图数据分 ...

  9. 基于改进FCOS的钢带表面缺陷检测算法

    本文转载自人工智能技术与咨询.新机器视觉 摘要 针对现有钢带表面缺陷检测所存在的检测效率低.适用范围有限等缺陷,提出一种基于改进FCOS的钢带表面缺陷检测算法.该算法使用含形变卷积的卷积神经网络提取缺 ...

最新文章

  1. windows2003服务器版不能播放声音
  2. python概念英文版_python重要概念
  3. 旋转动画用控件RotateView
  4. IDEA 开启远程调试
  5. mac adobe flash builder 4.7 刚装起不来,求助
  6. matlab变道超车_你们对新能源汽车怎么看?
  7. 观音菩萨是企业家和领导者的好榜样
  8. 饿了么美团外卖返利程序对接公众号发单机器人分销系统返利源码
  9. linux程序卸载失败怎么办,在Deepin下卸载LibreOffice等软件的方法,附卸载失败的原因...
  10. 微信服务号前端页面开发总结
  11. 苹果语音输入最新资讯
  12. 如果不使用时钟同步工具,linux如何解决时钟同步问题?仅需要一行命令即可。
  13. EasyX接收并显示从控制台输入的数字和英文
  14. 引导滤波算法理论及公式的推导
  15. 【微服务】什么是微服务?微服务与分布式的区别?微服务怎么具体实践微服务?服务端发现和客户端发现...
  16. Ezairo7160sl - ASHA功能搭建
  17. tor浏览器官网地址
  18. 简单上手Raspberry Pi Pico(Ubuntu+MicroPython)
  19. InterValue项目周报:20190401-20190407
  20. Unity3d关于Particle System is trying to spawn on a mesh with zero surface area的警告

热门文章

  1. 外部表如何导入mysql_如何利用Oracle外部表导入文本文件的数据
  2. rdp协议打开 windows_ubuntu客户端使用RDP协议连接windows服务器
  3. 内部类不能有静态变量(除静态的对Static的理解)
  4. nginx与php-fpm通讯方式
  5. 用Python解决数据结构与算法问题
  6. 数据库中DDL,DML,DCL
  7. ActionBar设置自定义setCustomView()留有空白的问题
  8. PHP下用正则表达式分割preg_split、替换reg_replace、匹配preg_match_all等出现乱码的解决方法...
  9. 【CSON原创】HTML5游戏框架cnGameJS开发实录
  10. axure能做剪切蒙版吗_大理石结晶自己能做吗?