论文解读:韩宗博 硕士研究生 | 天津大学 智能与计算学部

指导老师:张长青,天津大学副教授,博士生导师

1. 方法动机

多模态人工智能技术正在被广泛应用到智能医疗、无人系统等重要领域,设计精准、可靠的多模态学习技术成为支持重要应用的关键。

多模态数据为智能系统决策提供了丰富信息,使得多模态智能系统可以 “兼听则明”,提高分类和预测准确性。

然而,在许多代价敏感场景中,多模态融合及决策的可信性往往更加重要。

对于多模态分类任务,传统方法通常假设各模态质量和任务相关性是稳定的。

但实际上,对于不同样本或在不同场景下,模态的质量和任务的相关程度往往具有动态性。如多传感器场景中,RGB 图像在光线好时更有效,而近红外图像在可以在视觉困难情况下提供更重要的信息。

多模态医学诊断中,往往存在多项检查数据,对于不同患者同一检查项目所提供信息的重要性也会有所不同。此外,传感器的不稳定以及损坏导致数据获取异常,也给融合带来挑战。考虑到多模态数据质量的动态性,需要使多模态智能系统可以做到可靠而且有证据地融合多模态信息,即 “信而有征”,从而提高分类和预测的稳定性和可信性。

本文使用不确定性对此动态性进行建模、利用一种改进的证据融合策略集成多模态信息。论文题为 Trusted Multi-View Classification ,现已被 ICLR 2021 收录。

基于此,不仅能在模态质量动态变化时获得更加稳定的分类结果,同时能够估计决策信心,并对分类结果和分类信心进行模态级溯源。整体上,所提方法在多模态协同学习(兼听则明)中,对不同模态进行证据估计(信而有征),从而支持融合及决策的可靠性和稳定性。

图 1. 可信多视图学习框架.

2. 方法框架

  • 不确定性和证据理论

在使用 softmax 的分类模型中,最大的 softmax 输出用于最终预测会使即使错误的预测也有较高的置信度(over-confident)。

主观逻辑(subjective logic)算法能够很好的解决这一问题。与普通的分类不同,主观逻辑通过将输出建模为狄利克雷分布来获得不同类的分配概率和不确定性。

具体地,对于视图  ,我们有

其中  表示不确定性,  表示第  类的分配概率。对第  个视图,主观逻辑将证据  和狄利克雷分布的参数 ααα 进行了联系,即 α 。然后,不同类的分配概率和不确定性可以由以下公式计算得到:

α ,

其中, α 。

  • DS 组合规则用于多模态分类

对于模态  可以得到,现在考虑使用 DS 组合规则将  个独立的模态所得到的分配概率进行组合。

给定  和  ,可以使用以下规则进行融合:

具体的计算方式为:

其中  反映了  和  的冲突程度。

根据 DS 组合规则的可传递性,我们可以得到,对于  个模态的融合方式:

.

该组合方式具有较好的合理性和可解释性。不同类的分配概率和不确定性计算的过程实际保证了如下特性:(1)观测到的第  类的证据越多,分配给第  类的可能性就越大,反之亦然;(2)若所有类证据都不足,则整体不确定性较大。此外,目标函数还通过抑制错误标签对应的证据避免不确定性小但分类错误的情况。

  • 通过学习获得  

传统神经网络通常使用交叉熵损失进行训练:

.

由于模型的输出为狄利克雷分布,需要对其进行调整,得到下式:

αααψψα,

其中 ψ 是 digamma 函数。

上述损失能够促进模型每个样本的正确标签比其他类生成更多的证据,但是不能保证错误类的证据尽量少。我们期望对于错误分类的样本的证据变为 0。因此以下损失函数被引入用来对证据进行正则化。

给出狄利克雷分布参数 α 后的损失可以写作:

ααλα 。

在多模态框架下,我们采用多任务策略,总损失如下所示:

αα .

3. 实验结果

实验表明,所提方法可以较为灵敏地感知噪声的动态变化 (更多实验见论文):

图 2. 不确定性密度分布:分布内 / 外样本对比.

图 3. 典型确定性和不确定性分类结果.

4. 总结

针对多模态之间关系的不稳定性或动态性,此次研究首次提出可信多模态融合方法,设计了支持可信和可解释的多模态分类算法。所提出的模型基于证据理论以可学习方式进行自适应的动态集成,对每个样本的每个模态进行不确定性估计,使模型能够在复杂多变场景下保证分类的可靠性和稳定性。

潜在应用场景主要包括:

1. 需要可信决策的多模态分类任务,如智能医疗、自动驾驶等代价敏感任务;

2. 模态质量动态变化的应用场景;

3. 寻求决策可溯源的多模态集成场景;

4. 多传感器系统中容易出现传感器故障的场景。

论文链接:https://openreview.net/forum?id=OOsR8BzCnl5

代码链接:https://github.com/hanmenghan/TMC

Zongbo Han, Changqing Zhang, Huazhu Fu, Joey Tianyi Zhou, Trusted Multi-View Classification, International Conference on Learning Representations (ICLR) 2021

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑温州大学《机器学习课程》视频
本站qq群851320808,加入微信群请扫码:

【论文解读】ICLR 2021 |可信多模态机器学习:兼听则明,信而有征相关推荐

  1. 【论文解读 ICLR 2020 | Jure Leskovec组】Query2box: Reasoning over KGs in Vector Space using Box Embedding

    论文题目:Query2box: Reasoning over Knowledge Graphs in Vector Space using Box Embeddings 论文来源:ICLR 2020 ...

  2. 【论文解读 ICLR 2020 | DropEdge】TOWARDS DEEP GRAPH CONVOLU-TIONAL NETWORKS ON NODE CLASSIFICATION

    论文题目:DROPEDGE: TOWARDS DEEP GRAPH CONVOLU-TIONAL NETWORKS ON NODE CLASSIFICATION 论文来源:ICLR 2020 论文链接 ...

  3. 解读ICLR 2021:DoodlerGAN创意草图开山之作

    前言:这篇论文是creative sketch的开山之作,提出了两个创意草图数据集:creative birds和creative creatures,并用GANs在草图生成上取得了良好的效果,为后面 ...

  4. ICLR 2021 | 腾讯 AI Lab 入选论文解读

    本文转载自腾讯AI实验室. ICLR(International Conference on Learning Representations),即国际学习表征会议,由深度学习三巨头之二的 Yoshu ...

  5. ICLR 2021 | 腾讯 AI Lab 入选论文

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:腾讯AI Lab微信(tencent_ailab) AI博士 ...

  6. 百里挑一:ICLR 2021杰出论文奖出炉!

    北京时间 2021年4月1日,ICLR 2021 杰出论文新鲜出炉了!在本届 ICLR 上被接收的 860 篇高质量论文中,有 8 篇论文脱颖而出,被授予 ICLR 2021 杰出论文奖. 本次杰出论 ...

  7. ACM SIGIR 2022 | 美团技术团队精选论文解读

    今年,美团技术团队有多篇论文被ACM SIGIR 2022收录,这些论文涵盖了观点标签生成.跨域情感分类.对话摘要领域迁移.跨域检索.点击率预估.对话主题分割等多个技术领域.本文精选了10篇论文做简要 ...

  8. Multimodal Machine Learning: A Survey and Taxonomy/多模态机器学习综述

    该笔记基于:Multimodal Machine Learning:A Survey and Taxonomy 该论文是一篇对多模态机器学习领域的总结和分类,且发表于2017年,算是相当新的综述了.老 ...

  9. 直播 | ICLR 2021论文解读:兼听则明,信而有征:可信多模态分类

    「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和 ...

最新文章

  1. 男人最不该做的7件事
  2. Delphi访问网页中的下拉菜单
  3. 从业5年,教你学习Linux开发
  4. 蓝桥杯-答疑-java
  5. 转发和重定向的区别?
  6. springboot oauth2 fetch 关于跨域请求的问题
  7. Java类的继承(将来填坑)
  8. wxpython动态实时绘图_wxPython: 简单的绘图例子
  9. mysql数据表数据丢失6_MYSQL数据表损坏的原因分析和修复方法小结
  10. IoT -- (九) IoT通讯技术选型与模型设计
  11. 夺命雷公狗---node.js---7fs模块初步
  12. Windows Server2012 64位安装OpenSSH服务
  13. 高通 SD卡驱动代码流程
  14. 【转】【CN五一装机版】GhostXP_SP3电脑公司通用版v19.2装机版NTFS
  15. Texlive安装失败解决方法
  16. java专业考独立本科_复旦大学-计算机网络(独立本科B080709)(停考过渡)
  17. 解决win10笔记本电脑无法睡眠只是黑屏问题的方法
  18. 加法器verilog
  19. mongodb数据库添加用户名密码以及忘记密码重置操作
  20. 苹果6运行内存是多少_安卓手机和苹果手机的最大不同,运行大小不同决定速度的快慢!|安卓手机|苹果手机|智能手机|手机|内存|闪存...

热门文章

  1. leetcode:Minimum Depth of Binary Tree【Python版】
  2. mybatis 开发环境搭建
  3. 文件流习题8.3 8.4
  4. [转].NET学习网站收集
  5. UNIX环境C - 系统信号
  6. PHP内置函数生成随机数的方法汇总
  7. 使用git下载giuhub中的项目
  8. HttpHandler动态生成图片
  9. Linux下samba服务速度很慢的问题
  10. android adb server is out of date