【论文解读】多视图多示例多标签的协同矩阵分解
题目: Multi-View Multi-Instance Multi-Label Learning based on Collaborative Matrix Factorization
会议: AAAI 2019
论文: https://arxiv.org/pdf/1905.05061.pdf
1 Motivation
1、现有的M3L方法仅仅探索了部分实体(包,实例和标签)之间的关系,而这些实体之间的关系可以给M3L方法提供丰富的上下文信息,因此,现有的M3L方法性能次优;
2、大部分的MIML算法仅关注单视图数据,但是,在实际应用中,通常可以通过不同的视图来表示多实例多标签对象。
2 Related work
由于包之间以及实例之间存在多种类型的关系,与最近大量研究的MIML任务相比,从多视图包中学习更加困难和挑战。当前已有不少研究工作致力于解决这样一种挑战。如表1所示:
尽管这些方法在努力解决多视图MIML学习问题,但是这些方法仅考虑了包之间和实例之间有限的关系类型。
3 Methodology
所提模型主要包括两部分,一部分是异质网络的构建,另一部分是协同关系矩阵分解。
3.1 Heterogeneous Network Construction
1、construct a subnetwork of instances for each feature view
利用高斯热核为每个特征视图中的实例构建子网,其中
为第v个视图中m个实例的平均欧氏距离。
2、construct a bag subnetwork for each feature view
利用豪斯多夫距离为每个试图中的包构建子网
3、construct a subnetwork of labels
利用cosine相似度来量化标签相关性,其中
和为两个标签,是标签c在所有包中的分布。
以上三部分便构建完了实例-实例,包-包,标签-标签的子网,另外,通过数据集的信息,作者继续构建包-实例,包-标签,实例-标签之间的数据矩阵。
4、The bag-instance inter-relational data matrix
.
5、The bag-label relational matrix
.
6、The instance-label relational data matrix
. 初始,实例-标签的数据矩阵未知,设为0.
3.2 Collaborative Matrix Factorization
论文所提方法M3Lcmf的目标函数所下所示:
M3Lcmf有两个预测项:实例-标签的联系
和包-标签的联系。除了直接利用趋近,作者增加了一个整合项。这个整合项受多实例学习原理的驱动,即包的标签取决于其实例的标签。另外,此整合项可以反向指导和的学习。
由目标函数的前三项可以看出,M3Lcmf构建了包-实例,包-标签,实例-标签之间的关系。按照流行正则的思想,促使有着高相似性的数据点在低维空间内相似,构成MR(G),利用图拉普拉斯矩阵来构建包-包,实例-实例,标签-标签之间的关系。
最后,可以利用优化好的
和来获取实例-标签的相关性矩阵:,同样,要将实例的标签进一步映射到相应的包上,作者利用来趋近包-标签相关性矩阵。因此,M3Lcmf既可以实现包级预测也可以实现实例级预测。
Experiments
Datasets
前五个数据集为包级的数据集,后四个为实例级的数据集。
Metric
1、Ranking Loss (RankLoss),
2、macro AUC (Area Under receiver operating Curve)
3、Average Recall (AvgRecall),
4、Average F1-score (AvgF1).
Results
1、Prediction Results at the Bag-Level
M3Lcmf优于MIMLmix和M2IL:M3Lcmf利用了更多对象之间的关系;
M3Lcmf优于MIML方法(MIMLNN, MIMLfast 和 MIMLSVM):MIML相比于M3Lcmf利用了更少的实体之间的关系;
MIMLRBF性能逼近M3Lcmf:尽管MIMLRBF利用了更少的实体关系,但是MIMLRBF利用神经网络来获取特征表示。
2、Prediction Results at the Instance-Level
M3Lcmf性能最优,MIMLmix第二,MIMLfast第三是因为MIMLmix没有利用包-包联系和实例-实例之间的关系,MIMLfast在此基础上,还没有利用实例-标签的关系。
3、Contribution of Different Types of Relations
说明实体之间的各种关系都有助于M3L方法的学习。
参数敏感实验详情请见原论文。
参考文献
[Nguyen, Zhan, and Zhou 2013] Nguyen, C. T.; Zhan, D. C.; and Zhou, Z. H. 2013. Multi-modal image annotation with multi-instance multi-label lda. In IJCAI, 1558–1564.
[Nguyen et al. 2014] Nguyen, C. T.; Wang, X.; Liu, J.; and Zhou, Z. H. 2014. Labeling complicated objects: multi-view multi-instance multi-label learning. In AAAI, 2013–2019.
[Yang et al. 2018] Yang, Y.; Wu, Y.-F.; Zhan, D.-C.; Liu, Z.- B.; and Jiang, Y. 2018. Complex object classification: A multi-modal multi-instance multi-label deep network with optimal transport. In KDD, 2594–2603.
[Li et al. 2017] Li, B.; Yuan, C.; Xiong, W.; Hu, W.; Peng, H.; Ding, X.; and Maybank, S. 2017. Multi-view multi-instance learning based on joint sparse representation and multi-view dictionary learning. TPAMI 39(12):2554–2560.
[Zhou et al. 2008] Zhou, Z. H.; Zhang, M. L.; Huang, S. J.; and Li, Y. F. 2008. Miml: A framework for learning with ambiguous objects. Corr Abs 2012.
[Huang, Gao, and Zhou 2018] Huang, S.-J.; Gao, W.; and Zhou, Z.-H. 2018. Fast multi-instance multi-label learning. TPAMI 99(1):1–14.
[Zhang and Wang 2009] Zhang, M. L., and Wang, Z. J. 2009. Mimlrbf: Rbf neural networks for multi-instance multi-label learning. Neurocomputing 72(16-18):3951–3956.
往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑温州大学《机器学习课程》视频
本站qq群851320808,加入微信群请扫码:
【论文解读】多视图多示例多标签的协同矩阵分解相关推荐
- 【推荐系统】多视图多示例多标签的协同矩阵分解
嘿,记得给"机器学习与推荐算法"添加星标 题目: Multi-View Multi-Instance Multi-Label Learning based on Collabora ...
- 多视图多示例多标签的协同矩阵分解
嘿,记得给"机器学习与推荐算法"添加星标 题目: Multi-View Multi-Instance Multi-Label Learning based on Collabora ...
- ICCV 2019 论文解读:用图神经网络改善视频的多标签分类
作者 | 王磊 本文介绍了汽车之家团队在ICCV 2019一篇关于视频理解论文相关的工作.针对视频多标签分类的问题,论文提出了将视频多标签之间相关性特征加入到网络之中,结果证明该方法可以显著的提高视频 ...
- 论文解读:《基于注意力的多标签神经网络用于12种广泛存在的RNA修饰的综合预测和解释》
论文解读:<Attention-based multi-label neural networks for integrated prediction and interpretation of ...
- 可视化反投射:坍塌尺寸的概率恢复:ICCV9论文解读
可视化反投射:坍塌尺寸的概率恢复:ICCV9论文解读 Visual Deprojection: Probabilistic Recovery of Collapsed Dimensions 论文链接: ...
- CVPR2020论文解读:手绘草图卷积网络语义分割
CVPR2020论文解读:手绘草图卷积网络语义分割 Sketch GCN: Semantic Sketch Segmentation with Graph Convolutional Networks ...
- CVPR2020论文解读:三维语义分割3D Semantic Segmentation
CVPR2020论文解读:三维语义分割3D Semantic Segmentation xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3D ...
- ICLR 2019论文解读:量化神经网络
https://www.toutiao.com/a6701879235964830212/ 今年五月举办 ICLR 2019 会议共接收论文 502 篇,本文将解读其中两篇有关量化神经网络的研究. U ...
- 【论文解读】ICLR 2021 |可信多模态机器学习:兼听则明,信而有征
论文解读:韩宗博 硕士研究生 | 天津大学 智能与计算学部 指导老师:张长青,天津大学副教授,博士生导师 1. 方法动机 多模态人工智能技术正在被广泛应用到智能医疗.无人系统等重要领域,设计精准.可靠 ...
最新文章
- PGA_AGGREGATE_TARGET 原理
- sqplus操作oracle,sqlplus操作oracle
- Java多线程编程模式实战指南(三):Two-phase Termination模式--转载
- 三个打印函数printf()/sprintf()/snprintf()区别
- centos7安装yum_centos7下yum方式安装jenkins
- Python编程高手之路——第三章:数据类型
- MySQL高级-触发器
- AJ是什么牌子,AJ是什么意思,AJ鞋子价格多少一起来看一下
- AAA 及 RADIUS/HWTACACS 协议配置
- 机器学习2-Logistic回归
- Servlet(2) 三个域对象
- MAML论文阅读笔记--回归实验
- 服务器远程管理与监控
- MII、RMII、GMII、RGMII接口详解及硬件设计注意事项
- 手把手教你搭建一台永久运行的个人服务器
- 使用数位板遇到的常见问题及解决方法
- .texi文件如何转成pdf
- 软路由连接NAS做链路聚合
- 【软件测试】什么软件测试,软件测试和研发的区别
- c语言switch逻辑用语,第一章 第二节用逻辑用语.doc