【论文解读】多视图多示例多标签的协同矩阵分解

题目: Multi-View Multi-Instance Multi-Label Learning based on Collaborative Matrix Factorization

会议: AAAI 2019

论文: https://arxiv.org/pdf/1905.05061.pdf

1 Motivation

1、现有的M3L方法仅仅探索了部分实体（包，实例和标签）之间的关系，而这些实体之间的关系可以给M3L方法提供丰富的上下文信息，因此，现有的M3L方法性能次优；

2、大部分的MIML算法仅关注单视图数据，但是，在实际应用中，通常可以通过不同的视图来表示多实例多标签对象。

2 Related work

由于包之间以及实例之间存在多种类型的关系,与最近大量研究的MIML任务相比，从多视图包中学习更加困难和挑战。当前已有不少研究工作致力于解决这样一种挑战。如表1所示：

尽管这些方法在努力解决多视图MIML学习问题，但是这些方法仅考虑了包之间和实例之间有限的关系类型。

3 Methodology

所提模型主要包括两部分，一部分是异质网络的构建，另一部分是协同关系矩阵分解。

3.1 Heterogeneous Network Construction

1、construct a subnetwork of instances for each feature view

利用高斯热核为每个特征视图中的实例构建子网，其中

为第v个视图中m个实例的平均欧氏距离。

2、construct a bag subnetwork for each feature view

利用豪斯多夫距离为每个试图中的包构建子网

3、construct a subnetwork of labels

利用cosine相似度来量化标签相关性，其中

和

为两个标签，

是标签c在所有包中的分布。

以上三部分便构建完了实例-实例，包-包，标签-标签的子网，另外，通过数据集的信息，作者继续构建包-实例，包-标签，实例-标签之间的数据矩阵。

4、The bag-instance inter-relational data matrix

5、The bag-label relational matrix

6、The instance-label relational data matrix

. 初始，实例-标签的数据矩阵未知，设为0.

3.2 Collaborative Matrix Factorization

论文所提方法M3Lcmf的目标函数所下所示：

M3Lcmf有两个预测项：实例-标签的联系

和包-标签的联系

。除了直接利用

趋近

，作者增加了一个整合项

。这个整合项受多实例学习原理的驱动，即包的标签取决于其实例的标签。另外，此整合项可以反向指导

和

的学习。

由目标函数的前三项可以看出，M3Lcmf构建了包-实例，包-标签，实例-标签之间的关系。按照流行正则的思想，促使有着高相似性的数据点在低维空间内相似，构成MR(G)，利用图拉普拉斯矩阵来构建包-包，实例-实例，标签-标签之间的关系。

最后，可以利用优化好的

和

来获取实例-标签的相关性矩阵：

，同样，要将实例的标签进一步映射到相应的包上，作者利用

来趋近包-标签相关性矩阵。因此，M3Lcmf既可以实现包级预测也可以实现实例级预测。

Experiments

Datasets

前五个数据集为包级的数据集，后四个为实例级的数据集。

Metric

1、Ranking Loss (RankLoss),

2、macro AUC (Area Under receiver operating Curve)

3、Average Recall (AvgRecall),

4、Average F1-score (AvgF1).

Results

1、Prediction Results at the Bag-Level

M3Lcmf优于MIMLmix和M2IL：M3Lcmf利用了更多对象之间的关系；
M3Lcmf优于MIML方法（MIMLNN, MIMLfast 和 MIMLSVM）：MIML相比于M3Lcmf利用了更少的实体之间的关系；
MIMLRBF性能逼近M3Lcmf：尽管MIMLRBF利用了更少的实体关系，但是MIMLRBF利用神经网络来获取特征表示。

2、Prediction Results at the Instance-Level

M3Lcmf性能最优，MIMLmix第二，MIMLfast第三是因为MIMLmix没有利用包-包联系和实例-实例之间的关系，MIMLfast在此基础上，还没有利用实例-标签的关系。

3、Contribution of Different Types of Relations

说明实体之间的各种关系都有助于M3L方法的学习。

参数敏感实验详情请见原论文。

参考文献

[Nguyen, Zhan, and Zhou 2013] Nguyen, C. T.; Zhan, D. C.; and Zhou, Z. H. 2013. Multi-modal image annotation with multi-instance multi-label lda. In IJCAI, 1558–1564.

[Nguyen et al. 2014] Nguyen, C. T.; Wang, X.; Liu, J.; and Zhou, Z. H. 2014. Labeling complicated objects: multi-view multi-instance multi-label learning. In AAAI, 2013–2019.

[Yang et al. 2018] Yang, Y.; Wu, Y.-F.; Zhan, D.-C.; Liu, Z.- B.; and Jiang, Y. 2018. Complex object classification: A multi-modal multi-instance multi-label deep network with optimal transport. In KDD, 2594–2603.

[Li et al. 2017] Li, B.; Yuan, C.; Xiong, W.; Hu, W.; Peng, H.; Ding, X.; and Maybank, S. 2017. Multi-view multi-instance learning based on joint sparse representation and multi-view dictionary learning. TPAMI 39(12):2554–2560.

[Zhou et al. 2008] Zhou, Z. H.; Zhang, M. L.; Huang, S. J.; and Li, Y. F. 2008. Miml: A framework for learning with ambiguous objects. Corr Abs 2012.

[Huang, Gao, and Zhou 2018] Huang, S.-J.; Gao, W.; and Zhou, Z.-H. 2018. Fast multi-instance multi-label learning. TPAMI 99(1):1–14.

[Zhang and Wang 2009] Zhang, M. L., and Wang, Z. J. 2009. Mimlrbf: Rbf neural networks for multi-instance multi-label learning. Neurocomputing 72(16-18):3951–3956.


往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑温州大学《机器学习课程》视频
本站qq群851320808，加入微信群请扫码：