原文见 Zhang, M.-L., & Wu, L. (2015). LIFT: Multi-label learning with label-specific features. IEEE Transactions on Pattern Analysis and Machine Intelligence, 37, 107–120.在线地址
特点
把多标签问题转换成了多个二分类问题。

关键步骤

  1. label-specific features construction
  2. classification models induction

符号系统

符号 含义 说明
X=Rd\mathcal{X}=\mathbb{R}^dX=Rd ddd维特征向量
Y={l1,l2,⋯,lq}\mathcal{Y}=\{l_1,l_2,\cdots,l_q\}Y={l1​,l2​,⋯,lq​} 标签空间 lkl_klk​表示标签,其中k∈[1,q]k\in[1,q]k∈[1,q]
ϕk(x)\phi_k(\mathbf{x})ϕk​(x) ϕk(x)=[d(x,P1k),⋯,d(x,Pmkk),d(x,N1k),⋯,d(x,Nmkk)]\phi_k(\mathbf{x})=[\mathbf{d}(\mathbf{x},\mathbf{P}_1^k),\cdots,\mathbf{d}(\mathbf{x},\mathbf{P}_{m^k}^k),\mathbf{d}(\mathbf{x},\mathbf{N}_1^k),\cdots,\mathbf{d}(\mathbf{x},\mathbf{N}_{m^k}^k)]ϕk​(x)=[d(x,P1k​),⋯,d(x,Pmkk​),d(x,N1k​),⋯,d(x,Nmkk​)] 将原特征空间映射到新的特征空间,其中k∈[1,q]k\in[1,q]k∈[1,q]
Bk\mathcal{B}_kBk​ 由新的特征空间构成的二分类训练数据集 其中k∈[1,q]k\in[1,q]k∈[1,q]
f:X→Y\mathcal{f}:\mathcal{X}\rightarrow \mathcal{Y}f:X→Y 分类器

主要过程:
Step1: 将数据集分为标签含有lk(k∈[0,q])l_k(k\in[0,q])lk​(k∈[0,q])标签:Pk={xi∣(xi,Yi)∈D,lk∈Yi}\mathcal{P}_k=\{\mathbf{x}_i|(\mathbf{x}_i,\mathbf{Y}_i)\in D,l_k\in \mathbf{Y}_i\}Pk​={xi​∣(xi​,Yi​)∈D,lk​∈Yi​}和不含lkl_klk​标签:Nk={xi∣(xi,Yi)∈D,lk∉Yi}\mathcal{N}_k=\{\mathbf{x}_i|(\mathbf{x}_i,\mathbf{Y}_i)\in D,l_k\notin \mathbf{Y}_i\}Nk​={xi​∣(xi​,Yi​)∈D,lk​∈/​Yi​}的两个数据集,针对这两个数据集进行k-means聚类成mkm_kmk​个簇,其中mkm_kmk​的取值为:
mk=⌈r⋅min(∣Pk∣,∣Nk∣)⌉m_k=\lceil r\cdot \mathop {min(|P_k|,|N_k|)}\rceil mk​=⌈r⋅min(∣Pk​∣,∣Nk​∣)⌉
(其中r∈[0,1]r\in[0,1]r∈[0,1],mkm_kmk​取最小值可以避免∣Pk∣≪∣Nk∣\mathcal{|P_k|\ll |N_k|}∣Pk​∣≪∣Nk​∣导致的类失衡,训练出的模型不准确)。
完成聚类后的簇的中心表示为:
针对正样本数据集:{p1k,p2k,⋯,pmkk}\{\mathbf{p_1^k,p_2^k,\cdots,p_{m^k}^k}\}{p1k​,p2k​,⋯,pmkk​}
针对负样本数据集:{n1k,n2k,⋯,nmkk}\{\mathbf{n_1^k,n_2^k,\cdots,n_{m^k}^k}\}{n1k​,n2k​,⋯,nmkk​}
于是,每个训练数据到每个中心点的距离组成了新的特征空间:
ϕk(x)=[d(x,P1k),⋯,d(x,Pmkk),d(x,N1k),⋯,d(x,Nmkk)]\phi_k(\mathbf{x})=[\mathbf{d}(\mathbf{x},\mathbf{P}_1^k),\cdots,\mathbf{d}(\mathbf{x},\mathbf{P}_{m^k}^k),\mathbf{d}(\mathbf{x},\mathbf{N}_1^k),\cdots,\mathbf{d}(\mathbf{x},\mathbf{N}_{m^k}^k)]ϕk​(x)=[d(x,P1k​),⋯,d(x,Pmkk​),d(x,N1k​),⋯,d(x,Nmkk​)]

Step2: 由新的特征空间构成的二分类训练数据集进行训练,得到分类器fkf_kfk​。
如果对所有标签都完成上述操作,那么会得到qqq个分类器,当预测时,同样需要对数据的原特征空间进行映射操作,然后经过qqq个分类器进行分类,得到预测结果。

论文中的伪代码:

LIFT算法的缺点:由于是对各个标签进行独立学习,没有考虑标签的相关性。

总结:作者将一个多标签问题转换成了多个二分类问题来解决,通过聚类中心构建了新的特征集合(我们是不是也可以通过这种方式进行数据处理呀),然后根据新的特征空间生成多个分类器,最后结合多个分类器进行总体分类。

论文笔记:多标签学习——LIFT算法相关推荐

  1. 论文笔记——多标签学习:GLOCAL

    原文见Yue Zhu, James T. Kwok, Zhi-Hua Zhou, Multi-Label Learning with Global and Local Label Correlatio ...

  2. 论文笔记: 多标签学习 LSML

    摘要: 分享对论文的理解. 原文见 Huang, J., Qin, F., Zheng, X., Cheng, Z.-K., Yuan, Z.-X., Zhang, W.-G., & Huan ...

  3. 强化学习论文笔记:Soft Actor Critic算法

    Soft Actor Critic是伯克利大学团队在2018年的ICML(International Conference on Machine Learning)上发表的off-policy mod ...

  4. 论文笔记 | 基于深度学习的乳腺转移瘤识别(Deep Learning for Identifying Metastatic Breast Cancer)

    论文阅读笔记:原文链接 摘要 生物医学图像国际研讨会(International Symposium on Biomedical Imaging,ISBI)举办了一个在前哨淋巴节点全幻灯图中自动检测转 ...

  5. 【论文笔记】课堂学习行为测量系统的设计与实现

    很久没看论文了.这篇论文,只把核心的放在这里面. 摘 要 课堂是学校教育的核心,课堂教学过程评价对于教学质量的提高有重要意义,而学生的课堂行为表现是课堂教学评价的重要成分.通过评价学生的课堂行为,形成 ...

  6. 【论文笔记】强化学习论文阅读-Model-Based RL 9篇

    简要介绍了一下Model-Based RL领域的经典论文(2018年以前). 文章目录 引子 a. Model is learned Imagination-Augmented Agents for ...

  7. 论文笔记:联邦学习——Federated Learning: Strategies for Improving Communication Efficiency

    Federated Learning: Strategies for Improving Communication Efficiency 文章目录 Federated Learning: Strat ...

  8. 顶会论文笔记:联邦学习——ATPFL: Automatic Trajectory Prediction Model Design under Federated Learning Framework

    ATPFL: Automatic Trajectory Prediction Model Design under Federated Learning Framework 文章目录 ATPFL: A ...

  9. 论文笔记:联邦学习——Federated Learning: Challenges, Methods, and Future Directions

    Federated Learning: Challenges, Methods, and Future Directions 论文链接: link Federated Learning: Challe ...

  10. 【论文笔记】深度学习 Lips Don’t Lie: A Generalisable and Robust Approach to Face Forgery Detection

    * Lips Don't Lie: A Generalisable and Robust Approach to Face Forgery Detection 嘴唇不撒谎:一种泛化的和鲁棒的人脸伪造检 ...

最新文章

  1. CLLocationCoordinate2D 用法 和一个最隐蔽的错误
  2. ElasticStack系列之十六 ElasticSearch5.x index/create 和 update 源码分析
  3. USB相关结构体之struct usb_device
  4. Shiro之权限管理的概念
  5. Spring框架—IoC容器
  6. spark.mllib:GradientBoostedTrees
  7. UC浏览器电脑版怎么开启免费WiFi
  8. android案例_Android实训案例——计算器的运算逻辑
  9. 美国签证过不了,ICLR 2020搬到埃塞俄比亚,同性恋学者:不去,保命要紧
  10. 网站的安全登录认证设计
  11. 使用 google_breakpad 分析 Electron 崩溃日志文件
  12. 华硕A55V,终于解决了无线网指示灯不亮的问题。
  13. 激光slam理论与实践
  14. 京东一面:如何用 Nginx 禁止国外 IP 访问网站,直接凉凉!
  15. 计算机如何写上大于符号,电脑大于等于号怎么打出来
  16. 阿里巴巴集团部分技术BLOG
  17. 全国计算机一级WORD第三套,全国计算机等级考试一级WPSOffice练习题及答案第三套.pdf...
  18. 让Android程序教你画画
  19. SAP/PP-40策略下SO不消耗PIR问题
  20. [渝粤教育] 西南科技大学 土力学基础工程 在线考试复习资料(1)

热门文章

  1. Linux征途服务端启动,linux征途之系统开机流程
  2. LED显示屏工程招标常见控标十八绝招!
  3. mysql profiling sending data_Mysql一次Sending data占用大量时间的深入分析优化案例
  4. python实现画樱花树
  5. 网络安全笔记-99-渗透-渗透测试方法论
  6. 如何用计算机测量图片景深,用比较仔细的测量搞清楚“景深”(1.实测景深与公式比较)...
  7. 最新Android框架排行榜。
  8. 2、一个向量乘它的转置,其几何意义是什么?
  9. 模仿实现百度搜索黑洞动画效果
  10. 51nod 1428 贪心