论文笔记:多标签学习——LIFT算法
原文见 Zhang, M.-L., & Wu, L. (2015). LIFT: Multi-label learning with label-specific features. IEEE Transactions on Pattern Analysis and Machine Intelligence, 37, 107–120.在线地址
特点
把多标签问题转换成了多个二分类问题。
关键步骤
- label-specific features construction
- classification models induction
符号系统
符号 | 含义 | 说明 |
---|---|---|
X=Rd\mathcal{X}=\mathbb{R}^dX=Rd | ddd维特征向量 | |
Y={l1,l2,⋯,lq}\mathcal{Y}=\{l_1,l_2,\cdots,l_q\}Y={l1,l2,⋯,lq} | 标签空间 | lkl_klk表示标签,其中k∈[1,q]k\in[1,q]k∈[1,q] |
ϕk(x)\phi_k(\mathbf{x})ϕk(x) | ϕk(x)=[d(x,P1k),⋯,d(x,Pmkk),d(x,N1k),⋯,d(x,Nmkk)]\phi_k(\mathbf{x})=[\mathbf{d}(\mathbf{x},\mathbf{P}_1^k),\cdots,\mathbf{d}(\mathbf{x},\mathbf{P}_{m^k}^k),\mathbf{d}(\mathbf{x},\mathbf{N}_1^k),\cdots,\mathbf{d}(\mathbf{x},\mathbf{N}_{m^k}^k)]ϕk(x)=[d(x,P1k),⋯,d(x,Pmkk),d(x,N1k),⋯,d(x,Nmkk)] | 将原特征空间映射到新的特征空间,其中k∈[1,q]k\in[1,q]k∈[1,q] |
Bk\mathcal{B}_kBk | 由新的特征空间构成的二分类训练数据集 | 其中k∈[1,q]k\in[1,q]k∈[1,q] |
f:X→Y\mathcal{f}:\mathcal{X}\rightarrow \mathcal{Y}f:X→Y | 分类器 |
主要过程:
Step1: 将数据集分为标签含有lk(k∈[0,q])l_k(k\in[0,q])lk(k∈[0,q])标签:Pk={xi∣(xi,Yi)∈D,lk∈Yi}\mathcal{P}_k=\{\mathbf{x}_i|(\mathbf{x}_i,\mathbf{Y}_i)\in D,l_k\in \mathbf{Y}_i\}Pk={xi∣(xi,Yi)∈D,lk∈Yi}和不含lkl_klk标签:Nk={xi∣(xi,Yi)∈D,lk∉Yi}\mathcal{N}_k=\{\mathbf{x}_i|(\mathbf{x}_i,\mathbf{Y}_i)\in D,l_k\notin \mathbf{Y}_i\}Nk={xi∣(xi,Yi)∈D,lk∈/Yi}的两个数据集,针对这两个数据集进行k-means聚类成mkm_kmk个簇,其中mkm_kmk的取值为:
mk=⌈r⋅min(∣Pk∣,∣Nk∣)⌉m_k=\lceil r\cdot \mathop {min(|P_k|,|N_k|)}\rceil mk=⌈r⋅min(∣Pk∣,∣Nk∣)⌉
(其中r∈[0,1]r\in[0,1]r∈[0,1],mkm_kmk取最小值可以避免∣Pk∣≪∣Nk∣\mathcal{|P_k|\ll |N_k|}∣Pk∣≪∣Nk∣导致的类失衡,训练出的模型不准确)。
完成聚类后的簇的中心表示为:
针对正样本数据集:{p1k,p2k,⋯,pmkk}\{\mathbf{p_1^k,p_2^k,\cdots,p_{m^k}^k}\}{p1k,p2k,⋯,pmkk}
针对负样本数据集:{n1k,n2k,⋯,nmkk}\{\mathbf{n_1^k,n_2^k,\cdots,n_{m^k}^k}\}{n1k,n2k,⋯,nmkk}
于是,每个训练数据到每个中心点的距离组成了新的特征空间:
ϕk(x)=[d(x,P1k),⋯,d(x,Pmkk),d(x,N1k),⋯,d(x,Nmkk)]\phi_k(\mathbf{x})=[\mathbf{d}(\mathbf{x},\mathbf{P}_1^k),\cdots,\mathbf{d}(\mathbf{x},\mathbf{P}_{m^k}^k),\mathbf{d}(\mathbf{x},\mathbf{N}_1^k),\cdots,\mathbf{d}(\mathbf{x},\mathbf{N}_{m^k}^k)]ϕk(x)=[d(x,P1k),⋯,d(x,Pmkk),d(x,N1k),⋯,d(x,Nmkk)]
Step2: 由新的特征空间构成的二分类训练数据集进行训练,得到分类器fkf_kfk。
如果对所有标签都完成上述操作,那么会得到qqq个分类器,当预测时,同样需要对数据的原特征空间进行映射操作,然后经过qqq个分类器进行分类,得到预测结果。
论文中的伪代码:
LIFT算法的缺点:由于是对各个标签进行独立学习,没有考虑标签的相关性。
总结:作者将一个多标签问题转换成了多个二分类问题来解决,通过聚类中心构建了新的特征集合(我们是不是也可以通过这种方式进行数据处理呀),然后根据新的特征空间生成多个分类器,最后结合多个分类器进行总体分类。
论文笔记:多标签学习——LIFT算法相关推荐
- 论文笔记——多标签学习:GLOCAL
原文见Yue Zhu, James T. Kwok, Zhi-Hua Zhou, Multi-Label Learning with Global and Local Label Correlatio ...
- 论文笔记: 多标签学习 LSML
摘要: 分享对论文的理解. 原文见 Huang, J., Qin, F., Zheng, X., Cheng, Z.-K., Yuan, Z.-X., Zhang, W.-G., & Huan ...
- 强化学习论文笔记:Soft Actor Critic算法
Soft Actor Critic是伯克利大学团队在2018年的ICML(International Conference on Machine Learning)上发表的off-policy mod ...
- 论文笔记 | 基于深度学习的乳腺转移瘤识别(Deep Learning for Identifying Metastatic Breast Cancer)
论文阅读笔记:原文链接 摘要 生物医学图像国际研讨会(International Symposium on Biomedical Imaging,ISBI)举办了一个在前哨淋巴节点全幻灯图中自动检测转 ...
- 【论文笔记】课堂学习行为测量系统的设计与实现
很久没看论文了.这篇论文,只把核心的放在这里面. 摘 要 课堂是学校教育的核心,课堂教学过程评价对于教学质量的提高有重要意义,而学生的课堂行为表现是课堂教学评价的重要成分.通过评价学生的课堂行为,形成 ...
- 【论文笔记】强化学习论文阅读-Model-Based RL 9篇
简要介绍了一下Model-Based RL领域的经典论文(2018年以前). 文章目录 引子 a. Model is learned Imagination-Augmented Agents for ...
- 论文笔记:联邦学习——Federated Learning: Strategies for Improving Communication Efficiency
Federated Learning: Strategies for Improving Communication Efficiency 文章目录 Federated Learning: Strat ...
- 顶会论文笔记:联邦学习——ATPFL: Automatic Trajectory Prediction Model Design under Federated Learning Framework
ATPFL: Automatic Trajectory Prediction Model Design under Federated Learning Framework 文章目录 ATPFL: A ...
- 论文笔记:联邦学习——Federated Learning: Challenges, Methods, and Future Directions
Federated Learning: Challenges, Methods, and Future Directions 论文链接: link Federated Learning: Challe ...
- 【论文笔记】深度学习 Lips Don’t Lie: A Generalisable and Robust Approach to Face Forgery Detection
* Lips Don't Lie: A Generalisable and Robust Approach to Face Forgery Detection 嘴唇不撒谎:一种泛化的和鲁棒的人脸伪造检 ...
最新文章
- CLLocationCoordinate2D 用法 和一个最隐蔽的错误
- ElasticStack系列之十六 ElasticSearch5.x index/create 和 update 源码分析
- USB相关结构体之struct usb_device
- Shiro之权限管理的概念
- Spring框架—IoC容器
- spark.mllib:GradientBoostedTrees
- UC浏览器电脑版怎么开启免费WiFi
- android案例_Android实训案例——计算器的运算逻辑
- 美国签证过不了,ICLR 2020搬到埃塞俄比亚,同性恋学者:不去,保命要紧
- 网站的安全登录认证设计
- 使用 google_breakpad 分析 Electron 崩溃日志文件
- 华硕A55V,终于解决了无线网指示灯不亮的问题。
- 激光slam理论与实践
- 京东一面:如何用 Nginx 禁止国外 IP 访问网站,直接凉凉!
- 计算机如何写上大于符号,电脑大于等于号怎么打出来
- 阿里巴巴集团部分技术BLOG
- 全国计算机一级WORD第三套,全国计算机等级考试一级WPSOffice练习题及答案第三套.pdf...
- 让Android程序教你画画
- SAP/PP-40策略下SO不消耗PIR问题
- [渝粤教育] 西南科技大学 土力学基础工程 在线考试复习资料(1)
热门文章
- Linux征途服务端启动,linux征途之系统开机流程
- LED显示屏工程招标常见控标十八绝招!
- mysql profiling sending data_Mysql一次Sending data占用大量时间的深入分析优化案例
- python实现画樱花树
- 网络安全笔记-99-渗透-渗透测试方法论
- 如何用计算机测量图片景深,用比较仔细的测量搞清楚“景深”(1.实测景深与公式比较)...
- 最新Android框架排行榜。
- 2、一个向量乘它的转置,其几何意义是什么?
- 模仿实现百度搜索黑洞动画效果
- 51nod 1428 贪心