动机

传统的多标签推荐问题只关注于图片的视觉特征，但往往不同的人看同一张图片时会有各自倾向的标签，因此本文在进行多标签推荐任务时，将用户的个人偏好信息建模其中。

更直观的说，下文中举了从YFCC100M数据集中提取出的图片，可见a和b图像，c和d图像在视觉观感上是相似的，但其匹配的标签却是不同的。因此，对于图片的标签推荐来说，涉及到用户、图像和标签三者的关系。传统的任务只考虑了图像和标签的关系，这就导致了标签的建模只依赖于图片的视觉特征。往往在为用户进行标签推荐的过程中，除了图像本身的视觉特征外，个人的偏好因素同样应该被建模其中。

贡献

本文提出了一个端到端的基于个人偏好和视觉特征的标签推荐框架，其通过无监督的训练方式基于带有残差的Encoder-Decoder来进行用户偏好特征的提取，然后结合视觉特征来共同进行标签推荐任务。
在进行标签推荐任务的过程中引入了对抗学习的机制来提高标签预测的性能，通过引入对抗训练，使得模型可以生成更加类似于人类标记的行为，以此学到更加鲁班的特征表示。
本文通过在YFCC100M和NUS-WIDE数据集上进行测试显示了其方法的优越性，同时通过消融实验验证了所提出组件的有效性。

模型结构

本文的模型结构主要分为三个组件，①用户偏好建模；②视觉特征建模；③个性化标签推荐建模。通过三个组件联合优化最终达到端到端优化的目的，输入一张图像以及该用户的历史标签记录，通过用户偏好组件抽取的用户特征以及视觉编码组件抽取的视觉特征进行拼接，然后送入个性化标签分类器，最终依靠Cross-entropy loss、Adversarial loss、Discriminator loss以及Personalized loss来进行模型的参数学习。接下来将对三个组件一一进行介绍。

1. 用户偏好建模

用户偏好建模方面（标黄部分）是采用的无监督学习的方式来重构用户的历史标签记录，利用Encoder-Decoder框架来进行表示学习。在此主要有2个创新点供我们学习和借鉴，其一是在Encoder-Decoder框架基础上引入了残差模型；其二是采用了HUber loss。这两个创新点都是为了学到更好的用户特征表示。

其中，Auto-Encoder模块的Encoder部分将用户历史标签信息作为输入，输出该用户的低维表示；然后中间表示经过Decoder部分来还原出原始的用户历史标签记录。作者认为传统的Auto-Encoder框架会存在如下挑战：即如果两个不同的用户经过Encoder之后生成类似的中间表示，那么Decoder就很难将其区分开并且学到有区分的表示。基于此，提出了带有残差的Auto-Encoder框架，即将Encoder部分的用户历史信息（文中称为user history encodings）传递至Decoder过程，这样就可以在解码的过程中记住原始的该用户信息，为后续学到有区分的特征提供了基础。另外，为了进一步的获得更有效的用户表示，作者利用了Huber loss：

即如果两个向量之间的距离小于阈值时，用原始的平方损失；如果两个向量之间的距离大于阈值就用带有参数的绝对值损失。因为即使对于两个不同用户有着相似的标签行为，对于用户的原始标签记录来说也会存在较大的变化（比如频率），因此通过huber loss来对其进行缓解。

2. 视觉特征建模

视觉特征建模方面（下图标黄部分）主要采用了视觉主流模型Resnet来进行特征抽取，随后将得到的视觉特征与用户低维表示拼接后送给个性化推荐分类器进行最终的分类任务。其中视觉特征建模部分为了学到更类似于人类打标签行为的模式，提出了基于对抗学习的标签分类方法，即将生成器生成的标签与人工标注的标签送给判别器来进行区分以此学到更强大的判别器，随后生成器通过模拟人工标签的习惯来尽可能的骗过判别器以此来学习更强大的生成器，最终使得学到的特征更加符合人工的行为习惯，同时可利用生成器来生成近似于人打标签行为的数据。在此，由于生成器生成的标签是0到1之间连续的数值，而人工真实标注的标签是非0即1的离散值，因此判别器很容易将其区分开。为了缓解这样的情况，作者利用了Jittering trick，即对人工的标签进行随机化，使得原来是1的标签现在变为0.7到1之间的实数，原来是0的标签现在变为0到0.3的实数，这样使得判别器尽可能的学习真实的用户行为还是机器行为，而不是简单的通过判断数据的形式来进行分类了。

视觉特征建模部分的对抗学习方式主要是由generator loss和discriminator loss组成，即generator loss尽可能使得生成器骗过判别器（即将生成器生成的标签尽可能的识别为真正的用户标签），而discriminator loss则尽可能的识别出该标签是机器生成的还是用户真实标注的，最终达到生成器能够生成类似于人工标注的图片，而判别器无法正确做出区分。

3. 个性化标签推荐建模

个性化标签推荐建模方面（下图标黄部分）主要采用了交叉熵损失来进行训练。

实验部分

下图列举了文中所对比的方法，以及所用数据集和评价指标。

可见，本文所提出的方法在多个数据集上以及评价指标上都是最优的性能。

文中做了消融实验，证明了所提出的Skip Connection以及Huber loss确实起到了积极作用。并且还探索了对抗训练增加的方式以及冷启动的实验效果。

通过对用户历史标签的变化进行模拟，可见该方法随着用户历史标签的变化，给对应用户所见到的图片推荐的标签也随着时间变化（标签的变化）而产生了相应的变化，证明了所提出方法能够捕捉用户的标签行为偏好演变。

讨论

个人觉得本文最重要的创新是提出一种结合视觉特征抽取与个人偏好的多标签推荐算法，较好的将打标签问题建模为了特征提取与偏好学习的问题，使得对于同一副图像能够标记出个性化的多标签内容。
第二个值得关注的创新点是多标记生成问题，以往的多标签是人工进行标注，但常常会存在千差万别的情况，因此本文利用对抗学习的思想利用机器学习模型来学习用户真实的偏好，以此来解放宝贵的标记时间。
第三个比较吸引我的点是该文利用了许多巧妙的小技巧来提升训练精度。比如文中提到的Jittering trick 和Huber loss，可谓是simple yet effective。
最后想说本文关于多标记生成过程中的扩展想法，目前在生成的时候没有考虑标记之间的关系，未来可以引入标签关联矩阵来进一步的提高生成性能。

「更多干货，更多收获」

【免费下载】2021年9月份热门报告盘点

美团大脑系列之：商品知识图谱的构建及应用

【干货】2021社群运营策划方案.pptx

大数据驱动的因果建模在滴滴的应用实践

联邦学习在腾讯微视广告投放中的实践如何搭建一个好的指标体系？如何打造标准化的数据治理评估体系？

【干货】小米用户画像实践.pdf（附下载链接）

短视频爆粉表现指南手册.pdf（附下载链接）

推荐系统架构与算法流程详解如何搭建一套个性化推荐系统？某视频APP推荐策略详细拆解（万字长文）

2021年轻人性生活报告

关注我们

智能推荐

个性化推荐技术与产品社区

长按并识别关注

您的「在看」，我的动力												

											
MM2020 | 基于对抗学习的个性化标签推荐相关推荐	

								基于深度学习的个性化新闻推荐.pdf（附下载链接）
		今天给大家带来微软亚洲研究院研究院吴方照先生在2020年5月10日举办的"推荐系统前沿进展"系列学术沙龙活动中所做的分享<基于深度学习的个性化新闻推荐>,在本次分享中, ...
		
						用于语音情绪识别的基于对抗学习的说话人无关的表示
		1. 用于语音情绪识别的基于对抗学习的说话人无关的表示 尝试解决的问题: 在语音情绪识别任务中,会面临到要测试的说话人未出现在训练集中的这个问题,本文尝试运用TDNN+LSTM作为特征提取部分,再通过 ...
		
						三角兽首席科学家分享实录：基于对抗学习的生成式对话模型
		本文来自AI新媒体量子位(QbitAI) 对抗学习和对话系统都是近年来的新热点.今年7月,三角兽研究组与哈工大ITNLP实验室合作完成的论文被自然语言领域顶级会议EMNLP录取. 上周三(8月9日)晚 ...
		
						论文浅尝 | 基于对抗学习的弱监督知识图谱对齐
		论文笔记整理:郭凌冰,浙江大学研究助理,研究方向为知识图谱的表示学习. 绝大部分现有的知识图谱对齐方法都要求足够的已对齐三元组作为监督数据,但在现实世界中,获取大量的对齐三元组的代价十分高昂.本文提出 ...
		
						tfidf关键词提取_基于深度学习的个性化商品评论标签提取
		商品评论标签提取作为商品评论中的一个比较有意思的问题.评论标签提取的主要任务是从评论中了解到用户对产品的哪些功能.属性进行了怎样的评论,并抽取成简短有效的信息. 关键词提取Vs评论标签提取 商品标签提 ...
		
						直播 | ACL 2021论文解读：基于对抗学习的事件抽取预训练模型
		「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和 ...
		
						基于深度学习的搜索、推荐、广告系统最全最新论文分享
		推荐系统是有效的信息过滤工具,由于互联网接入的增加.个性化趋势和计算机用户习惯的改变,这种工具非常普遍.尽管现有的推荐系统成功地产生了不错的推荐,但是它们仍然面临着诸如准确性.可伸缩性和冷启动等挑战. ...
		
						ATWebshell：基于对抗学习和长短语义感知的Webshell检测方法
		摘要 [目的]Webshell是一类基于网页脚本的Web攻击程序.黑客攻击者可以通过Webshell获取服务器相关权限来窃取有价值的信息和篡改网页内容等.Webshell种类繁多,现有的检测技术手段无 ...
		
						基于特征的对抗迁移学习论文_[综述]基于对抗学习的图像间转换问题-1
		写在前面:因为下定决心要打起精神来好好扎实自己的学术基础,所以打算从阅读综述入手,对自己想要深入的领域有个总体的认识.文章就是自己的阅读随笔,如果有不对的地方,欢迎大家指出来~ 这篇综述的英文题目是& ...
		
		

					
最新文章	

						Go 语言实现字符串匹配算法 -- BF(Brute Force) 和 RK(Rabin Karp)
		
						H3C V7平台下的IRF堆叠
		
						pybind传输list
		
						java基础之构造方法
		
						【Python 自然语言处理 第二版】读书笔记1:语言处理与Python
		
						Generative Adversarial Networks 生成对抗网络的简单理解
		
						Deep Learning---py-faster-rcnn基于PASCAL VOC数据集训练模型
		
						WebConfig配置 文件加密处理
		
						Qt工作笔记-图形视图框架中的分组，以及添加平行拖动图元
		
						讯飞输入法新升级：支持离线输入方式 加强用户数据安全
		
						【译】在设计表单的时候应该注意的八点
		
						android开发realm多线程操作,数据库的设计：深入理解 Realm 的多线程处理机制
		
						JavaScript中清空数组的三种方式
		
						B - 好数 51Nod - 1717
		
						游侠小秘书基本智能框架完成!!!
		
						SwiftyJSON 对网络请求来的数据进行解析或者转为modul
		
						联想台式计算机 不启动u盘,联想电脑不能u盘启动怎么办
		
						代码审计jizhiCMS 后台getshell
		
						电脑连接另一台电脑发出wifi时，显示ip4无访问权限，ip6无访问权限
		
						redhat下软件安装
		
		
	

热门文章	

									Apple 苹果公司的两个企业特性暂时还不支持中国 - 设备注册计划(DEP) ，批量购买计划(VPP)
			
						oracle去重差个数,oracle去重
			
						网络有时不到计算机,电脑WiFi网络不稳定，有时有有时无怎么办
			
						一个G1 的问题引发对Linux命令总结——超级终端裸装apk程序
			
						JavaScript 动画效果的实现（附带示例）
			
						如何低成本高效率自学Java
			
						ubuntu开放端口
			
						手机已经代替钱包？移动支付技术的应用趋势及未来发展
			
						SCAU华南农业大学-数电实验-可找零的自动售货机-实验报告
			
						CNZZ 移动统计_移动数据统计_移动应用分析_ APP统计

MM2020 | 基于对抗学习的个性化标签推荐

动机

相关工作

模型结构

1. 用户偏好建模

2. 视觉特征建模

3. 个性化标签推荐建模

实验部分

讨论

推荐系统工程师技能树

【免费下载】2021年9月份热门报告盘点

美团大脑系列之：商品知识图谱的构建及应用

大数据驱动的因果建模在滴滴的应用实践

【干货】小米用户画像实践.pdf（附下载链接）

推荐系统解构.pdf（附下载链接）

短视频爆粉表现指南手册.pdf（附下载链接）

2021年轻人性生活报告

MM2020 | 基于对抗学习的个性化标签推荐相关推荐

最新文章

热门文章