Simplify and Robustify Negative Sampling for Implicit Collaborative Filtering (Nips‘20) 论文小结
摘要
在基于隐式反馈的协同过滤中,负采样(negative sampling)是从大量的unlabeled data中获取负样本标签比较常用和流行的方法。然而,负采样的效率和有效性这两个问题仍然没有被很好的解决,因为它们使用比较复杂的结构,并且忽视了 false negative样本的风险。本文首先通过实验观察,提供了一个关于负样本比较新颖的理解。作者发现,在模型学习过程中只有一小部分样本比较重要,并且假负例(FN)在许多训练迭代中倾向于有稳定的预测。基于此发现,作者提出了一个Simplify and Robustify 负采样方法。
Intro & Contri
协同过滤中的负采样主要有两个需要关注的问题:
- 效率(efficiency). 因为要从很大的unlabeled data中采样,所以对采样方法的效率有一定的要求。
- 有效性(effectiveness). 被采样的样本必须是高质量的,这样才能学的好嘛。
PS: 这里文章作者说将所有unlabeled data看成负样本是不现实的。其实我本人不太赞同这句话,我认为无论是负采样,还是将所有未知数据看成负样本,都是两种不同保守派的表现,一种是用户没点不代表不喜欢,但其实有的时候是真的不喜欢。所以这方面也不能太绝对,关键是如何去找到一个相对中和的假设?是否会更好呢?
负采样
协同过滤中,最简单的就是直接采用均匀分布采样,随后又有不少论文提出了不同
Simplify and Robustify Negative Sampling for Implicit Collaborative Filtering (Nips‘20) 论文小结相关推荐
- 【RS-Attack】攻击MF:Data Poisoning Attacks on Factorization-Based Collaborative Filtering (NIPS‘16)
Data Poisoning Attacks on Factorization-Based Collaborative Filtering NIPS'16 针对矩阵分解的投毒攻击.文章针对两个矩阵分解 ...
- 2019_SIGIR_Neural Graph Collaborative Filtering
[论文阅读笔记]2019_SIGIR_Neural Graph Collaborative Filtering 论文下载地址: https://doi.org/10.1145/3331184.3331 ...
- 【推荐系统论文精读系列】(五)--Neural Collaborative Filtering
文章目录 一.摘要 二.介绍 三.准备知识 3.1 从隐式数据中进行学习 3.2 矩阵分解 四.神经协同过滤 4.1 总体框架 4.1.1 学习NCF 4.2 广义矩阵分解(GMF) 4.3 多层感知 ...
- Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation (2020)
文章目录 1. Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation ...
- word2vec原理(三): 基于Negative Sampling的模型
目录 1. Hierarchical Softmax的缺点与改进 2. Negative Sampling(负采样) 概述 3. 基于Negative Sampling的模型梯度计算 4. Negat ...
- 【word2vec】篇三:基于Negative Sampling 的 CBOW 模型和 Skip-gram 模型
系列文章: [word2vec]篇一:理解词向量.CBOW与Skip-Gram等知识 [word2vec]篇二:基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模 ...
- Word2Vec学习笔记(五)——Negative Sampling 模型(续)
本来这部分内容不多,是想写在negative sampling 中和cbow一起的,但是写了后不小心按了删除键,浏览器直接回退,找不到了,所以重新写新的,以免出现上述情况 (接上) 三.Negativ ...
- Word2Vec学习笔记(四)——Negative Sampling 模型
前面讲了Hierarchical softmax 模型,现在来说说Negative Sampling 模型的CBOW和Skip-gram的原理.它相对于Hierarchical softmax 模型来 ...
- NLP | Word2Vec之基于Negative Sampling的 CBOW 和 skip-gram 模型
前面介绍了基于Hierarchical Softmax的 skip-gram 和 CBOW 模型,虽然我们使用霍夫曼树代替传统的神经网络,可以提高模型训练的效率.但是如果我们的训练样本里的中心词www ...
最新文章
- 对geobeansEvent事件回调函数的改进
- 元宇宙iwemeta:2021年企业领袖榜公布,曹德旺为终身成就奖
- 基于Erlang的并发程序简要
- HDU - 1005 Number Sequence(循环群)
- 视音频编解码学习工程:H.264分析器
- python升级matplotlib包_Python-matplotlib包
- 利用扩展欧几里得算法编程求逆元
- Flask cookie API(response.set_cookie,request.cookies)
- 搜索引擎的那些事(web遍历)
- 【Linux】/etc/shadow文件字段解释
- MySql学习10-----存储过程和函数
- Python 语言程序设计(5-3) 代码复用与函数递归
- PYTHON莫名其妙的崩溃
- 计算机等级考试c 试题及答案,3月计算机等级考试级C笔试试题及答案解析.doc
- VAssistX 快捷键
- mysql建表与oracle_oracle建表与MySQL建表区别
- 年会抽奖(错排算法)
- 手机连接360免费WIFI一直显示正在获取IP地址、无法连接的解决方法
- 头文件<ctype.h>
- ps 改变图片中的文字
热门文章
- Django通过celery 异步发送邮件 : django开发之天天生鲜项目知识总结【5】
- 中国科学院大学计算机软件与理论量子研究生,2019中国科学院大学硕士研究生入学考试《量子力学》考试大纲...
- MICROS 9700安装
- 关于使用阿里云服务调用识别身份证图片、营业执照的信息抓取接口的简单实现
- 傅里叶变换中,圆频率w与频率f之间的公式转化
- 关于java.lang.Exception:No tests found matching的一系列解决方法
- 认识 Fuchsia OS
- 命令行下使用cl命令设置
- git : 无法将“git”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试 一次。
- 苹果录屏精灵_iPhone自带投屏与录屏,3分钟教你操作!