摘要

在基于隐式反馈的协同过滤中,负采样(negative sampling)是从大量的unlabeled data中获取负样本标签比较常用和流行的方法。然而,负采样的效率和有效性这两个问题仍然没有被很好的解决,因为它们使用比较复杂的结构,并且忽视了 false negative样本的风险。本文首先通过实验观察,提供了一个关于负样本比较新颖的理解。作者发现,在模型学习过程中只有一小部分样本比较重要,并且假负例(FN)在许多训练迭代中倾向于有稳定的预测。基于此发现,作者提出了一个Simplify and Robustify 负采样方法。

Intro & Contri

协同过滤中的负采样主要有两个需要关注的问题:

  1. 效率(efficiency). 因为要从很大的unlabeled data中采样,所以对采样方法的效率有一定的要求。
  2. 有效性(effectiveness). 被采样的样本必须是高质量的,这样才能学的好嘛。

PS: 这里文章作者说将所有unlabeled data看成负样本是不现实的。其实我本人不太赞同这句话,我认为无论是负采样,还是将所有未知数据看成负样本,都是两种不同保守派的表现,一种是用户没点不代表不喜欢,但其实有的时候是真的不喜欢。所以这方面也不能太绝对,关键是如何去找到一个相对中和的假设?是否会更好呢?

负采样

协同过滤中,最简单的就是直接采用均匀分布采样,随后又有不少论文提出了不同

Simplify and Robustify Negative Sampling for Implicit Collaborative Filtering (Nips‘20) 论文小结相关推荐

  1. 【RS-Attack】攻击MF:Data Poisoning Attacks on Factorization-Based Collaborative Filtering (NIPS‘16)

    Data Poisoning Attacks on Factorization-Based Collaborative Filtering NIPS'16 针对矩阵分解的投毒攻击.文章针对两个矩阵分解 ...

  2. 2019_SIGIR_Neural Graph Collaborative Filtering

    [论文阅读笔记]2019_SIGIR_Neural Graph Collaborative Filtering 论文下载地址: https://doi.org/10.1145/3331184.3331 ...

  3. 【推荐系统论文精读系列】(五)--Neural Collaborative Filtering

    文章目录 一.摘要 二.介绍 三.准备知识 3.1 从隐式数据中进行学习 3.2 矩阵分解 四.神经协同过滤 4.1 总体框架 4.1.1 学习NCF 4.2 广义矩阵分解(GMF) 4.3 多层感知 ...

  4. Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation (2020)

    文章目录 1. Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation ...

  5. word2vec原理(三): 基于Negative Sampling的模型

    目录 1. Hierarchical Softmax的缺点与改进 2. Negative Sampling(负采样) 概述 3. 基于Negative Sampling的模型梯度计算 4. Negat ...

  6. 【word2vec】篇三:基于Negative Sampling 的 CBOW 模型和 Skip-gram 模型

    系列文章: [word2vec]篇一:理解词向量.CBOW与Skip-Gram等知识 [word2vec]篇二:基于Hierarchical Softmax的 CBOW 模型和 Skip-gram 模 ...

  7. Word2Vec学习笔记(五)——Negative Sampling 模型(续)

    本来这部分内容不多,是想写在negative sampling 中和cbow一起的,但是写了后不小心按了删除键,浏览器直接回退,找不到了,所以重新写新的,以免出现上述情况 (接上) 三.Negativ ...

  8. Word2Vec学习笔记(四)——Negative Sampling 模型

    前面讲了Hierarchical softmax 模型,现在来说说Negative Sampling 模型的CBOW和Skip-gram的原理.它相对于Hierarchical softmax 模型来 ...

  9. NLP | Word2Vec之基于Negative Sampling的 CBOW 和 skip-gram 模型

    前面介绍了基于Hierarchical Softmax的 skip-gram 和 CBOW 模型,虽然我们使用霍夫曼树代替传统的神经网络,可以提高模型训练的效率.但是如果我们的训练样本里的中心词www ...

最新文章

  1. 对geobeansEvent事件回调函数的改进
  2. 元宇宙iwemeta:2021年企业领袖榜公布,曹德旺为终身成就奖
  3. 基于Erlang的并发程序简要
  4. HDU - 1005 Number Sequence(循环群)
  5. 视音频编解码学习工程:H.264分析器
  6. python升级matplotlib包_Python-matplotlib包
  7. 利用扩展欧几里得算法编程求逆元
  8. Flask cookie API(response.set_cookie,request.cookies)
  9. 搜索引擎的那些事(web遍历)
  10. 【Linux】/etc/shadow文件字段解释
  11. MySql学习10-----存储过程和函数
  12. Python 语言程序设计(5-3) 代码复用与函数递归
  13. PYTHON莫名其妙的崩溃
  14. 计算机等级考试c 试题及答案,3月计算机等级考试级C笔试试题及答案解析.doc
  15. VAssistX 快捷键
  16. mysql建表与oracle_oracle建表与MySQL建表区别
  17. 年会抽奖(错排算法)
  18. 手机连接360免费WIFI一直显示正在获取IP地址、无法连接的解决方法
  19. 头文件<ctype.h>
  20. ps 改变图片中的文字

热门文章

  1. Django通过celery 异步发送邮件 : django开发之天天生鲜项目知识总结【5】
  2. 中国科学院大学计算机软件与理论量子研究生,2019中国科学院大学硕士研究生入学考试《量子力学》考试大纲...
  3. MICROS 9700安装
  4. 关于使用阿里云服务调用识别身份证图片、营业执照的信息抓取接口的简单实现
  5. 傅里叶变换中,圆频率w与频率f之间的公式转化
  6. 关于java.lang.Exception:No tests found matching的一系列解决方法
  7. 认识 Fuchsia OS
  8. 命令行下使用cl命令设置
  9. git : 无法将“git”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写,如果包括路径,请确保路径正确,然后再试 一次。
  10. 苹果录屏精灵_iPhone自带投屏与录屏,3分钟教你操作!