文章目录

  • 1. 偏差分析
  • 2. 数据偏差
    • 2.1. 选择偏差 Selection Bias
    • 2.2. 一致性偏差 Conformity Bias
    • 2.3. 曝光偏差 Exposure Bias
    • 2.4. 位置偏差 Position Bias
  • 3. 模型偏差
    • 3.1. 归纳偏差 Inductive Bias
  • 4. 推荐结果的偏差与不公平性
    • 4.1. 流行度偏差 Popularity Bias
    • 4.2. 偏见 Unfairness (用户偏差 User Bias)
  • 5. 论文下载

1. 偏差分析

(1) Bias-Variance Decomposition for Ranking. WSDM 2021;

(2) Transfer Learning in Collaborative Recommendation for Bias Reduction. RecSys 2021;
code: https://csse.szu.edu.cn/staff/panwk/publications/TJR/ .

2. 数据偏差

2.1. 选择偏差 Selection Bias

用户的显式反馈往往很稀疏,并且只有点击的样本才可能有显式反馈。假如用户对样本的反馈是打分,当用户点击样本时,意味着用户已经比较喜欢该样本了,因此打分可能偏高,若不合预期,打分也可能偏低,此时用户的反馈存在选择偏差。这部分观测数据打分的分布,和全体样本的打分分布是有较大差异的,相当于采样不随机,不能很好预估总体。

(1) Measuring and Mitigating Item Under-Recommendation Bias in Personalized Ranking Systems. SIGIR 2020;

(2) E-commerce Recommendation with Weighted Expected Utility. CIKM 2020;
code: https://github.com/zhichaoxu-shufe/E-commerce-Rec-with-WEU.

(3) Combating Selection Biases in Recommender Systems with a Few Unbiased Ratings. WSDM 2021;

(4) Non-Clicks Mean Irrelevant Propensity Ratio Scoring As a Correction. WSDM 2021;

(5) Mitigating Confounding Bias in Recommendation via Information Bottleneck. RecSys 2021;
code: https://github.com/dgliu/RecSys21_DIB .

(6) Pessimistic Reward Models for Off-Policy Learning in Recommendation. RecSys 2021.

2.2. 一致性偏差 Conformity Bias

人是社会性动物,在推荐系统中也是如此。同样以打分为例,用户的评分很容易受大众/朋友的影响,大家都说好的电影,可能你觉得没那么好,但由于不想那么突出,因此也选择从众。这就导致样本数据无法反映用户真实的偏好。

(1) Debiasing Item-to-Item Recommendations With Small Annotated Datasets. RecSys 2020;
code: https://github.com/microsoft/debiasing-item2item .

2.3. 曝光偏差 Exposure Bias

相对于全量索引,推荐系统返回的结果是极其有限的,用户的反馈也只是在这部分曝光样本上产生,对于更多未曝光的样本,由于缺少反馈数据,导致模型无法很好学习未曝光数据的分布。模型训练时是在曝光样本空间,但是预估时是全量样本空间,这就导致曝光偏差。曝光偏差对于新物品不太友好,模型容易对旧物品打高分。

(1) Unbiased Learning for the Causal Effect of Recommendation. RecSys 2020;
code: https://www.dunnhumby.com/source-files/.

(2) Debiased Explainable Pairwise Ranking from Implicit Feedback. RecSys 2021;
code: https://github.com/KhalilDMK/EBPR .

(3) Top-K Contextual Bandits with Equity of Exposure. RecSys 2021;
code: https://github.com/deezer/carousel_bandits .

2.4. 位置偏差 Position Bias

推荐物品的位置也会影响用户的点击率。出于对平台推荐内容的信任,以及用户的使用习惯,位置靠前的视频,往往更容易被点击,但并不代表用户真的喜欢。

(1) Attribute-based Propensity for Unbiased Learning in Recommender Systems Algorithm and Case Studies. KDD 2020;

(2) Unbiased Ad Click Prediction for Position-aware Advertising Systems. RecSys 2020;

(3) Unbiased Learning to Rank in Feeds Recommendation. WSDM 2021;
code: https://github.com/flamewei123/Unbaised-LTR-in-Feeds-Recommendation-WSDM21 .

(4) Cross-Positional Attention for Debiasing Clicks. WWW 2021;

3. 模型偏差

3.1. 归纳偏差 Inductive Bias

归纳偏差来源于模型,定义模型时为了简化问题会人为增加假设,在预测时可能产生泛化误差。

(1) A General Knowledge Distillation Framework for Counterfactual Recommendation via Uniform Data. SIGIR 2020;
code: https://github.com/dgliu/SIGIR20_KDCRec .

(2) Counterfactual Evaluation of Slate Recommendations with Sequential Reward Interactions. KDD 2020;
code: https://github.com/spotify-research/RIPS_KDD2020 .

4. 推荐结果的偏差与不公平性

4.1. 流行度偏差 Popularity Bias

即长尾效应。通常推荐系统分发内容中,头部曝光现象严重,导致样本分布不均匀。热门样本数量更多,这也导致模型倾向给热门样本打高分,分发频率远超其他。通常会对热门样本进行降采样,缓解长尾效应。

(1) Keeping Dataset Biases out of the Simulation : A Debiased Simulator for Reinforcement Learning based Recommender Systems. RecSys 2020;
code: https://github.com/BetsyHJ/SOFA .

(2) Popularity-Opportunity Bias in Collaborative Filtering. WSDM 2021;

(3) Diverse User Preference Elicitation with Multi-Armed Bandits. WSDM 2021;

(4) ProtoCF: Prototypical Collaborative Filtering for Few-shot Item Recommendation. RecSys 2021;
code: https://github.com/aravindsankar28/ProtoCF .

(5) Analyzing Item Popularity Bias of Music Recommender Systems: Are Different Genders Equally Affected? RecSys 2021;

(6) The Idiosyncratic Effects of Adversarial Training on Bias in Personalized Recommendation Learning. RecSys 2021;
code: https://github.com/sisinflab/The-Idiosyncratic-Effects-of-Adversarial-Training .

(7) Biases in Recommendation System. RecSys 2021;

4.2. 偏见 Unfairness (用户偏差 User Bias)

人工智能的伦理问题近年来热度也比较高,例如模型在人种、性别、年龄方面存在歧视,本质上是样本不均匀导致。推荐系统的偏见来源于数据,数据不够多样不够充分,导致模型无法学习充分,在预估时产生了偏见。

(1) Debiasing Career Recommendations with Neural Fair Collaborative Filtering. WWW 2021;
code: https://github.com/rashid-islam/nfcf .

(2) User Bias in Beyond-Accuracy Measurement of Recommendation Algorithms. RecSys 2021;

(3) Measuring and Mitigating Bias and Harm in Personalized Advertising. RecSys 2021;

(4) I Want to Break Free! Recommending Friends from Outside the Echo Chamber. RecSys 2021;

(5) Leave No User Behind Towards Improving the Utility of Recommender Systems for Non-mainstream Users. WSDM 2021;
code: https://github.com/roger-zhe-li/wsdm21-mainstream .

5. 论文下载

以上所有提到的论文都可以在 2020-2021顶会关于推荐系统中的解决偏差(bias)问题的文献汇总.zip 中下载到。

2020-2021年顶会上关于解决偏差(bias)问题的文献整理相关推荐

  1. idea 2020 2021 maven不能下载jar包解决办法

    idea 2020 2021 maven不能下载jar包解决办法 只需简单步骤就可以解决 打开idea 选择pom文件 右键 maven 选择 open 'settings.xml' 打开 修改mir ...

  2. 那些年何恺明在顶会上的分享 | 附PPT下载

    点击上方"AI算法与图像处理",选择加"星标"或"置顶" 重磅干货,第一时间送达 导读 何恺明是CV领域的大神,发表过需要有对后续CV发展有 ...

  3. 2020清华大学计算机学院黄翔,清华大学计算机科学与技术系2020—2021学年度学生会主席候选人名单公示...

    原标题:清华大学计算机科学与技术系2020-2021学年度学生会主席候选人名单公示 根据<清华大学计算机科学与技术系学生会章程>和<清华大学计算机科学与技术系2020-2021学年度 ...

  4. 2021高考本溪高中成绩查询,本溪市高级中学2020—2021学年度(上学期) 高一高二期中表奖大会...

    原标题:本溪市高级中学2020-2021学年度(上学期) 高一高二期中表奖大会 横空大气排山去,人间砥柱是此峰.在这个烟波致爽的时节,在这个书声琅琅的校园,璀璨的星辰却不仅高悬于九天之巅,也灵动在我们 ...

  5. 2018/2019/2020/2021/2022/2023年度计划阅读书籍(持续更新)

    2018/2019/2020/2021/2022/2023年度计划阅读书籍 1. Java加密与解密的艺术(第二版) 作者:梁栋 在读 2. Spring源码深度解析 作者:郝佳 在读 3. 深入理解 ...

  6. 清华大学计算机学院92届韩松,清华大学计算机科学与技术系2020—2021学年度学生科协主席候选人名单公示...

    原标题:清华大学计算机科学与技术系2020-2021学年度学生科协主席候选人名单公示 根据<清华大学计算机科学与技术系学生科学技术协会章程>,清华大学计算机科学与技术系2020-2021学 ...

  7. 凌汛 php,黄河全线开河 安度2020—2021年度凌汛期

    内蒙古包头河段  (马韬 摄) 3月13日9时,黄河内蒙古河段最后封冻河段平稳开通,凌汛洪水安全进入万家寨水库,这标志着黄河安度2020-2021年度凌汛期.本年度黄河凌汛期历时111天,全河封冻总长 ...

  8. 2020年4月2日解决Xmind8自己插入的图片丢失问题的可执行方案

    @2020年4月2日解决Xmind8自己插入的图片丢失问题的可执行方案

  9. USACO 2020~2021 February Contest GOLD 题解(3)

    USACO 2020~2021 二月黄金组 题解(3) 3. Count The Cows As is typical, Farmer John's cows have spread themselv ...

  10. 赤峰市田家炳中学2021高考成绩查询,赤峰市田家炳中学开展2020—2021学年度第一次全体教师培训活动...

    赤峰市田家炳中学开展2020-2021学年度第一次全体教师培训活动 天高云淡,金桂飘香,又一个收获的季节悄然来临.为提升教师业务素质,促进专业成长,8月28日,赤峰市田家炳中学开展了新学期第一次全体教 ...

最新文章

  1. 人工神经网络能否驾驭生物神经元的“浓稠”程度?5到8层可能并非极限
  2. 带AI无人车上云驾校,不出门练遍各大城市道路,华南理工大学团队拿下“互联网+”大赛金奖...
  3. swagger导出excel文档_将Swagger2文档导出为HTML或markdown等格式离线阅读
  4. 2018第九届蓝桥杯C语言第九题 全球变暖
  5. 什么是商业智能(BI),以及其与数据分析的区别?
  6. 解决windows指纹登录不灵问题
  7. kafka不使用自带zk_kafka概念扫盲
  8. [乐理知识] 第三章 拍子 节拍 节奏
  9. 中国移动虚拟服务器设置,在中国移动公众服务云平台上服务器虚拟化的设计与实现...
  10. 【图像增强】基于matlab同态增晰图像增强【含Matlab源码 962期】
  11. 自适应滤波-----LMS(Least Mean Square)算法
  12. 在React中使用Shadow DOM
  13. 404是什么意思,404错误页面有什么用?
  14. 3DES加密,苹果、Java 、安卓 平台一致的加密工具
  15. 许远东:世界上只有2种流量,人找货和货找人,元宇宙机会在哪里
  16. Kafka——创建无消费者组的消费者消费订阅主题
  17. SpringBoot服务监控之Actuate
  18. Ant Design of Vue +TS 表单动态增加数据验证卧坑姿势
  19. JavaScript中递归函数
  20. 备忘录怎么用红笔标注_如何高效的使用苹果产品的备忘录、提醒事项、日历?...

热门文章

  1. 三星电视机dns服务器维护,4招解救三星智能电视看视频卡顿问题
  2. Java之spilt()函数,trim()函数
  3. python 简单点餐系统
  4. 手气不错 跳过搜索 谷歌 Google
  5. 深度自定义macOS邮件程序的个性签名内容
  6. 20、ZigBee 开发教程之基础篇—HC-SR501 人体红外传感器
  7. 大数据开发有哪些难点?
  8. 【译】3D打印:介绍
  9. 奇迹暖暖安卓鸿蒙互通吗,奇迹暖暖安卓和ios互通吗 奇迹暖暖苹果和安卓能一起玩吗...
  10. 疯狂膜拜!万字长文轻松彻底入门spring