UCB(Upper Confidence Bound)算法

在推荐系统中,通常量化一个物品的收益率(或者说点击率)是使用点击数/展示数,例如点击为10,展示数为8,则估计的点击率为80%,在展示数达到10000后,其表现ctr是否还能达到80%呢? 显然是不可能的。而这就是统计学中的置信度问题,计算点击率的置信区间的方法也有很多,比如威尔逊置信空间

UCB算法步骤包括:首先对所有item的尝试一下,然后每次选择score值最大的那个:

Input: N arms, number of rounds T >= N

  • step.1. For t = 1 … N, play arm t
  • step.2. For t = N+1 … T, play arm

其中step.2. 中,play arm 时选取的item应该是经过排序的,排序score的计算方式为:
s c o r e ( j ) = C j , t T j , t + 2 ln ⁡ t T j , t score(j) = \frac { C _ { j, t } } { T _ { j , t } } + \sqrt { \frac { 2 \ln t } { T _ { j , t } } } score(j)=Tj,t​Cj,t​​+Tj,t​2lnt​ ​

其中,式子“+”的左半部分为物品到目前的收益均值,右半部分本质上是均值的标准差。

  • t: 总实验次数
  • T(j,t) : j 帖子被推荐次数
  • C(j,t) :j 帖子被点击次数

这个公式表明随着每个物品试验次数的增加,其置信区间就越窄,收益概率就越能确定。如果收益均值越大,则被选中的机会就越大(exploit),如果收益均值越小,其被选中的概率也就越少,同时哪些被选次数较少的item也会得到试验机会,起到了explore的作用。

UCB(Upper Confidence Bound)算法相关推荐

  1. Bandit算法学习[网站优化]04——UCB(Upper Confidence Bound) 算法

    Bandit算法学习[网站优化]04--UCB(Upper Confidence Bound) 算法 参考资料 White J. Bandit algorithms for website optim ...

  2. 强化学习笔记:多臂老虎机问题(6)--Upper Confidence Bound

    目录 0. 前言 1. 算法原理 2. Python仿真 2.1 k_armed_bandit_one_run()改造 2.2  仿真对比Epsilon-greedy方法和UCB方法 3. 习题 0. ...

  3. 【强化学习】多臂老虎机——E_greedy、UCB、Gradient Bandit 算法 代码实现

    多臂老虎机 import numpy as np import matplotlib.pyplot as pltclass E_greedy:def __init__(self,arm_num=10, ...

  4. 聊一聊推荐系统中ExploitExplore算法

    Exploit:利用 Explore:探索     推荐系统中,如果片面优化用户的喜好,推荐系统可能会造成信息茧房问题.也就是推荐的东西都是用户喜欢的东西,千篇一律.这时候不仅仅需要Exploit,还 ...

  5. 腾讯QQ大数据:神盾推荐——MAB算法应用总结

    导语:在推荐领域,用户或物品的冷启动,以及如何使推荐结果更加多样的问题在很多实际应用场景中都会遇到.本文主要讲述了神盾推荐在腾讯内部业务场景中,使用MAB方法来解决这两个问题的经验总结,同时本文也较为 ...

  6. 【推荐算法】探索与利用

    "探索与利用"机制是在"探索新数据"和"利用旧数据"之间进行平衡,使系统既能够利用旧数据进行推荐,达到推荐系统的商业目标,又能高效地探索冷启 ...

  7. 走马观花AutoML

    1 前言 在上一篇文章中,我们提到了几个算法深入方向,包括AutoML,模型解释.正好这两个话题之前也在公司有做过一些内部分享,接下来会逐渐整理成文,与大家探讨交流.这篇文章会主要以<Autom ...

  8. Exploitation and Exploration

    推荐系统的经典问题之一,利用(Exploitation) 与 探索(Exploration)问题 Exploitation:满足已知的用户需求 Exploration:探索未知的用户需求 Exploi ...

  9. 【论文精度】AutoBERT-Zero (使用NAS搜索预训练语言模型)

    AutoBERT-Zero 论文地址: https://arxiv.org/pdf/2107.07445.pdf Abstract ​ 基于 Transformer 的预训练模型,如 BERT 在很多 ...

最新文章

  1. 学习HTML-Beautify.js
  2. oracle 强制恢复,oracle数据库恢复
  3. Vsftpd 虚拟用户配置参考---终极版
  4. yuicompressor java_使用YUICompressor自动压缩JavaWeb项目中的JS与CSS文件
  5. 百度近期开始大规模清理不良P2P网贷平台
  6. android圆形头像边框,利用Android中BitmapShader制作自带边框的圆形头像
  7. 关于PScs6无法拖入图片的解决
  8. 怎样查出SQLServer的性能瓶颈
  9. 拉卡拉做社区电商,有这些优劣势
  10. Android-代码设置TextView字体加粗或者不加粗
  11. 计算机考试记不住题目,驾考科目一口诀,科一题目太多记不住?快来看看这些技巧...
  12. Springboot整合Netty,实现Socket通信
  13. 服务器gosht引导盘,带RAID服务器能GHOST备份吗?
  14. 简单的Android端新闻App的实现。
  15. 云计算基础——云计算认知
  16. 彻底理解数据库ER模型(CDM)中的强实体与弱实体:追根到底
  17. 考勤月度统计mysql_mysql中跨月统计考勤天数-问答-阿里云开发者社区-阿里云
  18. Win10任务栏透明工具TranslucentTB(TranslucentTB基础配置)
  19. 一文讲透:质量管理的历史
  20. python做es的聚合统计和分页读取

热门文章

  1. 关于python报错 ‘utf-8‘ codec can‘t encode characters in position xxxx-xxxx surrogates not allowed
  2. 推荐一款基于 Vue 的电商级海报生成器
  3. 2.学习Vue入门知识点
  4. 下载安装Anaconda3教程
  5. 计算机科学世界第13,计算机专业世界排名:麻省理工第1名,清华第13名,北大第19名!...
  6. linux php5.6 安装
  7. VR全景展示,VR全景平台,助理全景展示新模式
  8. CondaValueError: no package names supplied, try conda remove -h for more details
  9. 磁盘无法挂载超过2T大小磁盘解决方法
  10. 小翼推荐-【最新qq空间软件,软件下载】