Bandit算法学习[网站优化]02——epsilon-Greedy 算法

参考资料

White J. Bandit algorithms for website optimization[M]. " O’Reilly Media, Inc.", 2013.
https://github.com/johnmyleswhite/BanditsBook

实验环境：jupyter python 3.7

项目地址：https://github.com/yijunquan-afk/bandit-learning

一、算法介绍

epsilon-Greedy算法是在单纯的随机实验和最大化利润之间随机振荡。epsilon-Greedy算法是最容易理解的强盗算法之一，因为它试图通过一种十分简单的机制来公平地对待探索和利用这两个相反的目标: ‘抛硬币’。虽然我们需要解决一些细节来进行精确的陈述，但epsilon-Greedy算法背后的主要思想十分简单: 抛硬币，出现正面，应该explore。如果硬币背面朝上，应该exploit。

以改变网站标志的颜色来增加收入为例。我们假设Deb在绿色和红色这两种颜色之间进行抉择，她想找到一种颜色，使她的网站的新访客转化为注册用户的几率最大化。epsilon-Greedy算法试图通过以下程序找到最佳的颜色标识（图3-1中的图示），该程序按顺序应用于每个新的潜在客户。

当一个新的访问者来到该网站时，该算法抛出一个硬币，出现背面的概率为epsilon。
如果硬币正面朝上，算法就会exploit。为了exploit，该算法在任何用于跟踪事物的数据源中查找绿色和红色标志的历史转化率。在确定了过去成功率最高的颜色后，算法决定向新访问者展示历史上成功率最高的颜色。
如果硬币不是正面朝上，而是反面朝上，算法就会进行explore。由于explore涉及随机试验所考虑的两种颜色，算法需要抛第二枚硬币在它们之间进行选择。与第一枚硬币不同，我们假设第二枚硬币正面朝上的概率是50%，一旦抛下第二枚硬币，算法就可以继续进行最后一步:
如果第二枚硬币正面朝上，就向新访客展示绿色标志

Bandit算法学习[网站优化]02——epsilon-Greedy 算法相关推荐
1. Bandit算法学习[网站优化]04——UCB(Upper Confidence Bound) 算法
  Bandit算法学习[网站优化]04--UCB(Upper Confidence Bound) 算法参考资料 White J. Bandit algorithms for website optim ...
2. 令人拍案叫绝的算法学习网站新手算法入门到精通，算法面试冲刺资料这里都有
  (9月已更)学算法认准这6个网站就够了! 写在前面:作为ACM铜牌选手,从FB到腾讯,从事算法&java岗位工作也是5年有余.在工作中接触到了很多同学,在算法学习和算法面试这件事上我还是很有发 ...
3. 令人拍案叫绝的算法学习网站，算法入门到精通，算法面试冲刺资料这里都有
  前言作为ACM铜牌选手,从FB到腾讯,从事算法&java岗位工作也是5年有余.在工作中接触到了很多同学,在算法学习和算法面试这件事上我还是很有发言权的. 今天就跟想学算法的同学分享一下我私藏 ...
4. 算法学习入门书籍 -- 2022.02.13
  1.我的第一本算法书(2018年11月) 2.啊哈!算法(C语言版) 3.啊哈!算法(大字版)-2021.04 -- C语言 4.哇,编程!--跟小明一起学算法(2020.05) -- C++语言 5 ...
5. 数据结构和算法学习网站
  一.数据结构基础的数据结构我们只从其定义了解的话,比较抽象,难以形成有效的记忆,人类对于图像的记忆远比文字要高效,所以数据结构可视化是我们学习数据结构的利器,下面是几个数据结构可视化的网站,方便大家 ...
6. 【算法】算法学习网站
  我们都知道,在人体的直接感官体验上,动画与图形相对于文字代码往往能带来更有冲击感的视觉效果,也更容易加深大脑对某项事物的认知程度. 而像算法这类,拥有完整逻辑推理计算链条的知识,用动画来展示是再好不过 ...
7. 烽火算法针对的是什么，烽火算法对网站优化有什么好处
  最近几年有些所谓的黑客们,想更多的方便的获取更大的利益,就喜欢搞恶意劫持别人移动端的站点,百度搜索引擎就出了一个专门针对这个劫持的算法叫做烽火算法,陆续的升级更新了2个烽火算法的版本,并在2.0的算法 ...
8. c语言可视化_这些算法可视化网站助你轻松学算法
  前言无疑,数据结构与算法学习最大的难点之一就是如何在脑中形象化其抽象的逻辑步骤.而图像在很多时候能够大大帮助我们理解其对应的抽象化的东西,而如果这个图像还是我们自己一点点画出来的,那么无疑这个印象是 ...
9. c++ 可视化界面_这些算法可视化网站助你轻松学算法
  作者:守望,Linux应用开发者,目前在公众号[编程珠玑] 分享Linux/C/C++/数据结构与算法/工具等原创技术文章和学习资源. 前言无疑,数据结构与算法学习最大的难点之一就是如何在脑中形象化 ...
10. lm opencv 算法_Levenberg–Marquardt算法学习（和matlab的LM算法对比）
  回顾高斯牛顿算法,引入LM算法惩罚因子的计算(迭代步子的计算) 完整的算法流程及代码样例 1. 回顾高斯牛顿,引入LM算法根据之前的博文:Gauss-Newton算法学习假设我们研究如 ...
最新文章
热门文章

Bandit算法学习[网站优化]02——epsilon-Greedy 算法

Bandit算法学习[网站优化]02——epsilon-Greedy 算法

参考资料

一、算法介绍

Bandit算法学习[网站优化]02——epsilon-Greedy 算法相关推荐

最新文章

热门文章