最优停止理论OptimalStoppingTheory经典秘书问题ClassicSecretaryProblem
在博弈论中,类似问题,有相亲问题、见好就收、苏丹嫁妆问题、挑剔的求婚者问题等 。首先通俗解下类似问题:相亲问题,售房问题。
相亲问题描述如下:
假如一个非常优秀的人相亲,已知追求的他的人有有限个,例如10位,并且根据个人的评价,给这10个人给予了综合打分。现在规定,交往中他不能脚踏两只船,即不能同时和两个人交往,如果在交往之后他没有接受这个人,那么,以后也没有机会再选择这个人作为对象。然后接着和下一个人交往。
这个问题可以看出,无论什么时候选择都会面临很多不确定性,比如无法预知是否错过了最优秀的人选,或者在选择后,后面会不会有更好的人选。那么,他随机和这些人交往,在和第几个人交往时,他能选择到最优秀的人作为对象呢,即何时停止交往可以使他选择到最优秀的人最为对象呢?
下面是停止规则的一般归纳,它是通过两个对象来定义的:
(1)一系列随机变量X1,X2,…,它们的联合分布规律是已知的,
(2)一系列奖励函数Y0,Y(X1),Y(X1,X2),…
在考虑这两个对象时,你可以一直观察随机变量X1,X2… 在观察变量Xn时,你可能会选择停止,这个时候你获得的奖励是函数Yn(X1,X2,X3…,Xn),当然这个函数值也可能是负数,比如女青年相求问题,加入相亲了N个人(N很大),那么她会经历从“剩斗士”到“必剩客”再到“齐天大剩”的过程,想想,还是很吃亏的(不仅木有回报,并且逝去了最美丽的年华)~~你也可能是持续观察下一次的过程,记为N 趋于无穷大,那么这时候也有一个对应的回报函数值。现在要解决的问题是,在何时停止观察随机变量x,可以是我们的回报函数值最大。
这里给出了理想的情况下,如何求解经典秘书问题:
问题描述:要聘请一名秘书,有n人来面试,n是已知的,而且面试者的能力有排名,随机进行面试,每个人的机会是均等的。每次面试一人,面试官便要即时决定聘不聘他,如果当时决定不聘他,他便不会回来。面试时总能清楚了解求职者的适合程度,并能和之前的每个人作比较。问凭什么策略,才使选得到最适合担任秘书的人的机率最大?
采取的策略:对前r-1个人都拒绝,然后对剩下的n-r+1个人进行面试,如果任何一个面试者比之前面试的人都优秀,那么就聘请这个人。前r-1个人被聘请的概率为0,假设从第r个人开始面试,面试到的第k个人是最优秀的并且被选中的应聘者。那么
最优秀应聘者被选择的概率为:
其中,第k个为最优秀的并且被选中的人,根据概率论的知识,可以化简为,第k个人在最优秀的前提下被选择。因为最优秀的人只有一个,所以它的概率为1/n,同时也就意味着,在前k-1中,最优秀到人在r-1个人中。
既然是最优秀的,那么,最优秀应聘者被选择的概率大于他前后应聘者被选中的概率,所以有,
得到r一般表达式,现在要找到最优解,等价于找到满足下列条件最小的r值:
The university of Alabama in Huntsville对上述表达式部分n值求解结果如下:
观察可知结果在逐渐变小,Alabama大学对表达式中不同n值与P的关系作图,详见链接: http://www.math.uah.edu/stat/urn/Secretary.html 这里通过表达式一样可以近似得出与Alabama大学描述相同的结果,解答过程如下:
当n趋于无穷大,调和数列求和可以近似化简,
所以,经典秘书问题得出面试中应聘到最优面试者的概率是0.368,通俗所,100个人来面试,第36个人或者第37个人是最优应聘者的概率是最大的。
最优停止理论OptimalStoppingTheory经典秘书问题ClassicSecretaryProblem相关推荐
- 最优停止理论 Optimal Stopping Theory 经典秘书问题 Classic Secretary Problem
在博弈论中,类似问题,有相亲问题.见好就收.苏丹嫁妆问题.挑剔的求婚者问题等 .首先通俗解下类似问题:相亲问题,售房问题. 相亲问题描述如下: 假如一个非常优秀的人相亲,已知追求的他的人有有限个,例如 ...
- 关于37%结论的探索(最优停止理论,如何最优选择停止观望时机)
未得出相符结论,也许是我的算法有问题.... from random import choice from random import sampleimport random import pygal ...
- 最优停止理论-有限层确定问题和dp算法
转载自一篇知乎文章
- optimal stopping 最优停止理论计算最适结婚年龄
前言:许久不更新博客,在找工作.准备毕设之后,再放缓脚步,欣赏风景,思考人生. 所谓最优停止理论,应用在如何找到事情的平衡点,以做出最好的决策.最优停止理论适用于信息不对等的情况下,即无法获取全部样本 ...
- 中国人工智能学会通讯——最优传输理论在机器学习中的应用 1.1 最优传输理论与 WGAN 模型...
最优传输理论是连接几何和概率的桥梁, 它用几何的方法为概率分布的建模和衡量概 率分布之间的距离提供了强有力的工具.最 近,最优传输理论的概念和方法日益渗透进 机器学习领域,为机器学习原理的解释提供 了 ...
- 海天讲座(二)最优传输理论
由于原链接公式看不到,所以转了下,如有侵权,联系删除 2016 这篇文章里说了应用最优传输理论解保面积参数化问题,之前有看过将保面积参数化转化为线性问题的文献,效果也不错. 图1. 最优传输理论在计算 ...
- 海天讲座(三)最优传输理论
由于原链接公式看不到,所以转了下,如有侵权,联系删除 2016 农历小年附近,老顾从北京回到纽约.与北京火爆热烈的节日气氛相比,纽约的氛围孤独寂寥,冷漠凄清.与几位访问学者和学生漫步在长岛石溪海滩,气 ...
- ACL 2021 最佳论文:最优运输理论开启词表学习新纪元
在 8 月 20 日的智源社区青源 LIVE 活动中,来自字节跳动 AI Lab 的许晶晶博士对其团队在 ACL 2021 上摘得最佳论文奖的论文<Vocabulary Learning via ...
- 最优传输理论和生成模型的几何观点
©PaperWeekly 原创 · 作者|尹娟 学校|北京理工大学博士生 研究方向|随机过程.复杂网络 论文标题:A Geometric View of Optimal Transportation ...
最新文章
- [导入]ExtJs 2.0 弹窗事例
- Gson:如何从没有注释的序列化中排除特定字段
- 算法题——Cantor表
- 如何利用pycharm实现本地代码和远程的实时同步
- android 横向stepview,Android 流程指示器 StepView
- Linux 命令之 wget -- 下载文件工具
- React、Angular、Vue 框架比较
- lol游戏挂机软件_六小时封停警告!lol手游海外服挂机惩罚力度太大引玩家吐槽...
- Flash与数学: 旋轮线(2)
- MySQL循环结构例题_Mysql:循环结构
- EMNLP'21中预训练模型最新研究进展
- 下载的jar包找不到源码时从这里下载
- Fedora35安装ibus-rime并配置五笔86方案
- js layui 模板属性 添加_layui模板引擎如何使用 - layim
- 错误代码:0x800F081F-0x20003。在INSTALL_UPDATES操作过程中的SAFE_OS阶段,安装失败,出现错误
- 升级mysql后zpanel无法进入_升级到mysql5.7无法启动问题解决
- 一个关于vmware虚拟机没有声音的玄学解决方案
- 计算机毕业设计php_thinkphp_vue的校园论坛网站
- 第一行代码-ListViewDemo(2)-读书笔记
- 相机标定推到与zc求解