这个数字的存在其实是很「自然」的一件事情……

1 / 多少妃子得不到皇帝的宠幸?

首先,不扯任何公式,更不扯极限的概念,让我们穿越回古代,看一个在当时应该是很「自然」的事情:皇帝宠幸妃子

问题很简单:

假设皇帝在宫中一共有1000位妃子,每天 完全随机地抽选一位妃子来宠幸,之后妃子安然无恙地回去,如此以往重复大概3年(1000天),那么,最终有多少位妃子能够得到宠幸、又有多少得不到宠幸呢?

答案是:如果每一天确实都完全随机地选妃子,那么1000位妃子里面,最终将会有大约632位被选中过,而剩下的368位妃子则一次都没有被宠幸过。

2 / 为什么是0.368?

上面这个简单的例子看似和 e 没有任何关联,但是请把这个比例倒一下:

好像和 e 很接近啊?是巧合吗?

别急,如果这位皇帝有一万名妃子,以相同方式重复一万天(大概27年),那么理论上会有3679位妃子最终得不到宠幸;如果再多一点,十万,那么就是36788……

换句话说,上面这个「皇帝宠幸妃子」的问题,理论上会有 比例的妃子最终得不到皇帝的宠幸。

3 / 原理:统计学中的有放回抽样 & 自助重抽样

一开始我对上面这件事将信将疑:真的会有这么多的妃子没被抽中吗?直到我打开RStudio,在R语言里面写了几行简单的代码来模拟上面这个过程,才发现确实如此:

set.seed(1)
sample = sample(1:10^6, replace=TRUE)  # replace = 有放回取样
p = 1 - sum(unique(sample) %in% 1:10^6)/10^6
1/p

结果发现,p(未被宠幸的妃子比例)是0.367975,而1/p是2.718。

这就是统计学中的「重抽样」技术(Bootstrap Sampling):从数量为N的样本中「有放回地」随机抽取出一个「数量同样为N」的样本,那么理论上来说,原来的N个个体中大约会有36.8%的个体不会被抽中。

如果一定要写出一个公式:

4 / 实际应用

Bootstrap技术本身已经在自然科学、社会科学的很多领域得到了广泛应用。而上述这个特殊的问题,其实也已经应用于机器学习:在“随机森林(random forest)”算法中,每一棵决策树在建立的时候,所需要的数据并非原始数据(N),而是通过bootstrap方法有放回地抽取的具有相同样本量N的样本,其中不重复的个案大约是63.2% * N,而剩下的36.8% * N的样本则被称为“出包/袋外数据(out-of-bag data, OOB)”。这样一来,很自然地,重抽样得到的样本可以作为“训练集”来训练机器学习模型,而36.8%的OOB数据(相当于那些“未被宠幸的妃子”)可以作为“测试集”来验证模型的预测性能。

实际上,我们还可以用一种“更自然”的方式来描述这个问题,而不涉及任何具体数字,这样就回应了评论区关于此问题情境是否足够“自然”的疑问(e.g.,

皇帝在宫中有成百上千的妃子,派人每天【完全随机地】抽选一位妃子来宠幸(或者条件允许的话,每个时辰一位也可以喔 [坏笑.emoji] ),之后妃子安然无恙地回去。若干年后,皇帝“目测”那么多的妃子应该都【宠幸完一遍】了吧?但愚昧的皇帝并不知道,其实还是有很多妃子没有得到宠幸呢。问这个比例是多少?

依然是那个公式:

【思考题】受到评论区

的启发,我们还可以思考一个不太一样的情形:如果仍然是1000位妃子,但是每次随机抽2人、共抽500次呢?

我们使用R语言进行模拟:

set.seed(1)
sample = c()
for(day in 1:500) sample = c(sample, sample(1:1000, 2))
p = 1 - sum(unique(sample) %in% 1:1000)/1000
p

答案仍然非常接近36.8%。

类似地,每次随机抽4人、共抽250次(需满足“抽样总和等于总人数”、“每次抽的数量远小于总人数”),也会得到十分相近的答案。

链接:https://www.zhihu.com/question/20296247/answer/708727036

数学里的 e 为什么叫做自然底数?相关推荐

  1. e之美,数学里的 e 为什么叫做自然底数?是不是自然界里什么东西恰好是 e?

    回归问题的条件/前提: 1) 收集的数据 2) 假设的模型,即一个函数,这个函数里含有未知的参数,通过学习,可以估计出参数.然后利用这个模型去预测/分类新的数据. 1. 线性回归 假设 特征 和 结果 ...

  2. 【转】我们应该如何去理解数学中的自然底数e

    本文由超级数学建模编辑整理 部分资料来源于网络 转载请注明来源 -–这里是数学思维的聚集地-- 超级数学建模"(微信号supermodeling),每天学一点小知识,轻松了解各种思维,做个好 ...

  3. 数学里的π究竟牛在哪里

    学过数学的同学想必都跟小编一样,都知道π,不知道的不配做小编的盆友哒. 那么什么是π呢 圆周率(Pi)是圆的周长与直径的比值,一般用希腊字母π表示,是一个在数学及物理学中普遍存在的数学常数.π也等于圆 ...

  4. python中e怎么计算_Python之循环结构——实战计算自然底数e,圆周率Π

    循环结构是编程中经常使用的语法,循环结构的巧妙使用对编程来说很重要.刚才群里还有同学说自己不会用循环,其实很简单,只是没有用过才觉得难.这里介绍Python循环语法的用法,并且使用两个小例子,来加强训 ...

  5. 自然底数e的意义是什么?

    自然底数e的意义是什么? https://mp.weixin.qq.com/s?__biz=MzA5ODUxOTA5Mg==&mid=2652553811&idx=1&sn=0 ...

  6. 序列周期性与魔术(一)——数学里的函数周期性

    在我们前面的文章中,介绍过函数的对称性,可逆性,常函数等内容.可以说,以函数关系为核心,可以建模很多现实生活中的事和魔术过程.接下来,我们进入另一个经典性质--周期性,内容较多,故单独成篇. 周期性是 ...

  7. 10行代码,带你理解自然底数e、自然指数ln

    引言 我们知道,e是一种常数,和π\piπ类似,都是一种被计算出来的常数,在实际中具有非常广泛的应用. 基于自然底数e,我们常常会用到自然指数exe^xex,自然对数ln(x)ln(x)ln(x),但 ...

  8. 自然底数e究竟“自然”在哪?

    在上一篇文章<欧拉公式及其推导>中我们介绍了欧拉公式的来源.意义及其公式推导,在其中涉及到了自然底数的相关知识.在数学中,我们将自然底数记作e,其值为无穷项数的叠加和,是一个无理数,的数学 ...

  9. 请编写函数实现自然底数 e=2.718281828

    1. 题目 请编写函数实现自然底数 e=2.718281828 e 的计算公式如下: e=1+1/1!+1/2!+1/3!+- 要求当最后一项的值小于  时结束,也就是10的-10 2 .温馨提示 C ...

最新文章

  1. ROS kinetic安装、Kinect2驱动安装和配置
  2. [转]Linux 进程间通信:共享内存
  3. 关于C++14:你需要知道的新特性
  4. Android 开发笔记——通过 Intent 传递类对象
  5. bzoj2286 [Sdoi2011]消耗战 单调栈+lca
  6. abstract 抽象类
  7. netty权威指南-第三章——netty入门应用
  8. matlab 拉普拉斯金字塔,图像拉普拉斯金字塔(laplacian pyramid)并从金字塔重建原图 matlab程序实现...
  9. “腾讯再有本事,也要出海讨生活”
  10. 穷举查找之旅行商问题、背包问题、分配问题
  11. 开源数据库连接池的使用
  12. php写的公告栏代码,可爱的公告栏代码
  13. pptpd mysql_pptpd+freeradius+mysql安装步骤
  14. DS18B20 单总线多器件的ROM 搜索, ALARM 检测, CRC 校验 源码实现, 基于 STM32F103
  15. WZOI-261疯狂吃鸡腿2
  16. 字节辟谣被裁员工与 HR 互殴;苹果头显多个新功能曝光;谷歌希望 RISC-V 成为 T1 级 Android 架构|极客头条
  17. MATLAB的交互式界面 简易设计
  18. 《AV1 Bitstream Decoding Process Specification》,译名:AV1比特流及解码规范-Chapter 05-语法结构-Section 01~08
  19. Html监听Fbx文件加载,Three.js 导入fbx
  20. php金花游戏,PHP实现炸金花游戏比赛

热门文章

  1. 让div水平居中的css方法
  2. linux照明控制软件,基于ARM-Linux的城市景观照明控制平台设计
  3. 基于Linux的网络编程——网络聊天程序
  4. JMP功能与算法总结
  5. JVM的内存分配与回收策略实战——对象优先在Eden分配
  6. 分享一个免费并开源的SSH连接工具
  7. win10 tomcat闪退问题分析及解决
  8. 物资借用/归还登记表模板
  9. SecureCRT如何使用脚本
  10. JAVA导出文档注释