本文受权转载自“把科学带回家”,ID:steamforkidsie

有这样一本神书,它的正文不包含任何字母却畅销60多年,再版了3次,在亚马逊上的评论量超过了亚马逊十大畅销书之一的《饥饿游戏》的第一部,获得了4.2/5的高评分,并引发《纽约时报》、《华尔街日报》等主流媒体报道。

2001年《纽约时报》对《百万随机数表》(A Million Random Digits With 100,000 Normal Deviates)的报道。

此书中的章节还经常出现在各种统计学教材中,它就是附录中经常出现的神秘数表的常见来源。

统计教材中的随机数表。图片来源:WHO Health Systems Library

这本书就是标志着人类核武器时代到来的著作,在个人计算机时代前被统计工作者奉为圣经的《百万随机数表》(A Million Random Digits With 100,000 Normal Deviates)(下文中称为百万)。

没错,这本书的正文就是100万个随机数。为美国空军制造RAND计算机的计算机学家 Gary Briggs 表示,这本书是一个有65年历史的巨著,“我们都崇敬它。”宾夕法尼亚大学沃顿商学院副教授 Ethan Mollick 则指出,在计算机出现前,百万这本书是随机数的最常见来源。

截至今年八月,这本书的评论量已经有699条。与此相比,亚马逊的十大畅销书之一的《饥饿游戏》的平装初版也只有200多条评论。

我们先来看看亚马逊网友对这本书的评价——

“一本引人入胜的大作,具有重要的历史意义,不看到最后你猜不到结局。”

“百万随机数?他们只用了10,然后用不同的组合重复,不要被骗了!”

“我被书名骗了...我以为里面是随机数,但是看了一会儿后我发现还是有规律的…在做了好几个小时的数学模拟后我证明…每页左上角的数字可以形成1-628的递增序列。”

好的,网友们的评价非常中肯贴切,作为一本你完全揣摩不透的书,百万完全担得起这样的美誉。

要了解这本书的划时代性,我们有必要要了解一下随机数有多么难获得。

随机性看起来无处不在,比如马路边的石子儿、女孩的心情、学渣的答案…但实际上,要获得高质量的随机数真的很难。计算机输出的随机数是“伪随机数”,因为给计算机什么指令,它们就会稳定进行同样的操作,输出同样的结果。也就是说,计算机无法输出真随机数。

真随机数的唯一来源是自然界。比如,核裂变。

你可能想问,我们怎么知道随机数是真的还是伪的呢?

很简单,画图就好了。

真随机数会形成随机游走。图片来源:khan academy

如果用一串随机数做一个贪吃蛇的图,让贪吃蛇每走一步就根据这个数列里的数字转向,那么真随机数形成的贪吃蛇看起来毫无规律,不管把这个图放大还是缩小,在任何尺度上贪吃蛇都在乱走。而真随机的贪吃蛇走出来的这张图就叫做随机游走(random walk)。

但是,计算机生成的伪随机数最终会展现出规律性,贪吃蛇的步伐最后会以特定周期不断重复。

伪随机数(蓝色)最终会展现出规律。图片来源:khan academy

真随机数和伪随机数的对峙在20世纪40年代被推向了高潮,因为在研究核物理时,人们才意识到真随机数有多重要。

比如在设计核反应堆时,最关键的一步就是预测中子的分布。了解中子是谁,中子从哪儿来,中子要到哪儿去的终极三问就成了设计核反应堆时的核心,而这个研究方向也叫做中子输运(Neutron transport )。

在反应堆中,中子(蓝)引发铀235(黄)裂变。图片来源:wikipedia

核物理研究者们一般认为,中子就像气体一样在反应核里扩散,并用中子输运方程模拟这个过程。但是,暴力强解中子输运方程太复杂,当时的物理学家们很头疼。

后来,这个问题被洛斯阿拉莫斯国家实验室的数学家斯塔尼斯拉夫·乌拉姆(Stanislaw Ulam)破解了。乌拉姆的思路是,方程太复杂了老子不解了好伐,我直接模拟中子怎么动不就好了。这种“你动动我试试”的方法就是著名的统计学技术——蒙特卡罗方法。

蒙特卡洛方法其实不难理解。比如要看方形和圆形的面积比,我们可以在两个盒子上方随机倒珠子,倒了巨量珠子后,看一下两个盒子里的珠子数量比,这个比值就是它们的面积之比。图片来源:marble science

蒙特卡洛方法不需要求解中子输运方程,而是通过模拟大量中子的运动轨迹来对反应堆中中子的扩散过程进行预测。在洛斯阿拉莫斯国家实验室发明和推广了蒙特卡洛方法后,其他学科也纷纷觉得它好用。现在蒙特卡洛方法被广泛用于研究各种复杂系统的行为,比如金融市场、湍流啥的。

显然,蒙特卡洛方法依赖大量随机数,这样才能保证模拟结果无限接近真实。洛斯阿拉莫斯国家实验室发明的这个统计学工具让高质量的随机数变成了炙手可热的学术“商品”,百万这本书也是依托这种需求诞生的。

为了满足暴涨的需求,1947年,为美国军方服务的兰德公司(RAND Corporation)就开始制造这种“商品”。1955年,百万的第一版开始发行。

那么,这些高质量的随机数是怎么产生的呢?

首先,一个来自自然界的随机脉冲源发出随机脉冲。这个脉冲源和一个电子轮盘相连,轮盘把随机信号转化为0-9的十进制数。

图片来源:wikimedia

接着,这些十进制的数字又被转化为2万张能被计算机读取的卡片。这些卡片被插入一台IBM计算机里,这台计算机就产生了一百万个随机数。

当然了,随机数的质量取决于随机脉冲的质量。兰德公司并没有公布它的来源,一些人猜测随机脉冲来自对着铀矿的盖革计数器。

天然铀矿。图片来源:wikimedia

铀会衰变,在这个过程中释放出粒子,不过两次衰变之间的间隔是随机的,因此记录到粒子的盖革计数器的信号也是随机的。

出版后,这本书也成了兰德公司最畅销的书籍。兰德公司表示,这本书是“史上已出版的最大随机数表。”

高质量的随机数很难获得,因此这本书对于教师、学生、研究者等等一系列需要和统计数字打交道的职业来说就是必不可少的。而根据兰德公司的介绍,百万这本书已经成了工程学和计量经济学教材中的标准参考书。

大部分科学研究都需要随机取样。图片来源:wikimedia

比如在2000年出版的经典社会统计教材 Social Research Methods: Qualitative and Quantitative Approaches 写道,要随机取样的话,可以用百万这本书。

昆士兰大学的数学系教授 Anthony J. Richardson、康奈尔大学工程学荣誉教授 Arnim H. Meyburg 和同事 Elizabeth S. Ampt 甚至指出,百万这本书是最知名的随机数表,大多数统计学教材都会摘录百万这本书中的部分随机数。

这本书也被广泛用于游戏设计和模拟中。在设计游戏时,研发者要让玩家时不时遇到不可测的情况,从而增加游戏的成瘾性,这时也需要大量随机数。

实际上在麻省理工学院数字媒体教授 Nick Montfort 和佐治亚理工学院助理教授 Ian Bogost 撰写的电子游戏史《与电子束赛跑——雅达利视频计算机系统》(Racing the Beam: The Atari Video Computer System)一书中就提到,游戏设计师经常使用百万这本书中的随机数。

兰德公司还表示,直到现在,百万这本书依旧是随机数的最大已知来源,统计学家、物理学家、市场分析师、民意测验者、品控工程师还在利用这本书里的随机数。

比如,在对桥梁的焊接部位进行定期检查时就需要随机数,因为工程师不可能调查每一个焊接处,因此就要随机地挑选几个样本进行调查。

甚至出现了一种传言,那就是美国海军潜艇还曾用这本书里的数字来进行无规律的航行,从而避免被敌军发现。但搞笑的是,纽约公立图书馆一开始把这本书归到“心理学”里。

除了百万这本书,2013年9月5日,美国国家标准技术研究所(NIST)开始每60秒发布一次高质量的随机数。

虽然这些随机数表又大又方又好,是重要的工具,但是对于计算机安全来说,它们是“禁书”。这是因为,这些公开的随机数已经不是秘密,也就是说它们已经失去了不可预测性,坏人可以用这些已知的随机数破解密码,因此它们不能用于加密,美国国家标准技术研究所也强调了这一点。

美国国家标准技术研究所(NIST)的红字警告:不要将本所的随机数用于加密!!!图片来源:beacon.nist.gov/home

随机数出名后反而不“随机”了,因为它不再能让人感到意外了,这真是让人意外呢。

数学老师的作业:这本著作非常经典,建议大家全文背诵。

封面来源:wired
参考资料:https://docs.qq.com/doc/DVEhpVXpOY1VXSktX

原创文章版权归微信公众号“把科学带回家”所有

转载请联系 bd@wanwuweb.com

往期精品(点击图片直达文字对应教程)

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

数学教材里的神秘数表在国外红出圈,网友:引人入胜、猜不到结局相关推荐

  1. 1《小学数学教材解读策略研究》课题研究方案

    <小学数学教材解读策略研究> 课题研究方案 延安市新区第一小学 一.国内外研究现状述评 张奠宙院士说:教什么永远比怎么教更重要.教育家叶圣陶先生也曾说过:"教材只能作为教课的依据 ...

  2. 数学建模美赛特等奖提名、国赛国一队伍经验分享

    数学建模美赛特等奖提名.国赛国一队伍经验分享 奖状证书 赛前准备 团队分工 实用软件与链接准备 学习方法 资源推荐(详细学习线路与资源将整理至本专栏其他文章) 算法储备 赛中策略 模拟复盘 评委解读 ...

  3. 小学数学教材整体把握的策略研究

    小学数学教材整体把握的策略研究 (2012-11-01 13:13:03) 正在上传-重新上传取消​转载▼ 标签: 杂谈 分类: 文献研究 小学数学教材整体把握的策略研究 作者:内详 摘  要:数学知 ...

  4. 理论学习材料:如何解读小学数学教材

    如何解读小学数学教材 小学数学人教版篇一:如何用新课标解读小学数学教材 教材是教学内容的重要载体,也是教师沟通学生和学生学习的载体.读懂教材是教师的专业基本功和基本素养,是教师组织课堂教学的基础.众所 ...

  5. 聋校计算机教材教法培训Ppt,小学数学教材教法培训.ppt

    小学数学教材教法培训 教材无论如何更新,总是跟不上时代的发展,而教师教育智慧的发挥,知识的不断更新,对教材的不断拓展与补充.创新,才能使教材显示出它的生机与活力. 怎样钻研教材呢? (一)仔细揣摩教材 ...

  6. 怎样解读小学数学教材

    怎样解读小学数学教材 摘要:教学管理质量的根基在常态的课堂,课堂效益的基础在对教材的解读,基于此,文章深入分析了解读小学数学教材的方法,即:通读教材,理清脉络;细读教材,挖掘深度;比读教材,发现不足; ...

  7. 6《小学数学教材解读策略研究》教师问卷

    <小学数学教材解读策略研究> 教师问卷 请各位数学教师认真填写,将你的选项填在括号里,可多选.谢谢! 1. 您任教的学校是(     ) A.城市学校        B.镇区学校      ...

  8. 2021-07-08理论学习材料:小学数学教材解读

    <小学数学教材解读> 紫阳第二小学   饶炽奎 紫阳小学   方元高 各位老师:下午好! 今天下午分享的专题是<小学数学教材解读>.为什么要分享这个专题呢?那是因为,教材决定着 ...

  9. 【学习笔记】正确写作美国大学生数学建模竞赛论文(已获得国二、美O)

    [学习笔记]正确写作美国大学生数学建模竞赛论文(已获得国二.美O) 第2章 正确使用英文 第3章 写作规范 第4章 数学表达式 第5章 MCM/ICM竞赛论文写作 最近在学习总结如何写作美赛论文,就把 ...

最新文章

  1. ​《头号玩家》中的“绿洲”,用 VR 可以找到
  2. Java基础之多线程详细分析
  3. 在配置类上写@CompentScan注解来进行包扫描
  4. java进阶案例下载_java进阶案例
  5. Npoi Web 项目中(XSSFWorkbook) 导出出现无法访问已关闭的流
  6. java ajax 导入excel_Ajax asp.net 导入Excel
  7. WdatePicker日期控件使用与值获取,以及选择日期完毕触发事件
  8. 力扣637. 二叉树的层平均值(JavaScript)
  9. H3C交换机配置ACL禁止vlan间互访
  10. 购物车程序二(模拟了用户登录,限次数三次)
  11. 用户输出表单处理php
  12. 线程通信之handle用法
  13. 小写数字转大写_微软太坏了,这个函数居然被隐藏了,用它搞定数值转中文大小写...
  14. 雅思准考证可以下载到电脑上吗
  15. 企鹅医生与杏仁医生签订战略合并协议,全面发力大健康领域
  16. Kettle连接Mysql报错:Driver class org.gjt.mm.mysql.Driver could not be found
  17. 四平师院计算机学院,永远的四平师院
  18. linux之U盘安装
  19. java9 揭秘 jlink_使用jlink打包的java应用
  20. 6-7 日期-求当年天数

热门文章

  1. 作者:包阳(1978-),男,北京系统工程研究所副研究员。
  2. 作者:徐优俊(1990-),男,北京大学前沿交叉学科研究院博士生。
  3. 【计算机组成原理】指令执行过程
  4. 【Java】递归删除文件目录
  5. 长方体工艺品の切割(洛谷P5729题题解,Java语言描述)
  6. Nginx 配置 SSL 及 HTTPS 协议通信过程
  7. leetcode 123. 买卖股票的最佳时机 III
  8. Android 中文API (46) —— SimpleAdapter
  9. CentOS7 安装MongoDB 3.0服务
  10. 老王的心路历程(二):下一站Web体验监控产品