回归(Regression)的前世今生——从高尔顿(Galton)到尤勒(Yule)

简单讲讲关于回归的起源问题,其实下面有几个答案已经说到了高尔顿的故事,我在这里略作补充,做些有趣的拓展。

回归这个词最早是被高尔顿提出的,高尔顿这个人是谁呢,他是达尔文的表兄。他非常痴迷他兄长的进化论说,所以一直希望把进化论的理论应用到实证中,来证明不同人为什么会具有不同的特性。

他在当时研究了人的各种特征,并且从指纹到颜值进行了各种打分。收到达尔文进化论的影响,作为学者的他在当时也是人种优生论的支持者之一(类似于现在支持基因改造人)。然而瑕不掩瑜,他将统计学基础引入到了社科人文类当中,提出了定量研究的理念,从很大程度上来说可以是引领了整个人文社科大类的发展。

高尔顿最著名的发现之一是他发现了父亲的身高和儿子的身高之间存在着某种给定的关系,他通过进一步的研究发现了:事实上子辈的平均身高是其父辈平均身高以及他们所处族群平均身高的加权平均和。

正如下面有些答案中所提到的那样,他把这种趋势平均化的现象写到了自己1886年的论文中。论文的全名叫:Regression towards Mediocrity in Hereditary Stature. 这篇论文当年被发在了大不列颠以及爱尔兰人类研究学院期刊上。我们现今把论文中的这种“回归”现象称为:均值回归或者平庸回归(reversion to the mean/reversion to mediocrity)。背后的意义是说:哪怕单看一组父亲和孩子的身高,两个人的身高可能差异很大,但是从整个人群上来看,父亲和孩子的身高分布应该是很相近的。

然而高尔顿对于回归的阐述和使用毕竟年代太过久远了,在当时还没有引入“控制变量”的概念,所以从结果上来说,回归模型更像是显示了两个变量的统计关联度,而非因果关系。

在这样的背景下尤勒横空出世了,尤勒可以说是一个很了不起的人了,他的师傅就很厉害,是皮尔逊(Pearson)。皮尔逊可以说是从数学上对生物学进行统计研究的第一人,著名的卡方检验就是他发现的,皮尔逊本人和高尔顿关系也非常好,高尔顿就是他师傅(所以事实上高尔顿也是尤勒的师叔祖),他和高尔顿一起创办了《生物统计学》(Biometrika)杂志。

正所谓名师出高徒,尤勒本身也很崇拜高尔顿,可以称得上是高尔顿坚定的护道者,他在高尔顿的基础上提出了回归模型中应当加入尽可能多的控制变量的理念。在他1899年发表在英国皇家统计协会期刊上的论文“An Investigation into the Causes of Changes in Pauperism in England, Chiefly during the Last Two Intercensal Decades"中,他研究了英国济贫法在不同的地区对于当地贫困率起到的影响。在论文中,尤勒把地区的人口以及年龄的分布加入到了控制变量当中去,研究的结果在当时起到了非常深远的影响。济贫法可以说是世界上第一部有关社会救济的法律,当时英国“圈地运动”之后,偷盗者、乞讨者增多,社会不安定因素急剧增加,为了稳定社会情绪,维持统治,英国王室在1601年颁布了《济贫法》。这部法律规定:凡年老者可在家中接受救济;贫困儿童可在他人家中寄养,成年后可去做学徒;流浪者被关进监狱或送去教养院。

尤勒在论文中着重研究了户外救济(outdoor relief)政策(给穷人补助,不强求他们去工作)是不是反而会因为让穷人觉得更安逸了,从而反向增加社会的贫困率。这样的研究可以说是当今社会科学学者们关注的政策效应因果识别的“老祖宗”了。

出中的意思是什么_回归分析中的“回归”是什么意思?相关推荐

  1. spss回归分析_回归分析中的简单斜率检验:用SPSS或jamovi实现

    哈哈,不简单的"简单效应",How old are you? 之前的两篇文章,我们已经深入探讨了如何用SPSS做方差分析中的简单效应检验,并且最终得到结论:要用GLM语句,不需要再 ...

  2. 回归模型中截距项的意义_中级经济师考试 回归模型

    回归,回归到哪里?它与相关的差别在哪里?大家先回想一下这个问题! 回归,回归的是事物的本质 . 回归分析就是根据相关关系的具体形态,选择一个合适的 数学模型 ,来 近似的表达变量间的依赖关系 . 回归 ...

  3. python中哪里用到缩进_建筑防火中各类门的总结归纳!乙级门?甲级门?都哪里用到了!...

    大家在学习防火部分时,会遇到各种场所设置不同耐火性能的防火门,很杂乱的感觉,今天这里就好好总结一下,希望对大家能有帮助!一:双设门1.防烟楼梯间:此处的防烟楼梯间分为两种:一种是普通意义上的,即咱们经 ...

  4. 图像中值滤波python代码_图像中值滤波FPGA实现

    C语言实用数字图像处理.pdf6.34 MB05-11-13|19:30 FPGA实验报告-李炎东.doc633.66 kB16-01-14|10:28 中值滤波在红外成像引信中的应用及硬件实现.ca ...

  5. idea中怎么新建vue项目_项目中使用vue-awesome-swiper

    一.简介 Swiper常用于移动端网站的内容触摸滑动 Swiper是纯javascript打造的滑动特效插件,面向手机.平板电脑等移动终端,以及PC端网站.Swiper能实现触屏焦点图.触屏Tab切换 ...

  6. 生活中回归分析实际例子_回归分析中R方和调整R方的区别

    介绍 当我开始我的数据科学之旅时,我探索的第一个算法是线性回归. 在理解了线性回归的概念和算法的工作原理之后,我非常兴奋地使用它并在问题陈述中做出预测.我相信你们大多数人也会这么做的.但是一旦我们建立 ...

  7. 出中的意思是什么_诗词中出律是什么意思

    出律:诗词格律术语,多用作诗词对联的平仄上. 对仗工整,不得出律犯拗. 诗词格律一般有四大要素:用韵.平仄.对仗.字数. 其中律诗最为严格,必须满足全部要素. 汉语虽有四声,但在近体诗中,并不需要象词 ...

  8. 二次拟合r方_回归分析中R方和调整R方的区别

    作者|ANIRUDDHA BHANDARI 编译|VK 来源|Analytics Vidhya 概述 理解R方和调整R方的概念 了解R方和调整R方之间的关键区别 介绍 当我开始我的数据科学之旅时,我探 ...

  9. 找出两个字符串中所有共同的字符_面试中的两个字符串问题竟给我整懵了?!| 原力计划...

    作者 | 一路向维 责编 | 王晓曼 出品 | CSDN博客 昨天收到通知,今天有个面试,一家魔都中型电商公司,名字咱就不说了.内心顿时踌躇满志.跃跃欲试,晚上还翻看面试题,做准备. 到了目的地之后, ...

最新文章

  1. org.gradle.api.internal.tasks.DefaultTaskInputs$TaskInput........
  2. 汇编语言--int指令
  3. 20155302 2016-2017-2 《Java程序设计》第六周学习总结
  4. 1.5 编程基础之循环控制 21 角谷猜想--方法二
  5. vue 列表更改排序,不刷新问题
  6. 用java来实现列出指定目录下的文件,子目录下的文件也要输出
  7. 【实用工具】GLIBC降级
  8. 微信5.0安卓内测版下载
  9. fatal io error 11错误
  10. 绘图添加网格_Stata绘图: 添加虚线网格线
  11. 如何写一首悲伤的原创歌曲?
  12. 印刷五大要素:原稿、印版、油墨、承印物、印刷机械
  13. 信创好难?ARM应用移植避坑指南请收好
  14. 手绘图形识别方法(算法)
  15. 通达信日线数据转换为feather格式,提高后续数据处理速度
  16. 视频怎么转为GIF,如何制作GIF
  17. 如何利用ChatGPT学习量化投资?
  18. 如何把Java代码写的简洁
  19. Nvidia TX2 Ubuntu18.04 安装 IntelRealsense L515 realsense SDK 及 Realsense ROS (make各种问题解答,一篇到位版本)
  20. 【语义分割】类别不平衡损失函数合集

热门文章

  1. cf1677C. Tokitsukaze and Two Colorful Tapes(div1)
  2. Python max函数
  3. Android RecyclerView只显示第一行
  4. git reset, git status, git clean, .gitignore, git diff, git restore 的关系梳理
  5. 安卓、苹果app_小程序——电商系统(开源免费)
  6. 大江大河——通信设备商们的2019年
  7. 野路子玩Qt,第十集,八音盒
  8. 大二文本分词过滤分类实验总结
  9. 30s快速开通微商城,零售+分销结合,支持直播美颜
  10. 抽样技术--简单随机抽样