高尔顿与回归分析的起源

“回归”是由英国著名生物学家兼统计学家高尔顿(Francis Galton,1822~1911.生物学家达尔文的表弟)在研究人类遗传问题时提出来的。为了研究父代与子代身高的关系,高尔顿搜集了1078对父亲及其儿子的身高数据。他发现这些数据的散点图大致呈直线状态,也就是说,总的趋势是父亲的身高增加时,儿子的身高也倾向于增加。但是,高尔顿对试验数据进行了深入的分析,发现了一个很有趣的现象—回归效应。因为当父亲高于平均身高时,他们的儿子身高比他更高的概率要小于比他更矮的概率;父亲矮于平均身高时,他们的儿子身高比他更矮的概率要小于比他更高的概率。它反映了一个规律,即这两种身高父亲的儿子的身高,有向他们父辈的平均身高回归的趋势。对于这个一般结论的解释是:大自然具有一种约束力,使人类身高的分布相对稳定而不产生两极分化,这就是所谓的回归效应。

1855年, 高尔顿发表《遗传的身高向平均数方向的回归》一文,他和他的学生卡尔•皮尔逊Karl·Pearson通过观察1078对夫妇的身高数据,以每对夫妇的平均身高作为自变量,取他们的一个成年儿子的身高作为因变量,分析儿子身高与父母身高之间的关系,发现父母的身高可以预测子女的身高,两者近乎一条直线。当父母越高或越矮时,子女的身高会比一般儿童高或矮,他将儿子与父母身高的这种现象拟合出一种线形关系,分析出儿子的身高y与父亲的身高x大致可归结为一下关系:

y=33.73+0.516*x  (单位为英寸)

根据换算公式1英寸=0.0254米, 1米=39.37英寸。单位换算成米后:

Y= 0.8567+0.516*X   (单位为米);

假如父母辈的平均身高为1.75米,则预测子女的身高为1.7597米。

这种趋势及回归方程表明父母身高每增加一个单位时,其成年儿子的身高平均增加0.516个单位。这就是回归一词最初在遗传学上的含义。

有趣的是,通过观察,高尔顿还注意到,尽管这是一种拟合较好的线形关系,但仍然存在例外现象:矮个父母所生的儿子比其父要高,身材较高的父母所生子女的身高却回降到多数人的平均身高。换句话说,当父母身高走向极端,子女的身高不会象父母身高那样极端化,其身高要比父母们的身高更接近平均身高,即有“回归”到平均数去的趋势,这就是统计学上最初出现“回归”时的涵义,高尔顿把这一现象叫做“向平均数方向的回归” (regression toward mediocrity)。虽然这是一种特殊情况,与线形关系拟合的一般规则无关,但“线形回归”的术语却因此沿用下来,作为根据一种变量(父母身高)预测另一种变量(子女身高)或多种变量关系的描述方法。

回归的现代意义:

它要比其原始意义广泛的多。具体地说,回归分析的内容包括:

•    确定响应变量与预报变量间的回归模型,即变量间相关关系的数学表达式(通常称为经验公式);

•    根据样本估计并检验回归模型及未知参数;

•    从众多的预报变量中,判断哪些变量对响应变量的影响是显著的,哪些是不显著的;

•    根据预报变量的已知值或给定值来估计或预测响应变量的平均值并给出预测精度或根据响应变量的给定值来估计预报变量的值,即所谓的预报与控制问题。

文章引用:http://blog.sina.com.cn/s/blog_8e14fa780101ax8o.html

高尔顿与回归分析的起源相关推荐

  1. Excel 2016 做线性回归分析【高尔顿数据集】与【Anscombe四重奏数据集】

    目录 一.高尔顿数据集回归分析 1.1 父子身高(一元线性回归) 1.2 母子身高(一元线性回归) 1.3 多元线性回归方程 二.Anscombe四重奏数据集回归分析 三.总结 四.参考资料 根据上一 ...

  2. Excel线性回归分析(高尔顿数据集;Anscombe四重奏数据集)

    文章目录 一.高尔顿数据集回归分析 二.Anscombe四重奏数据集回归分析 三.总结 四.参考 一.高尔顿数据集回归分析 "父亲高则儿子高,父亲矮则儿子矮"(即父亲与儿子身高相关 ...

  3. Excel实现线性回归分析——高尔顿数据集、四重奏数据集

    文章目录 一.高尔顿数据集进行线性回归分析 (一)父母身高平均值和其中一个子女身高进行回归分析 (二)父亲的身高和其中一个子女身高进行回归分析 (三)父亲的身高和儿子身高进行回归分析 (四)母亲身高和 ...

  4. 线性回归分析——高尔顿数据集更正版

    线性回归分析--高尔顿数据集更正版 一."父亲-儿子"身高数据回归分析 1.做数据处理,将数据重复项删除:完成'儿子'分类 2.做回归处理 二."母亲-儿子"身 ...

  5. ”父母子女身高“数据集(高尔顿数据集)进行线性回归分析实验

    "父母子女身高"数据集(高尔顿数据集)进行线性回归分析实验 一.配置Excel 二.对数据做线性回归分析 三.父亲母亲分别与儿子做回归方程分析 1.父亲与儿女数据分析 2.母亲与儿 ...

  6. 线性回归分析——高尔顿数据集

    这里写目录标题 一."父亲-儿子"身高数据回归分析 1.excel对父子数据集做线性回归 2.回归处理 二."母亲-儿子"身高数据回归分析 1.对母子数据集做线 ...

  7. 对高尔顿数据集实现线性回归分析

    目录 一.第一种 二.第二种 三.第三种 四.第四种 一.第一种 1.预处理数据 2.数据分析 勾选生成图表 3.添加趋势线 二.第二种 操作步骤同上 结果如下 三.第三种 操作步骤同上 结果如下: ...

  8. 回归分析中的“回归”

    一直对"拟合"和"回归"这两个名词不是特别的理解,自我感觉都是在对自变量和因变量进行模型的构建.以下是一些搜索理解:其实还是不是很理解????如果有理解的透彻的 ...

  9. matlab一元线性回归分析_建模开讲:一元线性回归分析及SPSS软件实现

    主讲内容:一元线性回归分析及SPSS软件实现 主讲时间:2020年3月28日(周六)上午9:00 直播平台:腾讯课堂 主讲人:么彩莲 链接地址:点击下面的"阅读原文"可以获得直播地 ...

最新文章

  1. 高度随宽度适应的响应式方案
  2. 孙钟秀--《操作系统教程》注释(陈怀临)-- 读书笔记
  3. 常见排序算法的时间复杂度
  4. python代码制作configure文件
  5. XPath 获取两个node中间的HTML Nodes
  6. 小辣椒手机创始人王晓雁加入小米;手机 QQ 可显示对方实时电量;Git Extensions 3.3.1 发布 | 极客头条...
  7. 扫描控件Web在线Applet
  8. zabbix 5.0所有依赖包_Zabbix“专家坐诊”第82期问答汇总
  9. 1036: [ZJOI2008]树的统计Count(树链剖分)
  10. Mybatis原理解析(三)--getMapper动态获取接口实现类
  11. h5截长图(html2canvas保存图片)
  12. php获取应用宝app下载连接
  13. 概率密度求解定理_从贝叶斯定理到概率分布:综述概率论基本定义
  14. c51语言转换ASCII码,数据转换:C51数字转字符最快速的方法 ASCII转换
  15. 花旗软件DWH实习回顾
  16. 用C语言编写简单的通讯录(大一课程作业)
  17. Nginx/Apache恶意User-Agent过滤列表 屏蔽蜘蛛爬虫
  18. TEWA-700G、TEWA-1000E/G等TEWA系列光猫获取超级密码
  19. Python求解多个多元一次方程组(完整可运行版本代码)
  20. VS2022 Visual Studio 2022专业版全功能离线版下载

热门文章

  1. android studio迁移,AndroidStudio 一键迁移至 AndroidX
  2. caffe中的Accuracy
  3. 计算机农业应用答案,东北农业大学计算机应用技术网上作业及答案.doc
  4. ESP8266 + MAX7219 做一个简易的自动同步的倒计时时钟
  5. Veritas NetBackup8.1.1客户端安装
  6. [附源码]Python计算机毕业设计电脑配件仓储后台管理系统
  7. 破解网页文字无法复制的方法
  8. LINUX下用户和组的操作与相关的配置文件
  9. 使用面阵相机进行传送带视频流的拼接
  10. java 实现写出倒立三角形的几种方法