目录

  • 一、高尔顿数据集回归分析
    • 1.1 父子身高(一元线性回归)
    • 1.2 母子身高(一元线性回归)
    • 1.3 多元线性回归方程
  • 二、Anscombe四重奏数据集回归分析
  • 三、总结
  • 四、参考资料

根据上一篇博客:Excel 2016 对数据做线性回归分析步骤,了解了回归分析操作步骤后,开始学习回归分析。

一、高尔顿数据集回归分析

本段内容:
线性回归练习。“父亲高则儿子高,父亲矮则儿子矮”(即父亲与儿子身高相关,且为正相关)、“母高高一窝,父高高一个”(即母亲的身高比父亲的身高对子女的影响更大)的习俗传说是否成立?请在“父母子女身高”数据集(高尔顿数据集)基础上利用线性回归做出科学分析。
1)选取父子身高数据为 X-Y,用 Excel 计算线性回归方程和相关系数、方差、p 值等,判断回归方程是否成立。 现在如果有一个新家庭的数据,已知父亲身高 75 英寸,请测算儿子的身高为多少?
2)选取母子身高数据为 X-Y,用 Excel 计算线性回归方程和相关系数、方差、p 值等,判断回归方程是否成立。
3)根据以上数据,阐明你对习俗说法是否正确的分析。
4)你能用多元线性回归方法,计算出父亲、母亲与儿子身高的回归方程吗?.

  • 高尔顿数据集:https://pan.baidu.com/s/1kpbWeYx0orstbkLEc9XnSg——提取码:5g3o

1.1 父子身高(一元线性回归)

说明:以父亲身高为 X 变量,以儿子身高为 Y 值。

  • 首先参考网址对数据进行预处理:https://jingyan.baidu.com/article/1e5468f94b04a9484961b7ed.html
  • 只留下父亲与儿子的两条数据。
  • 然后再次分析后如下图所示:
  • 线性拟合图成一团了,可以设置合理的坐标起始值,双击起始坐标即可。
  • 显示出回归方程和 R 平方值:右击黄点,点击【添加趋势线】,勾选【显示公式】和【显示 R 平方值】。

  • 图的左边有一个回归统计表,含义如下:
  • 其中 R² 值越接近 1 ,表示拟合效果越好,显然这里拟合效果较差。
  • 图的左边还有一个方差分析表,含义如下:
  • 值得注意的是,第三列的残差平方和 = 1662.989,这个数值越大表示拟合效果越差,这里也可以说明说明拟合效果较差。
  • P 值越小越好,图中 P 值=0.00000000107<0.0001,说明置信度达到99.99%,说明该模型是假的概率为0.01%

说明:更详细的回归结果分析请点击参考资料的链接

  • 综上所述,模型计算无误,但这个模型的回归方程是略微成立的,拟合效果较差!
  • 现在用父亲身高 75 英寸带入回归方程:
    y=0.4122x+40.847y = 0.4122x+40.847 y=0.4122x+40.847
  • 得到 y = 71.762(英寸)

1.2 母子身高(一元线性回归)

说明:以母亲身高为 X 变量,以儿子身高为 Y 值。

  • 同样的对高尔顿数据集进行预处理,只留下母亲与儿子的数据集。
  • 再数据分析,回归分析结果:
  • 测定系数 R²=0.134016, 拟合效果差,残差平方和 = 1866.282,也说明拟合效果差,P 值 = 0.00000000584< 0.0001,模型置信度达到 99.99%。
  • 综上所述,回访方程略成立,拟合效果差。
  • 根据上面的数据,我对于习俗所说的 “ 父亲高则儿子高,父亲矮则儿子矮 ”、“ 母高高一窝,父高高一个 ” 看法持不正确的态度。

1.3 多元线性回归方程

说明:以父亲、母亲身高为 X 变量,以儿子身高为 Y 值。

  • 分析结果如下图:
  • 根据第三章表(回归参数表)可以估算出回归方程为:
    y=19.3850904355944+0.402678287820046x1+0.344209923878514x2y = 19.3850904355944 + 0.402678287820046 x_1 + 0.344209923878514 x_2 y=19.3850904355944+0.402678287820046x1​+0.344209923878514x2​
  • 其中 x1x_1x1​ 表示父亲身高,x2x_2x2​ 表示母亲身高,yyy 为子女身高。

二、Anscombe四重奏数据集回归分析

本段内容:
线性回归方法的有效性判别。 针对 Anscombe 四重奏数据集,用 excel 对四组数据进行线性回归分析,判断其中哪些回归方程是成立的,哪些不成立?不成立的应该如何解决?

  • Anscombe四重奏数据集:https://pan.baidu.com/s/1kd006OzJJnxjLVKokkMQfA——提取码:iuqk

Anscombe四重奏数据集回归分析结果:

  • 数据集一:
  1. 测定系数 = 0.666542
  2. 残差平方和 = 13.76269
  3. P 值 = 0.00217
  4. 回归方程:y = 0.5x + 3
  • 数据集二:
  1. 测定系数 = 0.666242
  2. 残差平方和 = 13.77629
  3. P 值 = 0.002179
  4. 回归方程:y = 0.5x + 3
  • 数据集三:
  1. 测定系数 = 0.666324
  2. 残差平方和 = 13.75619
  3. P 值 = 0.002179
  4. 回归方程:y = 0.5x + 3
  • 数据集四:
  1. 测定系数 = 0.666707
  2. 残差平方和 = 13.74249
  3. P 值 = 0.002165
  4. 回归方程:y = 0.5x + 3
  • 不仅仅只是这四个数据及其接近,其它的数据也是及其的接近,而四个数据集完全不同且差别极大;
  • 如果仅仅是依赖于基本的统计特性,那么你会觉得它们是及其接近的数据组或者同一组数据,但以图形方式查看数据时,会发现差别极大。
  • 总结:
    1. 数据集一:从图形上看,回归方程不成立,相关性不大,散点多居于直线两侧,无法做回归分析;
    2. 数据集二:散点呈抛物线,方程不成立,但是当做多项式拟合时,完美契合;
    3. 数据集三:从图形上,线性拟合性高,数据多与直线贴近,方程成立;
    4. 数据集四:从图形上看,由最右侧的点影响整个回归方程,方程不成立,若排除那个数据,可以做回归分析。

三、总结

  • 用 excel 做线性回归分析十分的方便,利于分析,但是在做数据分析的时候,不能仅仅依赖基本的统计特性,还要通过图形的方式分析数据,才能分析得全面。

四、参考资料

[1] Excel 回归分析结果的详细阐释
[2] 安斯科姆四重奏 — Matplotlib 3.3.3 文档

Excel 2016 做线性回归分析【高尔顿数据集】与【Anscombe四重奏数据集】相关推荐

  1. 高尔顿数据集和Anscombe四重奏数据集

    文章目录 一.一元线性回归 一.父子线性回归 二.母子线性回归 三.多元线性回归 二.Anscombe四重奏 一.数据一 二.数据二 三.数据三 四.数据四 三.参考资料 一.一元线性回归 一.父子线 ...

  2. Excel线性回归分析(高尔顿数据集;Anscombe四重奏数据集)

    文章目录 一.高尔顿数据集回归分析 二.Anscombe四重奏数据集回归分析 三.总结 四.参考 一.高尔顿数据集回归分析 "父亲高则儿子高,父亲矮则儿子矮"(即父亲与儿子身高相关 ...

  3. Excel实现线性回归分析——高尔顿数据集、四重奏数据集

    文章目录 一.高尔顿数据集进行线性回归分析 (一)父母身高平均值和其中一个子女身高进行回归分析 (二)父亲的身高和其中一个子女身高进行回归分析 (三)父亲的身高和儿子身高进行回归分析 (四)母亲身高和 ...

  4. Excel做线性回归分析

    Excel做线性回归分析 概要 一.身高体重线性分析 二.父母子女身高线性分析 1.母亲身高与子女的回归分析 2.父亲身高与子女的回归分析 3.结果分析 三.总结与参考资料 1.总结 2.参考资料 此 ...

  5. 线性回归分析——高尔顿数据集更正版

    线性回归分析--高尔顿数据集更正版 一."父亲-儿子"身高数据回归分析 1.做数据处理,将数据重复项删除:完成'儿子'分类 2.做回归处理 二."母亲-儿子"身 ...

  6. python二手房价格预测_Python爬取赶集网北京二手房数据R对爬取的二手房房价做线性回归分析...

    前言:本文主要分为两部分:Python爬取赶集网北京二手房数据&R对爬取的二手房房价做线性回归分析.文章思路清晰,代码详细,特别适合刚刚接触Python&R的同学学习参考. Part1 ...

  7. 线性回归分析——高尔顿数据集

    这里写目录标题 一."父亲-儿子"身高数据回归分析 1.excel对父子数据集做线性回归 2.回归处理 二."母亲-儿子"身高数据回归分析 1.对母子数据集做线 ...

  8. 使用eviews做线性回归分析

    [b]Glossary:[/b] ls(least squares)最小二乘法 R-sequared样本决定系数(R2):值为0-1,越接近1表示拟合越好,>0.8认为可以接受,但是R2随因变量 ...

  9. Python Statistical model: 用Scipy做线性回归分析 (一步实现p value、标准差计算)

    点赞发Nature 关注中Science p-value表示线性回归中的斜率.截距的显著性,p-value越小,表示得到的结果越显著. 之前我用curve fit的方法实现了线性函数的拟合,但是这有些 ...

最新文章

  1. [转] 为什么javascript是单线程的却能让AJAX异步调用?
  2. python 消息队列、异步分布式
  3. curl cookie格式
  4. 推荐几个2021年在Redis、Go和Rust领域异军突起的技术公众号
  5. 在java编程中会使用汉字字符_在java程序中将中文字符写入文件中或者是将文件中的中文字符读入程序时会出现乱码或者一串“?”,求...
  6. pylint警告: An attribute defined in json.encoder line 158 hides this methodpylint(method-hidden)
  7. WebGrid Enterprise
  8. Servlet实现登录带有验证码验证案例
  9. 英语语法---名词性短语详解
  10. 「猪齿鱼」助力汉得信息智能制造集中交付高效协同
  11. 如何使用 Java 将 PDF 转换为文本 (TXT)
  12. Java实现给图片局部打马赛克(前提是知道坐标的情况下)
  13. 计算机运行快捷方式,电脑运行快捷键有哪些 电脑运行快捷键介绍
  14. 每天读一点好玩心理学--酒吧
  15. JavaScript 进阶知识 - Ajax篇
  16. not attached to window manager问题解决
  17. 股票技术图形怎么看?一文给你分析透!
  18. java无法加载Label_java-Label的labelFor字段无法正常运行
  19. 公众号第三方平台和微信公众号平台的区别与开发步骤
  20. gradle-3.3-all安装

热门文章

  1. 关于-32768的补码!
  2. 2023武汉理工大学计算机考研信息汇总
  3. python中省略号三个点(...)的作用
  4. Win10右下角小图标怎么叠起来?
  5. IT运维的相关需求分析报告(第一篇)
  6. centos7安裝搜狗輸入法_sogou-input-in-centos7
  7. 论文中的结果分析怎么写?
  8. 高中数学必修一:集合高考典型例题解题技巧方法
  9. css 特效实现方法
  10. 虚幻5新特性之EnhancedInput