文章目录

  • 一、一元线性回归
    • 一、父子线性回归
    • 二、母子线性回归
    • 三、多元线性回归
  • 二、Anscombe四重奏
    • 一、数据一
    • 二、数据二
    • 三、数据三
    • 四、数据四
  • 三、参考资料

一、一元线性回归

一、父子线性回归

任务要求:

对“父母子女身高”数据集(高尔顿数据集)进行线性回归分析(简化的做法可选取父子身高数据为X-Y),用excel计算线性回归方程和相关系数、方差、p值等,判断回归方程是否成立?

先将数据预处理

数据—>数据分析—>回归

选取父子身高数据为X-Y
父亲身高为X,子女身高为Y
删除重复数据的线性回归(238个样本)
线性拟合图

第一个是对模型的解释程度,需要注意是R-Square,这是一个衡量线性回归模型能否很好解释变量的变异程度的指标,R-Square越高模型越好。
Multiple R 是指线性相关系数
R Square 是拟合系数
Adjusted R Square 是调整后的拟合系数

第二个是方差分析,这里注意F统计量和Significance-F


df是指自由度,SS离差平方和,MS均方离差。

方差分析这里的F统计量,是反映总体回归关系是否存在,因为我们是用样本来估计总体参数,所以当我们评估了样本的模型的R-Square之后,就要进行总体回归关系评估,这里采用的是假设检验的思想:

原假设是认为 自变量的系数为0,也就是说自变量和因变量并无线性相关关系
备择假设便是不为0,具有线性相关关系

这里是置信水平95%下,双侧检验的用F统计量来衡量的假设检验

用显著性水平α=0.05,这里的Significance-F < α,代表着:落入拒绝域,也就是拒绝原假设。这里的Significance-F可以理解为p-value

P值

从方差分析表中得到其 p 值为 1.07E-09
这个值小于 0.0001 ,置信度达到 99.99% 以上,所以这个回归方程成立

现在如果有一个新家庭的数据,已知父亲身高75英寸,请测算儿子的身高为多少?

通过方程Y=0.4122X+40.847
带入75
得到的最后的数据为71.762

二、母子线性回归

先对数据预处理

线性拟合图

分析的数据

从方差分析表中得到其 p 值为 2.92868E-06
这个值小于 0.0001 ,置信度达到 99.99% 以上,所以这个回归方程成立
通过方程Y=0.421X+34.967

三、多元线性回归

线性拟合图

分析数据

二、Anscombe四重奏

一、数据一

数据一的线性拟合图

分析数据

测定系数 = 0.666542
残差平方和 = 13.76269
P 值 = 0.00217
回归方程:y = 0.5x + 3

二、数据二

数据二的线性拟合图

分析数据

测定系数 = 0.666242
残差平方和 = 13.77629
P 值 = 0.002179
回归方程:y = 0.5x + 3

三、数据三

数据三的线性拟合图

测定系数 = 0.666324
残差平方和 = 13.75619
P 值 = 0.002179
回归方程:y = 0.5x + 3

四、数据四

数据四的线性拟合图

分析数据

测定系数 = 0.666707
残差平方和 = 13.74249
P 值 = 0.002165
回归方程:y = 0.5x + 3

任务要求:

用excel对四组数据进行线性回归分析,判断其中哪些回归方程是成立的,哪些不成立?不成立的应该如何解决?

数据一 数据分步在回归线趋势线的上下两侧,且较为分散,故该回归方程不成立,且不可做回归方程。
数据二 数据散点基本呈现为“抛物线”形状,且回归趋势线与源数据散点完全不符,故该回归方程不成立。
数据三 从图像上看回归趋势线基本符合散点图分步情况,虽然散点图中有一个异常点,但不影响总体趋势,故该回归方程成立。
数据四 从图像上看,数据散点绝大部分的 X 值相等,而只有一个异常点位于右侧,该异常点严重影响回归方程的准确性,回归趋势线与散点完全不符,故该回归方程不成立。若去除右侧异常点即可做符合散点分步的回归方程。

三、参考资料

Excel 2016 做线性回归分析【高尔顿数据集】与【Anscombe四重奏数据集】

高尔顿数据集和Anscombe四重奏数据集相关推荐

  1. Excel 2016 做线性回归分析【高尔顿数据集】与【Anscombe四重奏数据集】

    目录 一.高尔顿数据集回归分析 1.1 父子身高(一元线性回归) 1.2 母子身高(一元线性回归) 1.3 多元线性回归方程 二.Anscombe四重奏数据集回归分析 三.总结 四.参考资料 根据上一 ...

  2. Excel线性回归分析(高尔顿数据集;Anscombe四重奏数据集)

    文章目录 一.高尔顿数据集回归分析 二.Anscombe四重奏数据集回归分析 三.总结 四.参考 一.高尔顿数据集回归分析 "父亲高则儿子高,父亲矮则儿子矮"(即父亲与儿子身高相关 ...

  3. 4.keras实现--生成式深度学习之用变分自编码器VAE生成图像(mnist数据集和名人头像数据集)...

    1.VAE和GAN 变分自编码器(VAE,variatinal autoencoder)   VS    生成式对抗网络(GAN,generative adversarial network) 两者不 ...

  4. VQA-CP v2数据集和VQA v2数据集

    VQA-CP 下载链接 问题类型:65个类别 Yes/No Num other 答案:如上总体分为3个类别,共有2274 图像:每张图片的36个区域的2048维的特征向量. FIELDNAMES = ...

  5. Excel实现线性回归分析——高尔顿数据集、四重奏数据集

    文章目录 一.高尔顿数据集进行线性回归分析 (一)父母身高平均值和其中一个子女身高进行回归分析 (二)父亲的身高和其中一个子女身高进行回归分析 (三)父亲的身高和儿子身高进行回归分析 (四)母亲身高和 ...

  6. 转:UCI数据集和源代码数据挖掘的数据集资源

    <UCI数据集和源代码> UCI数据集是一个常用的标准测试数据集,下载地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主页上也 ...

  7. 学习率和数据集规模_数据集和数据

    学习率和数据集规模 Often the words data and dataset are used interchangeably due to the understanding the wor ...

  8. OTB数据集和VOT数据集融合跟踪算法接口示例

    OTB数据集和VOT数据集自己存数据接口参考代码: 一.OTB数据集(不使用tracker_benchmark_v1.0) 1.OTB数据结果最基本的格式 type为目标框类型: res为目标框的所在 ...

  9. UCI数据集和源代码数据挖掘的数据集资源

    <UCI数据集和源代码> UCI数据集是一个常用的标准测试数据集,下载地址在 http://www.ics.uci.edu/~mlearn/MLRepository.html 我的主页上也 ...

最新文章

  1. python爬虫从入门到放弃(二)之爬虫的原理
  2. 「Python」unindent does not match any outer indentation level
  3. 【Android休眠】之PowerKey唤醒源实现【转】
  4. 安卓权威编程指南 挑战练习 20.9 创建多版本主题
  5. Sentinel总结(个人笔记)
  6. 风险预测模型_【期刊导读】长期NA治疗的慢乙肝患者也有专属肝癌风险预测模型...
  7. 2.10 环境变量PATH 2.11 cp命令 2.12 mv命令 2.13 文档查看cat/mor
  8. php 孙中岳_请问,看完孙仲岳的一周学会PHP接案了!
  9. 计算机丢失dll文件夹,简单几招教你解决windows7旗舰版丢失dll文件
  10. python用法查询软件下载_布同自制Python函数帮助查询小工具
  11. 今天我们聊一聊程序员怎么进国企,附上我的2021年国企面经一份,希望对大家有帮助!
  12. zigbee初级教程(零) : cc2530开发环境搭建
  13. css sprite与background-size结合实现背景图片等比缩放
  14. php字符串加加运算,php 学习笔记
  15. Python初级试题25道(含答案)
  16. 山东省科学技术进步奖项项目申报条件和流程
  17. 服务器证书无效,邮件服务器证书无效怎么解决?不受信任的解决办法?
  18. Ubuntu安装中文语言包(包括五笔拼音等中文输入法)
  19. C#同一窗口通过一个按键切换显示不同画面
  20. 关于材料出库单的金额问题

热门文章

  1. 2021支付宝集五福【最全攻略】!
  2. Python Django支付宝沙箱调试
  3. Appium+python自动化3-启动淘宝app(转)
  4. 安路FPGA学习之有趣的下载方式
  5. Vulkan_Shader—高级光照_阴影_原理
  6. 【Linux】云服务器的购买与Linux远程连接
  7. WebRTC源码中turnserver的使用方法
  8. ibm邮箱连接不到服务器,IBM i 安全邮件配置和常见故障排除方法
  9. 求助!!C++ int接收的式子有小数但是所有的计算结果都是整数,最终结果错误的灵异事件。
  10. 计算机磁盘管理和容量不一致,官方数据:为什么硬盘可用容量显示错误,以及硬盘容量与实际情况不符的原因...