39.绘制本垒打与击球平均数的散点图。

40.非正式地说,是否有证据表明变量之间存在关系?

43.根据击球平均数对本垒打进行回归。获得的正态概率图

此回归的标准化残差。正态概率图是否表示可接受的正态性,或是否存在偏度?如果倾斜,什么类型的倾斜?

44.绘制残差与拟合值的曲线图(拟合值指y)你看到了什么样的图案?关于回归假设,这表明了什么?

45.根据本垒打的自然记录,对击球时的ln本垒打进行回归平均值。从该回归中获得标准化残差的正态概率图。正态概率图是否表示可接受的正态性?

46.绘制残差与拟合值的曲线图。你看到了有力的证据吗已违反恒定方差假设?(请记住避免罗夏效应)。因此,得出结论,假设是有效的。

59.列出异常值。所有这些异常值有什么共同点?对于奥兰多·帕尔梅罗,解释为什么他是一个局外人。

接下来,对棒球数据集进行子集,以便我们与至少有100个击球手的击球手一起工作。将此数据集用于练习62-71。

62.我们有兴趣调查num之间是否存在线性关系-玩家偷球被抓到的次数和偷球的数量。构建散点图,以“抓到”作为响应。是否存在线性关系的证据?

63.根据散点图,是否需要转换为线性?为什么还是为什么

64.对玩家被抓到偷东西的次数与被抓到偷东西的次数进行回归玩家盗垒的数量。

65.找出并解释能告诉你数据与模型拟合程度的统计数据。

66.预测一名球员偷盗被抓次数的典型错误是什么,考虑到他偷来的基地数量?

对于练习72-85,使用谷物数据集。

72.我们有兴趣根据钠含量预测营养评级。构建

适当的散点图。请注意,存在一个异常值。识别这个异常值。解释为什么这种谷物是一种异常值。

73执行适当的回归。

74.忽略异常值。执行相同的回归。比较坡度和坡度的值两个回归的y截距。

75.使用散点图,解释为什么y截距变化大于斜率,而忽略了utlier

线性回归有关的作业

打开棒球数据集,这是一个收集了331名2002年参加美国棒球联赛的棒球运动员的击球统计数据的集合,可以在图书网站上找到。www.DataMiningConsultant.com。假设我们感兴趣的是平均击球率和一名球员打出的本垒打数之间是否存在关系。例如,一些球迷可能会争辩说,那些打了很多本垒打的人也会打很多三振。因此,他们的击球率较低。让我们来看看,用一个回归的数字,全垒打对球员的打击平均数(点击数除以打击数)。由于棒球击球率的平均值往往是高度可变的低数量的at,我们限制我们的数据集,以那些在2002年赛季至少有100个at的球员。这使得我们有209名球员

 

图3-9 残差和拟合值之间的曲线

图 3-13 去的参数后进行的参数与拟合值的曲线图

图3-14 残差图

图 3-27适当拟合数值的效果图

图 3-30 删除了奇异点的拟合图

[1] Gotelli, N. J. 2008. A Primer of Ecology . Sunderland, MA: Sinauer.

[2] Messier, F. 1994. Ungulate population models with predation: A case study with North American moose. Ecology 75:478-488.

[3] Pervez, A., and Omkar, A. 2005. Functional responses of coccinellid predators: illustration of a logistic approach. Journal of Insect Science 5:1-6.

[4]基本R绘图 | R语言教程 (pku.edu.cn) 重要的画图方法

[5]代码在线高亮工具 | 将高亮美化的代码一键粘贴到 Word 或 OneNote 中 (highlightcode.com)

[6] R语言信用评分卡:数据分箱(binning) - 知乎 (zhihu.com)

[7] (6条消息) r k-means 分类结果_R语言信用评分卡:数据分箱(binning)_weixin_39972019的博客-CSDN博客

R语言 线性回归的有关方法相关推荐

  1. R语言编程的高效方法

    R语言编程的高效方法 R语言编程的高效方法 高效编程之细节知识点 并行计算 1.查看核数 2.可以使用并行计算的场景 3.Parellel 包 R语言编程的高效方法 学习资料来源: datacamp ...

  2. R语言创建新变量方法

    R语言创建新变量方法 在数据分析中,可能需要对数据进行求和.求均值等处理,并且将处理后的数据重新保存到原来的数据框中,这里提供三种可供解决的方法: 数据框$变量名 <- 表达式.若原数据框中含有 ...

  3. R语言实现常用多重比较方法

    R语言实现常用多重比较方法 在单因素方差分析ANOVA中,如果该因素影响比较显著,那么需要进一步利用多重比较方法比较该因素不同水平的影响,确定不同水平下该因素的影响是否显著.常见的多重比较方法主要有两 ...

  4. r语言 线性回归 相关系数_基于R语言的lmer混合线性回归模型

    原文 基于R语言的lmer混合线性回归模型​tecdat.cn 混合模型适合需求吗? 混合模型在很多方面与线性模型相似.它估计一个或多个解释变量对响应变量的影响.混合模型的输出将给出一个解释值列表,其 ...

  5. r语言 线性回归 相关系数_R语言系列第四期:R语言简单相关与回归

    这一系列里前面的三个部分都是用于比较组间差异的各种方法. 在这个部分里,我们会为大家介绍如何使用R进行基础回归和相关分析,以及模型作图.置信区间的预估和展示. A. 简单线性回归 我们使用数据集thu ...

  6. r语言线性回归_(R语言)线性回归:机器学习基础技术

    线性回归: 使用最小二乘法预测定量的结果的一种回归模型. Anscombe数据集 它由统计学家弗朗西斯·安斯库姆(Francis Anscombe)建立,用来强调数据可视化和异常值在数据分析中的重要性 ...

  7. 【无标题】 R语言下载keras最新方法

    R语言使用keras 和 tensorflow做深度学习,摘自于deep learning with R 第二版,太贵了好几十美刀. install.packages("keras" ...

  8. R语言画森林图方法4

    获取更多R语言知识,请关注公众号:医学和生信笔记 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化.主要分享R语言做医学统计学.meta分析.网络药理学.临床预测模型.机器学习.生 ...

  9. r语言 siar 代码_sair方法及R操作入门——稳定同位素之食物来源比例分析

    (本文于2016-10-5 20:29 首发于 "科学网") 在稳定同位素领域,20世纪70 80 年代开始,利用碳氮稳定同位素来研究食物网结构成为有力的技术手段,以弥补传统的胃含 ...

最新文章

  1. PHP学习笔记-文件操作1
  2. windows快捷启动命令
  3. 《大道至简》第六章读后感及本次课后习题11.9
  4. 单片机小白学步系列(五) 集成电路、封装相关知识
  5. deferred Transports Protocols 简单介绍
  6. 【JAVA 第三章 流程控制语句】课后习题 编写判断从键盘输入的字符串是否为回文
  7. 亚马逊自动化仓库事故,机器人失手戳破有毒喷雾,24名工人被送医院
  8. 5.Django|模型层--多表关系
  9. 矩形窗、汉明窗效果对比(matlab)
  10. BOSS直聘下载自己的简历要钱!而且是PDF格式 - 解决方法
  11. UVA: 1589 Xiangqi
  12. 3ds Max 材质贴图
  13. [项目管理]工业工程理论在软件项目中的实践
  14. 云计算与大数据---21大数据张舒
  15. 用python抓取智联招聘信息并存入excel
  16. 人人都应该用的 Python 开源库
  17. 基于P2P万信金融-- 万信金融项目之业务大总结(文末附代码地址)
  18. antdpro代码分析
  19. VSCode设置Tab缩进两个空格
  20. 换发型算法_GitHub - donsonLiu/yry: yry(颜如玉)—— 一个实现人脸融合的算法,可以接近腾讯天天P图疯狂变脸功能的效果...

热门文章

  1. 关于MMAPI的学习
  2. 火爆的智能健身镜,照见互联网健身“新常态”?
  3. python之路——初识面向对象
  4. 新浪微博4周年抽红包 Python脚本
  5. java判断按钮已选择的值_如何获取buttonGroup的选定单选按钮的值 - java
  6. 代码下载淘宝天猫的产品主图视频和详情页视频
  7. 验证码不显示的解决方法
  8. ES6---promise详解及用法
  9. centos7上安装annoy
  10. NLP学习—18.Annoy、HNSW、KD tree以及多轮对话