欢迎关注”生信修炼手册”!

回归分析是一种广泛使用的统计工具,利用已有的实验数据,通过一个方程来定量的描述变量之间的关系,其中的变量可以分为两类

  1. 自变量,也称之为预测变量

  2. 因变量,也称之为响应变量

自变量可以有多个,而因变量只有一个,回归的本质就是构建因变量和自变量之间的方程。回归分析有两个经典的用法,第一个就是建模预测,通过构建的回归方程来对新的数据集进行预测,第二个就是用于定量描述变量间的相关性,在GWAS中,就是利用了回归分析的这一用法,本文首先来看下线性回归。

顾名思义,线性回归用线性方程来描述变量之间的关系,根据自变量的个数,又可以划分为一元线性回归和多元线性回归。这里的一元和多元指的就是自变量的个数。以一元线性回归为例,其方程如下

y = ax + b + c

其中x是自变量,y是因变量,a称之为回归系数,b称之为回归常数. c称之为误差,也叫做残差,a和b合称为回归参数,线性回归的目的就是求解回归参数。以探讨身高和体重间的线性关系为例,数据如下

其分布如下所示

从图上可以直观的感觉到,二者是一个线性关系,线性回归的本质就是根据实际的数据来拟合出一条最佳的直线,这里的最佳非常的重要,对于相同的数据,可以拟合出多条直线,示意如下

图中两条直线的效果看着差不多,那么如何来定量的比较不同直线的拟合效果,从而选择最优的呢?

通常有两种方法,第一种称之为最小二乘法,利用实际值和拟合值之间的差值,也就是残差值来构建衡量拟合效果的统计量,图示如下


图中的散点是实际观测值,直线上为拟合值,实际观测值和拟合值之间的线段代表的就是残差。对应的统计量为残差平方和,英文如下

residual sum of squares (RSS)
sum of squared estimate of errors (SSE)
sum of squared residuals (SSR)

计算公式如下

可以看做是一个欧式距离的求解,最小二乘法将残差平方和最小的直线作为最佳直线。第二种称之为最大似然法,似然其实就是概率,对于拟合出的直线,计算实际观测值出现的概率,将这个概率值作为拟合效果的标记量,概率最大的直线就认为拟合效果最佳。

其中,最小二乘法可以看做是最大似然的一个特例,可以由最大似然推导出来,在简单的线性回归中,最小二乘法应用广泛。以R语言为例,进行一元线性回归的代码如下

其中intercept称之为截距,对应回归方程中的回归常数,对于height这个自变量,其回归系数为0.6746。这里我们直接得到了最终的回归参数,其实在这里还有很多的细节,通过summary可以进行查看

第一个是残差的分布情况,用五个数字来表示,分别是最小值,第一四分位数,中位数,第三四分位数,最大值。在R中,可以通过quantile这个函数来进行计算

第二个是对回归参数的检验,通过t检验来分析回归方程中每个变量和因变量之间的相关性,对应Pr(>|t|)的部分, p值小于0.01认为是相关的。

第三个残差标准误,residual standard error,  标准误是衡量总体离散程度的统计量,计算公式如下

残差平方和除以自由度再开根号即可得到残差标准误,所以最佳的拟合直线其对应的残差标准误的值应该也是最小的。

第四个是R2,R-squared, 计算公式如下

SST是实际观测值的方差,SSR是拟合值的方差,R2为拟合值的方差占实际观测值方差的比例,取值范围为0-1。R2也称之为拟合优度,数值越接近1,说明拟合效果越好。对于一个回归方程的解而言,其差标准误和R2值是确定的,对于最佳的拟合直线而言,其残差标准误一定是最小,R2值一定是最大。

R2除了表征拟合效果外,还有一个用途,那就是表征自变量和因变量相关性的大小,只适用于一元线性回归,此时R2的值为自变量x和因变量y的相关系数的平方,所以在单位点的关联分析中,可以根据R2的值筛选相关性强的位点。

这里还有一个校正之后的R2, 计算公式如下

最后一个是整体方程的显著性检验,通过F检验来判断显著性。在GWAS中,利用线性回归可以分析SNP位点和连续型的表型性状之间的关联,利用pvalue来确定显著关联的位点,进一步可以根据R2来筛选关联性强的snp位点。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

线性回归方程b保留几位小数_线性回归的这些细节,你都搞明白了吗?相关推荐

  1. 线性回归方程b保留几位小数_实验室原始数据怎么保留最准确?(一)

    对实验中常用的玻璃量具如单标线吸管.容量瓶.比色管. 刻度吸管等进行分析,确定了直读式数据的读数规则及有效位数.如 10 mL单标线吸管有效数字位数为5位,而10mL刻度吸管随移取溶液体积不同其有效数 ...

  2. mysql 保留5位小数_小猿圈分享-MySQL保留几位小数的4种方法

    今天小猿圈给大家分享的是MySQL使用中4种保留小数的方法,希望可以帮助到大家,让大家的工作更加方便. 1 round(x,d) 用于数据x的四舍五入, round(x) ,其实就是round(x,0 ...

  3. jq设置保留两位小数_如何实现python中format函数保留指定位数的小数?

    我们经常说我国人口有13亿,这13亿数字是一个近似数.在我们无法精确准确得到一个数字时,会选择是它的近似数.近似数即经过四舍五入.进一法或者去尾法等方法得到的一个与原始数据相差不大的一个数.之前小编向 ...

  4. bigdecimal保留4位小数_四年级数学小数的加减乘法知识点汇总,带练习!

    张老师 - 4年级(多品小学教育) 顺城中心小学郭老师和环县虎洞中心小学谭老师需要的这份学习资料现在分享. 本资料已制作电子版 下载码是:76qa32vd <小数的加减乘法>知识点 一.小 ...

  5. 用python计算矩形面积结果四舍五入保留两位小数_你还在计算器开平方?太low了吧,学霸考场都用这种方法开平方...

    一般情况下,我们生活中遇到一个需要开平方的数时,第一反应就是拿手机计算器计算,但考试时怎么做?不让带计算器,包括具有计算功能的手表都严禁携带.那这个时候怎么做呢?手算开平方就是一种随时适用的方法,无论 ...

  6. bigdecimal除法保留4位小数_小猿圈分享-MySQL保留几位小数的4种方法

    今天小猿圈给大家分享的是MySQL使用中4种保留小数的方法,希望可以帮助到大家,让大家的工作更加方便. 1 round(x,d) 用于数据x的四舍五入, round(x) ,其实就是round(x,0 ...

  7. android float类型保留两位小数_你知道MySQL中Decimal类型和Float Double的区别吗?

    出处:cnblogs.com/panchanggui/p/10766607.html MySQL中存在float,double等非标准数据类型,也有decimal这种标准数据类型. 其区别在于,flo ...

  8. java怎么输出保留两位小数_剖析Java输出怎么保留两位小数

    Java中,当两个整数相除时,由于小数点以后的数字会被截断,运算结果将为整数,此时若希望得到运算结果为浮点数,必须将两整数其一或是两者都强制转换为浮点数,也就是Java输出怎么保留两位小数?接下来郑州 ...

  9. python输入半径求圆的面积、保留三位小数_编写程序,输入圆的半径,求该圆的面积与周长(保留三位小数)。 /* 程序功能:输入圆的半径,计算圆的面积与周长*/_学小易找答案...

    [编程题]从字符串中删除指定的字符.同一字母的大小写按不同字符处理. 例如:若程序执行时,输入字符串为: turbo c and Borland c++ ,从键盘上输入字符: n ,则输出后变为: t ...

最新文章

  1. 「它将改变一切」,DeepMind AI解决生物学50年来重大挑战,破解蛋白质分子折叠问题...
  2. 读取nas_NAS不够快?那就上SSD享受如火箭般的体验吧!
  3. Python中字符串的截取,列表的截取
  4. pyqt qscrollarea 设置滚动位置
  5. html 注释_java基础- Java编程规范与注释
  6. HDU - 3694 Fermat Point in Quadrangle(三分套三分/凸包)
  7. 家居市场2015惨淡收官 智能家居迎风而起前景广阔
  8. @Transactional注解导致 多数据源@DS无效 的解决方案
  9. 删了自己写的代码?判刑10个月!
  10. MyBatis复习(八):MyBatis 分页插件 PageHelper
  11. 跟繁琐的命令行说拜拜!Gerapy分布式爬虫管理框架来袭!
  12. SAP License:统驭科目的集成修改
  13. [傅里叶变换及其应用学习笔记] 十. 卷积与中心极限定理
  14. Jenkins构建步骤图解
  15. java 类加载器卸载,【深入明白Java虚拟机 】类加载器的命名空间以及类的卸载...
  16. SQL 2012 镜像 图解(解决1418)
  17. 相机模型与坐标转换!
  18. 能力素质有所欠缺_任职资格体系之七:员工能力评价模型
  19. “中国会员电商第一股”云集的反爬虫攻防战 | 产业安全专家谈
  20. 通过Adb无需ROOT卸载手机内置APP

热门文章

  1. 期末前端web大作业——动漫客栈响应式bootstarp(7页) 排版整洁,内容丰富,主题鲜明
  2. Docker——使用docker工具管理软件/组件的运行,镜像、容器、数据卷的基本概念,常用指令,使用docker搭建Java微服务运行环境
  3. 丈人/丈母娘,岳父/岳母、妈/母亲/娘 的解释
  4. 【JS基础】JavaScript中的void 0
  5. java:编写一个求平方的窗体
  6. 基于安卓/微信小程序的个人健康打卡系统
  7. Phun-有趣的二维物理引擎
  8. Visual Studio 2019 下Python的开发环境搭建
  9. 量子信息-学习记录13
  10. iOS App 转移 图文详解