R语言笔记3——回归分析(EDA OLS Power)

文章目录

  • R语言笔记3——回归分析(EDA OLS Power)
    • 探索性数据分析EDA
      • 用scatterplot3d画三维散点图
    • 最小二乘法OLS
    • 功效计算

探索性数据分析EDA

# Exploratory data analysis
#install.packages("faraway")
library(faraway)
head(pima)
summary(pima)## sanity checks(合理性检查)
sort(pima$diastolic) #sort()函数是对向量进行从小到大的排序
pima$diastolic[pima$diastolic==0] <- NA
pima$glucose[pima$glucose==0] <- NA
pima$triceps[pima$triceps==0] <- NA
pima$insulin[pima$insulin==0] <- NA
pima$bmi[pima$bmi==0] <- NA## factors - categorical variables
head(pima$test)
pima$test <- factor(pima$test)
summary(pima$test)
levels(pima$test) <- c('negative','positive')
summary(pima$test)## Histogram
hist(pima$diastolic)## Kernel density estimate
plot(density(pima$diastolic, na.rm = TRUE)) #删除缺失值## Scatterplot
plot(diabetes~diastolic,pima)## side-by-side boxplot
boxplot(diabetes~test,pima)

用scatterplot3d画三维散点图

#install.packages("scatterplot3d")
library(scatterplot3d)
data(iris)
head(iris)
length(unique(iris$Species))# Basic 3d graphics
scatterplot3d(iris[,1:3])
colors <- c("#999999", "#E69F00", "#56B4E9")
colors <- colors[as.numeric(iris$Species)]
scatterplot3d(iris[,1:3], pch = 16, color = colors)#pch表示点的样式,pch:15~20点为实心
scatterplot3d(iris[,1:3], pch = 16, type = "h", color = colors)

最小二乘法OLS

响应变量:the lean(Y)

解释变量:year(X)

# 最小二乘法的例子
## data input
towerpisa <- list()
towerpisa$year <- c(75:87,116)
towerpisa$lean <- c(642,644,656,667,673,688,696,698,713,717,725,742,757)
print(towerpisa)## scatter plot
attach(towerpisa)#为直接引用数据集中的元素
plot(year[1:13], lean[1:13], xlab = "Year", ylab = "Lean", las=1)#las表示刻度数字与坐标轴的方向
lines(lowess(year,lean), col=2)#lowess 是一种局部加权回归散点图平滑化技术## 线性回归分析
bc <- lm(lean ~ year) # R语言线性回归函数 lm()
print(summary(bc))
e = bc$residuals
sse = 0
for( i in 1:length(e)){sse = sse + e[i]^2
} #SSE
mse = sse/11 #df = 13-2 =11
sqrt(mse) # residual standard error这么计算的结果与回归lm得出的一样## residual plot
plot(year[1:13], bc$residuals, las=1, ylab = "Residual", xlab = "Year")
abline(h=0)## QQ plot #Q-Q 图通过将两个概率分布的相同分位数点的值映射为 x 和 y 轴。
qqnorm(bc$residuals, datax = T)
qqline(bc$residuals, datax = T)

功效计算

# Power for regression## only these values need to be changed
n = 25
sig2 = 2500
ssx = 19800
beta1 = 1.5
alpha = 0.05## function of calculating power
find_power <- function(n,sig2,ssx,beta1,alpha){sig2b1 = sig2/ssxdf = n-2delta = beta1/sqrt(sig2b1)c = qt(1 - alpha/2, df) #非中心t分布的分位数函数power = 1 - pt(c,df,delta) + pt(-c,df,delta) #pt(c,df,delta)=P(T<c),T~t(df,delta)#print(power)return(power)
}##example
power = find_power(n,sig2,ssx,beta1,alpha)
beta1 = seq(-2,2,by=0.05)
power_vec = rep(0,length(beta1))
for (i in 1:length(beta1)) {power_vec[i] = find_power(n,sig2,ssx,beta1[i],alpha)
}plot(power_vec ~ beta1, type="l",ylab="Power",main="Power for the slope in simple linear regression")

R语言笔记3_回归分析(EDA OLS Power)相关推荐

  1. R语言效用分析 ( 效能分析、Power analysis)、除了pwr包之外还有其它包、例如、基因研究中的效能分析、MBESS包可用于各种形式的效能分析和最少样本量确定、其他效用分析包的简要介绍

    R语言效用分析 ( 效能分析.Power analysis).除了pwr包之外还有其它包.例如.基因研究中的效能分析(power analysis).MBESS包可用于各种形式的效能分析(power ...

  2. R语言效用分析 ( 效能分析、Power analysis)确定样本量、假设检验与两类错误、pwr包进行效用分析 ( 效能分析、Power analysis)的常用函数列表

    R语言效用分析 ( 效能分析.Power analysis)确定样本量.假设检验与两类错误.pwr包进行效用分析 ( 效能分析.Power analysis)的常用函数列表 目录

  3. R语言笔记1:t检验和Wilcoxon检验

    转自新浪博客,转载地址:http://blog.sina.com.cn/s/blog_427c24ae0102wg7n.html 1.t检验 数据是高血压患者治疗前后舒张压的变化,这个内容最熟悉不过了 ...

  4. R语言笔记4_模型诊断(关于残差)

    R语言笔记4_模型诊断(关于残差)及模型补救(Box-Cox变换) 文章目录 R语言笔记4_模型诊断(关于残差)及模型补救(Box-Cox变换) 检验线性关系 检验方差齐性 检验残差正态性 检验离群值 ...

  5. R语言笔记——”org.Hs.eg.db“脱坑记录

    R语言笔记--"org.Hs.eg.db"脱坑记录 "org.Hs.eg.db"是发布在bioconductor平台上面的一个数据库文件,该包中装有较多的主流数 ...

  6. R语言普通最小二乘回归分析

    回归分析都是统计学的核心.它其实是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量.效标变量或结果变量)的方法.普通最小二乘(OLS)回归 包括简单线性回 ...

  7. R语言笔记6:在R中写一些简单的函数、functions基础和作用域

    R语言基础系列: 1数据类型(向量.数组.矩阵. 列表和数据框) 2读写数据所需的主要函数.与外部环境交互 3数据筛选--提取对象的子集 4向量.矩阵的数学运算 5控制结构 Your first R ...

  8. R语言笔记1:数据类型(向量、数组、矩阵、 列表和数据框)

    宏基因组按:科研中数据分析解读占用了我们太多时间,学习R语言是生物测序领域数据(reads count表)分析及可视化的首选.举个例子,扩增子分析从fastq到OTU表至多是de novo或refer ...

  9. R语言笔记-R语言数据挖掘方法及应用--1

    参考-<R语言数据挖掘方法及应用>-薛薇,学习笔记 --1---------------------------------------------- search() 当前工作区间加载了 ...

  10. 基于R语言实现LASSO回归分析

    模拟假数据集 set.seed(0820)n <- 50p <- 25beta <- rep(0,p)beta[1:5] <- 1:5/5X <- matrix(rnor ...

最新文章

  1. C#操作Excel导入导出
  2. CSP认证201512-1 数位之和[C++题解]:模拟、水题
  3. linux kernel中local_irq_disable()、local_irq_enable()代码解读
  4. VTK:PolyData之ProcrustesAlignmentFilter
  5. mysql union_Mysql union和union all用法
  6. pymol怎么做底物口袋表面_如何系统的去做有机合成工艺优化---之实战策略
  7. UVA 11504 Dominos 强连通分量
  8. python3 -m pip install pymongo_Python3上Pymongo的SSL握手问题
  9. 2019计算机二级vb考试大纲,2019年全国计算机二级VB试题
  10. linux+企业微信+api,概述 - 企业微信API
  11. 【考研数学高数部分】泰勒展开式
  12. 方维众筹1.7短信插件短信接口开发
  13. 项目实战之旅游网(一)项目介绍 项目搭建
  14. Win10版本那么多怎么区别
  15. 计算机接口盒,将小米盒连接到旧的计算机显示器(VGA接口)
  16. 无线充电宝CE认证和FCC认证怎么办理?无线充移动电源UL报告
  17. Swing游戏开发——飞机大战
  18. nginx、php-fpm、mysql用户权限解析
  19. 曼尼托巴大学计算机科学硕士,加拿大曼尼托巴大学优势专业有哪些
  20. MVP Architecture on Android

热门文章

  1. windows无法完成格式化怎么办?
  2. matlab normx-x0_【 MATLAB 】norm ( Vector and matrix norms )(向量范数以及矩阵范数)
  3. MSN Messenger协议 【 very cool stuff 】
  4. MySQL基础篇——存储过程和函数中的变量
  5. ZOJ 3939 The Lucky Week
  6. 一.机器人概率学笔记_定位
  7. Solr Facet 统计查询
  8. 计算机磁盘文件怎么加密,win10怎样对电脑硬盘文件进行加密 windows10给电脑硬盘文件加密教程...
  9. ROS入门之——action
  10. 用UWP模仿网易云音乐的动画