R语言与点估计学习笔记(刀切法与最小二乘估计)
一、 刀切法(jackknife)
刀切法的提出,是基于点估计准则无偏性。刀切法的作用就是不断地压缩偏差。但需要指出的是缩小偏差并不是一个好的办法,因为偏差趋于0时,均方误差会变得十分大。而且无偏性只有在大量重复时才会表现出与真值的偏差不大。Jackknife的想法在于:既然样本是抽出来的,那我在作估计、推断的时候“扔掉”几个样本点看看效果如何。
例如我们来看使用刀切法估计正态分布N(2,25)的方差,我们认为样本的修正方差是关于总体方差的一个估计量使用刀切法:
>x<-rnorm(100,2,5)
>jack<-function(x){
+jackknife<-0
+for(i in 1:length(x)) jackknife[i]=length(x)*var(x)-(length(x)-1)/length(x)*sum(var(x[-i]))
+ jackknife
+ }
>mean(jack(x))/length(x)
[1]26.07598
> var(x)
[1]26.33671
可以看出刀切法得到的估计量更接近总体方差。
关于刀切法,也不仅仅只是用来做参数估计的,他的用法与之前提到的bootstrap类似。
二、最小二乘估计
虽然MLe是很好的参数估计办法,它过分依赖总体分布。在不知道总体分布的情况下,又只知道一组数据,那么LSE将会是一个不错的选择。关于LSE的相关理论你可以参考任意一本数理统计的教材,比如前面提到的王兆军《数理统计讲义》(这个百度文库里有)
下面介绍一下R中的做回归的函数lm,用法如下:
lm(formula, data, subset, weights, na.action,
method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE,
singular.ok = TRUE, contrasts = NULL, offset, ...)
仅以R中给出的example中的数据作为例子:
> ctl <-c(4.17,5.58,5.18,6.11,4.50,4.61,5.17,4.53,5.33,5.14)
> trt <-c(4.81,4.17,4.41,3.59,5.87,3.83,6.03,4.89,4.32,4.69)
> group <- gl(2,10,20,labels=c("Ctl","Trt"))
> weight <- c(ctl, trt)
> lm.D9 <- lm(weight ~ group)
> lm.D9
Call:
lm(formula = weight ~ group)
Coefficients:
(Intercept) groupTrt
5.032 -0.371
> summary(lm.D9)
Call:
lm(formula = weight ~ group)
Residuals:
Min 1Q Median 3Q Max
-1.0710 -0.4938 0.0685 0.2462 1.3690
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.0320 0.2202 22.850 9.55e-15 ***
groupTrt -0.3710 0.3114 -1.191 0.249
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.6964 on 18 degreesof freedom
Multiple R-squared: 0.07308, Adjusted R-squared: 0.02158
F-statistic: 1.419 on 1 and 18 DF, p-value: 0.249
可以得到常数项为5.0320,一次项系数为-0.3710
关于最小二乘估计,在时间序列模型的参数估计中也有用,在时间序列分析的学习笔记中会提到
R语言与点估计学习笔记(刀切法与最小二乘估计)相关推荐
- R语言与点估计学习笔记(矩估计与MLE)
众所周知,R语言是个不错的统计软件.今天分享一下利用R语言做点估计的内容.主要有:矩估计.极大似然估计.EM算法.最小二乘估计.刀切法(Jackknife).自助法(Bootstrap)的相关内容. ...
- R语言与点估计学习笔记(EM算法与Bootstrap法)
一.EM算法 EM算法是一种在观测到数据后,用迭代法估计未知参数的方法.可以证明EM算法得到的序列是稳定单调递增的.这种算法对于截尾数据或参数中有一些我们不感兴趣的参数时特别有效. EM算法的步骤为: ...
- 语言 提取列名_学习健明老师发布的R语言练习题的学习笔记(二)
学习者:骆栢维 题目来源:生信基石之R语言 中级10 个题目:http://www.bio-info-trainee.com/3750.html 备注:本文为笔者学习健明老师GitHub答案代码的学习 ...
- R语言与机器学习学习笔记(分类算法)
转载自:http://www.itongji.cn/article/0P534092014.html 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经 ...
- 【转载】R语言与数据挖掘学习笔记
(1):数据挖掘相关包的介绍 今天发现一个很不错的博客(http://www.RDataMining.com),博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整 ...
- R plot图片背景设置为透明_学习健明老师发布的R语言练习题的学习笔记(一)...
学习者:骆栢维 题目来源:生信基石之R语言 初级10 个题目:http://www.bio-info-trainee.com/3793.html 备注:本文为笔者学习健明老师GitHub答案代码的学习 ...
- R语言dplyr包学习笔记(吐血整理宇宙无敌详细版)
出处:AI入门学习 dplyr包主要用于数据清洗和整理,主要功能有:行选择.列选择.统计汇总.窗口函数.数据框交集等是非常高效.友好的数据处理包,学清楚了,基本上数据能随意玩弄,对的,随意玩弄,简直大 ...
- R语言基础知识-学习笔记汇总
B站课程:生信必备技巧之R语言基础教程全集的代码笔记 1.R语言包安装 rm(list = ls()) # 设置镜像: options()$repos options()$BioC_mirror #o ...
- R语言入门(学习笔记)
文章目录 软件安装及更新 安装R语言 安装Rstudio(集成开发环境,在安装R语言后再安装) R版本更新 软件操作 窗口简介 界面设置 编码转换 快捷键 基础语法 注释 赋值 清除 帮助文档 R包 ...
最新文章
- BAD SLAM:捆绑束调整直接RGB-D SLAM
- vse职位的全称_吉利汽车VSE岗(SE5AGBRC-M工资待遇怎么样 - 浙江吉利控股集团有限公司 - 职友集...
- 「PKUWC2018」随机游走
- oracle需求分析,8-oracle_分析函数(二)
- python运行界面黑色,在Python中使用open执行轮廓检测后,如何使图像的背景变黑?...
- MATLAB生成数组
- Robust Representation Learning with Feedback for Single Image Deraining论文解读
- python用lda主题_python下进行lda主题挖掘(二)——利用gensim训练LDA模型
- C语言误差用什么变量,C语言-实型变量
- cf446 div2
- 计算机应用基础——计算机硬件(三)
- js和css动态画出一只安卓机器人,附代码
- 有关Word创建英语练字模板的宏
- oracle 判断节气,FullCalendar应用——整合农历节气和节日
- np.random.rand()函数
- 阿里巴巴Java开发手册摘要(一)
- 三角形二(海伦公式)
- linux命令行恢复回收站,Trash-Cli:Linux 上的命令行回收站工具
- QT---之Q_D和d指针概念2
- java无敌_12 款做Java后台管理系统的项目,超级无敌好用!
热门文章
- 程序员拿到阿里巴巴的入职通知书,却因为工资“低”不想去?狂
- 员工手册作为企业内部管理的下意义和价值!
- CUDA编程第三章: CUDA执行模型
- .net 中,runat=server和页面运行后台指令的冲突现象
- 计算机翻转课堂教案,《计算机基础》课程翻转课堂教学模式研究与实践
- Cesium剖面分析(获取剖面高程示意图)
- traefik使用 -- consul kv动态配置
- 2011年到2018年各省数字金融普惠指数
- 初始化springboot项目
- 快速学习 Python 的全套14张思维导图(附高清版下载)