如何近似计算回归方程的预测区间?
1 预测区间与置信区间的差别
预测区间估计(prediction interval estimate):利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间。变量的估计叫预测区间,预测区间反映了单个数值的不确定性;
置信区间估计(confidence interval estimate):利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间。参数的估计叫置信区间,置信区间反映了预测均值的不确定性。
例如,有回归方程:
工作量=2*规模+3,
当规模=10, 预测的y值的平均值为23,但是工作量的实际值可以有无数个,如(23.01,23.2,22.1,22.34,…..),这些实际值会在一个区间内浮动,该区间即为预测区间。如果随机抽多个样本,比如样本1(23.01,23.2,22.1),样本2(23.2,22.1,22.34),每个样本的均值会在一个区间内浮动,该区间即为置信区间。
2 预测区间与置信区间谁窄谁宽?
平均值的预测仅存在抽样误差。单个值的预测除了抽样误差外,还有其他干扰因素,所以预测区间PI总是要比对应的置信区间CI大。
针对均值的置信区间肯定要窄一些,而具体想预测某一个体值,那区间肯定要宽,因为误差会很大。
比如,让你预测一个公司中项目的平均生产率,与让你预测一个项目的生产率,你觉得哪个误差更大呢?对于一个公司的均值,即使你什么信息都不知道,估计预测的也差不到哪儿去,而让你预测某个项目的生产率,那你可能就不知所措了。
3 如何近似计算预测区间?
3.1 预测区间的简单计算公式
如果准确计算预测区间,公式是比较复杂的,而且需要建立方程的所有样本的数据,在实践中并不推荐这么做。所以通常我们都是近似计算预测区间。
预测区间的上限=预测值+1.96 残差的标准差;
预测区间的下限=预测值-1.96 残差的标准差;
上述公式是基于回归方程的理论假设推理出来的:
线性回归中,我们假定,对于每一特定的x值,其对应的y值应该是来自一个服从某一均值和标准差的分布,y是服从正态分布的。
在建立方程之前我们对此做了假设检验。
1.96倍标准差对应的区间,就是置信度为95%的区间。
残差的标准差在我们进行回归分析时,minitab的计算结果已经给出来了:
3.2 当对Y做了变换时,预测区间如何计算
在实际建模时,如果对y做了对数变换,比如:
lny=ax+b
则此时得到的残差标准差是lny的,不是y的,所以计算lny的预测区间为:
lny预测区间上限=ax+b+1.96S
则y的预测区间上限应该是:
y=exp(ax+b+1.96S)
y的预测区间下限应该是:
y=exp(ax+b-1.96S)
如果对y做了其他变化,道理类似。
如何近似计算回归方程的预测区间?相关推荐
- R语言构建回归模型并获取对于新数据预测的预测区间实战:给出预测区间而不是一个具体的预测值、置信区间与预测区间的异同
R语言构建回归模型并获取对于新数据预测的预测区间实战:95%或者99%预测区间而不是一个具体的预测值.置信区间与预测区间的异同 目录
- 高等数学:第二章 导数与微分(3)函数微分 近似计算
§2.7 函数的微分 一.由一个例子引入微分概念 [引例]一块正方形金属薄片受温度变化影响,其边长由变到,试给出: 1.此薄片的面积的改变值. 2.用计算机摸拟边长改变量与面积改变量的对应关系 正方 ...
- Java黑皮书课后题第10章:*10.20(近似e)编程练习题5.26使用下面数列近似计算e(略),为了得到更好的精度,在计算中使用25位精度的BigDecimal
10.20(近似e)编程练习题5.26使用下面数列近似计算e(略),为了得到更好的精度,在计算中使用25位精度的BigDecimal 题目 首次尝试 代码 运行 关于揪bug 第二次尝试 代码 运行结 ...
- Java黑皮书课后题第5章:5.26(计算e)下面的数列可以近似计算e,编写程序显示i=10000、20000、30000…100000时值
5.26(计算e)下面的数列可以近似计算e,编写程序显示i=10000.20000.30000-100000时e值 题目 题目概述 代码 运算结果 题目 题目概述 5.26(计算e)下面的数列可以近似 ...
- Java黑皮书课后题第5章:**5.25(计算π)使用下面的数列可以近似计算π:4(1-1/3+1/5-1/7+……+(Math.pow(-1, i+1)/(2*i-1))
@[TOC](5.25(计算π)使用下面的数列可以近似计算π:4*(1-1/3+1/5-1/7+--+(Math.pow(-1, i+1)/(2*i-1))) 题目 题目概述 5.25(计算π)使用下 ...
- matlab 把区间等分分,MATLAB数学实验报告 定积分的近似计算
MATLAB数学实验报告 实验日期:2015年11月20日 实验名称定积分的近似计算 姓名:学号:班级: 问题背景描述: 利用牛顿-莱布尼兹公式虽然可以精确地计算定积分的值,但它仅适用于被积函数的原函 ...
- (c语言)近似计算π
(c语言)近似计算π,用前100项的乘积计算π的值. //用前100项的乘积计算π的值 #include<stdio.h> #include<stdlib.h> int mai ...
- C语言丨定积分的近似计算
我们已经知道,定积分的几何意义是曲线和两条直线.与轴所围成的曲边梯形的面积,由此我们可以得出近似计算定积分的多种算法.下面分别介绍定积分的近似计算的三种方法:矩形法.梯形法.抛物线法. 目录 矩形法 ...
- 回归预测值预测区间_机器学习之线性回归概述
线性回归是利用梳理统计学中的回归分析来确定两种或两种以上变量之间相互依赖的定量关系的一种统计分析方法. 线性回归简介 线性回归是一种有监督算法,通常被用于响应预测.分类划分.线性回归的针对的是目标变量 ...
最新文章
- python代码示例图形-Python使用matplotlib绘制三维图形示例
- 纯真IP库的结构分析及一个查询类
- 4j 禁止类输出日志_logback 日志详细讲解
- diskgeniusv4.4.0_一文上手最新Tensorflow2.0系列|TensorFlow2.0安装
- FCC 中级算法题 Where art thou
- 【转】二叉树、B树、B-树、B+树、B*树
- 智能一代云平台(三):15年上半年维护总结
- Matlab取整函数
- Matlab实现和使用神经网络的几种方式详细讲解--附代码可下载
- 【深度好文】二维图像傅里叶变换 YYDS
- “谷姐”社交搜索平台在深上线
- 黑色渐变背景css,css-渐变背景,爱了爱了。
- 机械硬盘如何克隆至固态硬盘,如何把硬盘系统克隆到固态硬盘
- 信号量sem_wait()函数的学习
- ​浅谈 Java 后端开发工程师腾讯面试经历分享总结
- FIFO,LPU,CLOCK时钟算法
- PCM开发板模块实验指导--有刷直流马达速度控制实验
- 务实java基础之集合总结
- 80x86的寻址方式及Dosbox演示
- 小案例 CSS之旋转的可乐瓶
热门文章
- 2019春第二次课程实际实验报告
- JAVA练习257-三维形体投影面积
- python语法技巧
- SpectralFormer: Rethinking Hyperspectral Image Classification with Transformers
- JavaCV/OpenCV 二维码扫描功能
- three.js 画一个旋转的立方体
- blog微服务架构代码_DDD+微服务大型案例:Uber如何从复杂的RPC微服务转向面向业务领域的微服务架构DOMA? -优步工程博客...
- Uber明年在中国将继续补贴,并大举进军100个城市!
- English story 23
- uniapp文字无缝滚动