许栩原创专栏《从入门到高手:线性回归分析详解》第9章:总体回归、置信度、置信区间及其计算方法。

多元回归方程求解后,我们分别确认了回归方程的精度和进行了回归方程的显著性验证,接下来,我们需要计算置信区间。

置信区间是回归分析的一个重要概念,但是,将回归分析应用到需求预测,并不强求引入置信区间,也就是说,用回归分析做需求预测时,可以不进行置信区间的计算,而直接进行后续的预测步骤。所以,从这一点来说,大家可以跳过本章,直接进入第10章,用线性回归分析进行预测。

不过,我们做回归分析,非常有必要懂得相关置信区间的概念、逻辑和计算方法。所以,本章,我还是对此做些基础的介绍,主要内容如下。(本专栏总目录如下图。)

1、总体回归。

2、置信度与置信区间。

3、置信区间的计算。

一、总体回归。

要了解置信区间,我们需要先了解回归分析的另一个概念,总体回归。

我们先看总体,请看下图。

回归火锅店的这一组数据中,气温为6℃,没有折扣(即折扣为1)这种情况有3天,分别是1月8日、12日和16日。但是,这仅仅是14天的数据,如果将数据放大,那么,以前肯定也有“气温为6℃,没有折扣”这种情况,以后(即需要预测的未来)也同样会存在这种情况。我们可将“气温为6℃,没有折扣”这种情况认为是一个总体,而1月8日、12日和16日是从这个总体中抽出的三个个体。

总体回归表明的是因变量y的平均状态随自变量x变化的规律。

回归分析认为,气温为x1℃,折扣为x2的业绩服从平均值A1x1 A2x2 B、标准差为σ的正态分布。(这个原理比较复杂,这里就不展开,大家可以理解为这是回归分析的规定。)

我们将y=A1x1 A2x2 B称为总体回归。

我们可以这么简单的理解总体回归:我们所做的回归分析是在已知的部分数据的基础上进行的,我们所做的其实是样本回归;而总体回归是未知的,是对全部数据所进行的回归分析。

因为总体是未知的,我们进行回归分析(样本回归),事实上就是用样本回归去估算总体回归。

二、置信度与置信区间。

上一章我有提到过置信度,置信度可以粗暴的理解为对回归模型运行结果有把握的程度。

但要真正的理解置信度,就要先理解置信区间。

置信区间(Confidence interval)是指由样本统计量所构造的总体参数的估计区间。【引自百科定义】

因数据极为庞大,不管是回归分析,还是统计本身,我们都不可能去统计和分析全部数据,统计学上一般采取的做法是,用样本去估计总体,也就是用局部去估计全部。因为样本、局部毕竟是总体中的一部分,所以,用样本估算的总体数据存在一定不可靠性,但是,用样本估算的总体数据又在真正的数据一定的范围之内,这个一定的范围之内就是置信区间。

举个例子,天气预报,气象台发布气温时,一般播报多少度到多少度之间,比如明天气温20℃~30℃之间,这个20℃~30℃之间,就是置信区间。

但是,这个20℃~30℃的置信区间有多大的可信度呢?有多大的把握呢?一般用百分比来表示,比如明天气温有90%的可能在20℃~30℃之间,这个可信度,这个把握度,这个90%,就是置信度。

需要强调的一点是,置信度并不是在求出置信区间后判断出来的。实际上,置信度是在求解置信区间之前,同分析者自己“决定”的,即不同的的置信度,会带来不同的置信区间。。

通常情况下,95%是最常采用的置信度。置信度不是越高越好

java求线性回归置信区间,线性回归分析详解9:总体回归、置信度、置信区间及其计算方法...相关推荐

  1. java 求正割_Java 反射机制详解

    动态语言 动态语言,是指程序在运行时可以改变其结构:新的函数可以被引进,已有的函数可以被删除等在结构上的变化.比如众所周知的ECMAScript(JavaScript)便是一个动态语言.除此之外如Ru ...

  2. 回归分析详解:一文说清回归、线性回归、非线性回归、Logistic回归

    回归分析详解:一文说清回归.线性回归.非线性回归.Logistic回归 文章大纲 回归分析是什么? 回归.线性回归.非线性回归.Logistic回归的不同? 实际例子解释不同回归方法的应用场景 文章大 ...

  3. 线性表详解(静态链表、单链表、双向链表、循环链表)

    目录 申明 1. 线性表的定义 2. 线性表的抽象数据类型 3. 线性表的顺序存储结构 3. 1 顺序存储定义 3. 2 顺序存储方式 3. 3 数据长度与线性表长度区别 3. 4 地址计算方法 4. ...

  4. 2015年 第06届 蓝桥杯 Java B组 决赛真题详解及小结

    蓝桥杯 Java B组 省赛决赛 真题详解及小结汇总[2013年(第4届)~2020年(第11届)] 第11届 蓝桥杯-第1.2次模拟(软件类)真题-(2020年3月.4月)-官方讲解视频 说明:大部 ...

  5. 2016年 第07届 蓝桥杯 Java B组 决赛真题详解及小结

    蓝桥杯 Java B组 省赛决赛 真题详解及小结汇总[2013年(第4届)~2020年(第11届)] 第11届 蓝桥杯-第1.2次模拟(软件类)真题-(2020年3月.4月)-官方讲解视频 说明:大部 ...

  6. 2018年 第09届 蓝桥杯 Java B组 决赛真题详解及小结

    蓝桥杯 Java B组 省赛决赛 真题详解及小结汇总[2013年(第4届)~2020年(第11届)] 第11届 蓝桥杯-第1.2次模拟(软件类)真题-(2020年3月.4月)-官方讲解视频 说明:大部 ...

  7. 判断数组中某个元素除自身外是否和其他数据不同_算法工程师要懂的3种算法数据结构:线性表详解...

    算法思想有很多,业界公认的常用算法思想有8种,分别是枚举.递推.递归.分治.贪心.试探法.动态迭代和模拟.当然8种只是一个大概的划分,是一个"仁者见仁.智者见智"的问题. 其实这些 ...

  8. Java集合(四) LinkedList详解

      在上篇文章Java集合(三) ArrayList详解的学习和源码分析中,我们知道ArrayList是以数组实现,它的优势是查询性能高,劣势是按顺序增删性能差.如果在不确定元素数量的情况时,不建议使 ...

  9. Java中大数据数组,Java基础学习笔记之数组详解

    摘要:这篇Java开发技术栏目下的"Java基础学习笔记之数组详解",介绍的技术点是"java基础学习笔记.基础学习笔记.Java基础.数组详解.学习笔记.Java&qu ...

最新文章

  1. 魔幻!2021年,6种将死的编程语言?
  2. csv注入java怎么解决_CSV Injection(CSV注入)
  3. 获取服务器信息info
  4. ASP.NET获取任意网页HTML代码
  5. 分享一个数据产品的PRD
  6. 平时喜欢使用的软件总结 欲善其事,必先利其器
  7. springboot 404_Spring Boot(四) 异常处理
  8. glassfish启动后不能进入部署页面_Flink on Yarn三部曲之二:部署和设置
  9. 深度学习推荐模型-DeepFM
  10. Mac OS X Tips
  11. hex2bin() 函数
  12. 硬盘数据丢失原因?硬盘数据恢复方法
  13. 来自太阳,爱情的故事,生存和欢乐的影子上升 - 免费节选
  14. html5基础了解---前端结构
  15. vue.js - 收藏集 - 掘金
  16. 微信公众平台测试号推送思路
  17. 精通spring4.x 非扫描_巫师财经退出b站的争议,怎样评论才能显得比较精通合同法...
  18. 贝叶斯神经网络BNN
  19. 旺店通与金蝶云星空对接集成采购入库单接口
  20. web端 网页端分享功能的实现

热门文章

  1. Nvidia MX150安装Tensorflow-GPU版,Pycharm使用Keras
  2. 移动端,录音之前判断是否已经获取录音权限
  3. Html node.js开源项目,2020年面向开发人员的十大NodeJS框架
  4. DAMA国际认证 CDMP题库预览题 带翻译和解析
  5. 华为eNSP模拟器 AC控制器+AP组网配置
  6. 达梦数据库关键字与字段名冲突
  7. python导入pyx文件_pyx文件 生成pyd 文件用于 cython调用
  8. C语言批量创建 文件
  9. 一些机器学习相关的数学知识
  10. 教你安装低版本iPhone同步软件iTunes