回归分析法主要解决的问题;

1、确定变量之间是否存在相关关系,若存在,则找出数学表达式;

2、根据一个或几个变量的值,预测或控制另一个或几个变量的值,且要估计这种控制或预测可以达到何种精确度。

线性回归模型的五个基本假设:

1.零均值假定:假设随机扰动项的期望或均值为零

2.同方差和无自相关假定:假设随机扰动项互不相关且方差相同

3.随机扰动项与解释变量不相关假定:假设随机扰动项与自变量的协方差为0

4.无多重共线性:假设各解释变量之间不存在线性相关关系

5.正态性假定:假设随机扰动项服从正态分布

-------------下面分析不符合基本假设时的情况----------


1.关于多重共线性

一、产生多重共线性的背景

1.经济变量之间具有共同变化趋势;

2.模型中包含滞后变量

3.利用截面数据也可能出现多重共线性

4.样本数据自身的yuanyin

二、完全多重共线性产生的后果

1.参数的估计值不确定

2.参数估计量的方差很大

三、不完全多重共线性产生的后果

1.参数的方差增大

2.对参数估计时,置信区间趋势增大

3.严重多重共线性时,假设检验容易做出错误判断

4.R-square较高,F-检验较高,t-检验不显著

四、检验

1.简单相关系数检验法:一般而言,如果每两个解释变量的简单相关系数(零阶相关系数)比较高,如大于0.8,则可认为存在着较严重的多重共线性

2.方差扩大因子法(variance inflation factor)

3.特征根分析:当矩阵(XX‘)至少有一个特征根近似为零时,X的列向量间必存在复共线性

五、修正

1.提出一些不重要的解释变量:可以首先提出方差扩大因子最大者所对应的自变量,依次剔除,直到消除多重共线性为止

2.增大样本容量:尽可能使样本容量n远大于自变量个数p

3.回归系数的有偏估计:以有偏估计为代价来提高估计量稳定性的方法,如岭回归法、主成分法、偏最小二乘法

2.关于异方差性

一、产生原因

1.模型设定误差:模型中略去了重要解释变量

2.测量误差的变化:抽样技术、数据收集处理方法等所导致的观测误差

3.截面数据中总体各单位的差异

二、产生后果

1.参数估计值虽然是无偏的,但不是最小方差线性无偏估计

2.参数的显著性检验失效

3.回归方程的应用效果极不理想

三、诊断

1.残差图分析法:残差项的散布是随机的,无任何规律

2,Goldfeld-Quanadat检验:(大样本检验且基本满足只有异方差性不满足)将样本分为两个部分,然后分别对两个样本进行回归,并计算比较两个回归的剩余平方和是否有明显差异

3.White检验:在大样本的情况下,用残差平方作为方差的估计值,做其对常数项、解释变量、解释变量的平方及其交叉乘积等所构成的辅助回归,利用辅助回归相应的检验统计量来判断

2.等级相关系数检验法(Spearman检验)

四、修正

加权最小二乘法估计:对较小的残差平方给予较大的权数

3.关于自相关性(Autocorrelation)

一、产生原因

1.经济系统的惯性

2.经济活动的滞后效应

3.数据处理造成的相关

4.蛛网现象

5.模型设定偏误

二、产生后果

1.参数的估计值不再具有最小方差线性无偏性

2.均方误差MSE可能严重低估误差项的方差

3.容易导致对t值评价过高,常用的F检验和t检验失效

4.最小二成估计量对抽样波动变得非常敏感

5.如果不加处理地运用普通最小二乘法估计模型参数,用此模型进行预测和结构分析将会带来较大的方差甚至错误的解释。

三、诊断

1.图示检验法:残差散点图

2.自相关系数法:ρ∈[-1,1]

3.D.W检验(适用于小样本,只能用于具有一阶自回归形式的序列相关问题):ρ的估计

四、修正

1.迭代法

2.差分法:用增量数据代替原来的样本数据,将原来的回归模型变为差分形式的模型。一阶差分法的应用条件是自相关系数ρ=1.


----------

R基本代码:

f->lm(formula,data=data.frame) #其中formula为模型公式,data为数据框

summary(f)#对模型做出相应的检验

---------

一些英语单词:

1.anova,Analysis of Variance,方差分析;

2.coefficient,美[ˌkoʊɪˈfɪʃnt] n.系数;

3.deviance,英['di:vɪəns]美[ˈdivɪəns] n.偏常,异常,异常行为;

4.residuals,英[rɪ'zɪdʒʊəlz]美[rɪ'zɪdʒʊrlz] 剩余误差;

----------

【一些附加:相关分析与回归分析的区别与联系】

//区别 :

1.相关分析中涉及的变量不存在自变量和因变量的划分问题,变量之间的关系是对等的;而在回归分析中,则必须根据研究对象的性质和研究分析的目的,对变量进行自变量和因变量的划分。因此,在回归分析中,变量之间的关系是不对等的。

2.在相关分析中所有的变量都必须是随机变量;而在回归分析中,自变量是确定的,因变量才是随机的,即将自变量的给定值代入回归方程后,所得到的因变量的估计值不是唯一确定的,而会表现出一定的随机波动性。

3.相关分析主要是通过一个指标即相关系数来反映变量之间相关程度的大小,由于变量之间是对等的,因此相关系数是唯一确定的。而在回归分析中,对于互为因果的两个变量 (如人的身高与体重,商品的价格与需求量),则有可能存在多个回归方程。

//联系:

相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。

----------

参考资料:

[1]R统计建模与R软件(薛毅)

[2]实用回归分析,第二版(何晓群)

[3]计量经济学,第三版(庞皓)

[4](可参考)回归分析的五个基本假设https://blog.csdn.net/Noob_daniel/article/details/76087829

回归分析-(多元)线性回归分析基础( Linear Regression)相关推荐

  1. [Step By Step]SAP HANA PAL多元线性回归预测分析Linear Regression实例FORECASTWITHLR(预测)...

    一元线性回归算法说明: http://www.cnblogs.com/omygod/archive/2013/05/12/3073783.html 多元线性回归算法说明: http://www.cnb ...

  2. 5.1 多元线性回归分析

    在本章中,我们将从线性回归模型开始,它是最简单的模型之一. 数据集来自于UIC数据集中的能效数据集,该数据及用来分析建筑的供热负荷能效和制冷负荷能效,其中自变量有8个,因变量有两个,实例主要分析8个自 ...

  3. 数学建模-7.多元线性回归分析

    多元线性回归分析 回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想解决 回归分析的任务:通过研究自变量X和因变量Y的相关关系(注意相关性≠因果性),尝试解释 ...

  4. R语言计量(一):一元线性回归与多元线性回归分析

    文章目录 一.数据调用与预处理 二.一元线性回归分析 三.多元线性回归分析 (一)解释变量的多重共线性检测 (二)多元回归 1. 多元最小二乘回归 2. 逐步回归 (三)回归诊断 四.模型评价-常用的 ...

  5. 基于Python的多元线性回归分析

    一.多元线性回归分析(Multiple regression) 1.与简单线性回归相比较,具有多个自变量x 2.多元回归模型 其中是误差值,与简单线性回归分析中的要求特点相一致.其余的系数和截距为参数 ...

  6. 【数学建模笔记】【第七讲】多元线性回归分析(一): 回归分析的定义、对于线性的理解以及内生性问题的探究

    多元线性回归分析 回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想来解决.回归分析的任务就是,通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制, ...

  7. 【数学建模】多元线性回归分析

    多元线性回归分析 概念 目的:作出以多个自变量估计因变量的多元线性回归方程. 资料:因变量为定量指标:自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换. 用途:解释和预报. 意义:由于事物 ...

  8. 数学建模学习笔记(9)多元线性回归分析(非常详细)

    多元线性回归分析 1.回归分析的地位.任务和分类 2.数据的分类 3.对线性的理解.系数的解释和内生性 4.取对数预处理.虚拟变量和交互效应 5.使用Stata进行多元线性回归分析 6.异方差 7.多 ...

  9. 多元线性回归matlab代码_医学统计|多元线性回归分析

    回归分析的定义:回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法.运用十分广泛.其表达形式为y = w'x+e,e为误差服从均值为0的正态分布.回归分析中,只包括一个自变量和一个 ...

  10. python多元线性回归实例_关于多元线性回归分析——PythonSPSS

    原始数据在这里 1.观察数据 首先,用Pandas打开数据,并进行观察. import numpy import pandas as pd import matplotlib.pyplot as pl ...

最新文章

  1. iphone 11维修 服务器,苹果官方承认!iPhone 11有这个重大问题,将免费维修
  2. 盘点丨2017年人工智能带火了哪些词
  3. rtp发送 h265
  4. “约见”面试官系列之常见面试题之第四十六篇web标准理解和认识(建议收藏)
  5. 消息队列控制灯代码_代码实现RabbitMQ死信队列的创建
  6. 云计算与分布式系统课程学习笔记(一)——云计算简介
  7. MySQL循环结构例题_Mysql:循环结构
  8. Overfeat图片分类、定位、检测
  9. 【Unity3D插件】VOXL插件分享《多人沙盒游戏插件》
  10. 【OVRP问题】基于鲸鱼优化算法求解开放式车辆路径问题附matlab代码
  11. 如何评价@左耳朵耗子 的《关于阿里云经典网络的问题》?
  12. 信息检索与利用(第三版)第二章信息资源与信息源
  13. C#实现百度地图附近搜索调用JavaScript函数
  14. 职业规划-自动化测试
  15. sony6000正在连接服务器,极速对焦+11张每秒连拍 Sony A6000评测
  16. 让my97 datepicker兼容ie9、ie10、ie11
  17. Unity3d Ugui 20 Grid Layout Group Aspect Ratio Fitter
  18. 从python’s revenge看python反序列化
  19. [多点触控测试]不用app,手机怎么测试屏幕触控点数
  20. 机器学习入门基础(一)

热门文章

  1. db_connection.execute(sql_str, *args)执行sql语句
  2. 用xlwings直接调用excel打开xlsx文件
  3. 如何画一个精致的思维导图
  4. 蜘蛛池的作用与工作原理(公羊优链蜘蛛池)
  5. 阿里新零售中的智能补货(I)— 库存模型
  6. java nanotime单位_java – System.nanoTime()的精度与精度
  7. 【文献学习】海上信道系统知识体系详解--附思维导图
  8. 国家信息安全水平考试NISP一级模拟题(02)
  9. 小米盒子,一个说皇帝没穿衣服的小孩
  10. 智能车竞赛·通过虚拟示波器实现电机PID调参