【定量分析、量化金融与统计学】多元回归模型与回归推理
之前说过了一元线性回归并给出了程序,今天来说说多元回归模型(Multiple Regression Model)
目录
一、多元回归模型的简介
二、求解多元回归模型:我们使用最小二乘法为例
三、评判方法
四、推理和回归
五、模型的优化
1.排除无关的变量:
2.多重共线性:
3.超大样本推理
一、多元回归模型的简介
多元回归模型等式:
y :因变量
X1, X2:自变量
βο, βι, β2:参数
ε:误差项(解释了q自变量的线性效应无法解释y的变异性)。
二元模型的图像示意:
我们称β为坡度系数或者斜率系数:
**斜率系数βj的解释:表示自变量xj每增加一个单位,因变量y的均值的变化。(保持模型中所有其他自变量的值为常数)
多元回归方程,描述y的均值如何与x1,x2……, xq相关。
二、求解多元回归模型:我们使用最小二乘法为例
最小二乘法的条件:
- 正态性:对于任意给定的自变量x1, x2的值组合,…, xq,潜在误差项ε的总体是均值为0,方差为常数的正态分布。
- 独立性:ε的值在统计上是独立的。
最小二乘法的步骤:
三、评判方法
我们与一元线性回归一样:采用R2来评判,之前已经讲过了,这里就提一下。
四、推理和回归
统计推断:通过分析从总体中抽取的样本数据,对总体的一个或多个特征(一个或多个参数的值)作出估计和得出结论的过程。
在回归分析中,通常用推理来估计和得出如下结论:
- 回归参数β0, β1, β2,…,βa的值
- 对于自变量的特定值,因变量y的平均值和/或预测值
(1)F检验测试:测试整体回归关系
使用基于F概率分布的F检验。查看是否拒绝0假设。
(2)检测单个回归关系是否显著
- 如果βj = 0,因变量y与自变量xj之间不存在线性关系。
- 如果βj ≠ 0, y和xj之间是线性关系
我们使用t检验:
随着t的大小增加(当t在任何方向偏离零),我们更有可能拒绝回归参数βj为零的假设。
五、模型的优化
1.排除无关的变量:
- 如果实际经验表明不显著的自变量与因变量之间存在关系,则应将自变量留在模型中。
- 如果模型在自变量不显著的情况下充分解释因变量,则考虑在自变量不显著的情况下重新进行回归。
- 当b0无统计学意义时,对纳入或排除y轴截距的适当处理可能需要特别考虑。
2.多重共线性:
概念:多元回归分析中自变量间的相关性。
在个体参数显著性的t检验中,多重共线性造成的困难在于,当自变量与因变量实际上有很强的关系时,可以得出与多重共线性自变量之一相关的参数与零没有显著差异的结论。但当自变量之间的相关性很小时,就避免了这个问题。
所以要检测多重共线性,我们会用一个R语言程序在下一讲中讲述如何检测和修复多重共线性。
3.超大样本推理
当样本超大时,几乎所有自变量和因变量之间的关系都具有统计学意义
就不能再用推理来区分有意义的关系和似是而非的关系。
这是因为回归参数βj的估计量bj的潜在值的可变性取决于两个因素:
- βj表示了总体要素与xj和y之间的关系有多密切
- 估计量bj的值所基于的样本的大小
当超大样本出现时,你已经不需要进行推理了,因为巨大的样本量集合可以涵盖到任何可能的关系。
【定量分析、量化金融与统计学】多元回归模型与回归推理相关推荐
- 【定量分析、量化金融与统计学】统计推断基础(2)---样本均值分布、中心极限定理、正态分布
目录 一.前言 二.样本均值分布 三.中心极限定理 *****中心极限定理 ***大数定理与中心极限定理有什么区别? 四.正态(概率)分布 一.前言 我发现很多人学了很久的统计学,很多总是概念混淆,那 ...
- 【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)
目录 一.前言 二.假设检验的基本概念 1.假设检验的概念与目的: 2.原假设 三.假设检验的实例步骤: 例子: 一个问题: 四.不同种类的假设检验: one-sample T检验: Two-samp ...
- 【定量分析、量化金融与统计学】统计推断基础(5)---一类错误与二类错误
一.前言 这是这个系列的最后一篇,我们讲一讲什么是一类错误,什么是二类错误.这个系列统计推断基础5部分分别是: 总体.样本.标准差.标准误[定量分析.量化金融与统计学]统计推断基础(1)---总体.样 ...
- 【定量分析、量化金融与统计学】统计推断基础(3)---点估计、区间估计
一.前言 我发现很多人学了很久的统计学,仍然搞不清楚什么是点估计.区间估计,总是概念混淆,那今天我们来盘一盘统计推断基础的点估计.区间估计.这个系列统计推断基础5部分分别是: 总体.样本.标准差.标准 ...
- 【定量分析、量化金融与统计学】R语言:多元线性回归实例
今天来做一个R语言的多元线性回归的实例: 题目是这样的: 练习:度假村排名 旅游胜地,专门介绍高级度假和住宿的杂志<Spas>在"读者选择"评选的世界20家独立海滨精品 ...
- 【定量分析、量化金融与统计学】R语言方差分析ANOVA(F检验)
目录 一.前言 Fixed-effects models.Random-effects models.Mixed-effects models. 二.ANOVA使用的前提假设与假设检验 三.ANOVA ...
- 【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误
目录 一.前言 二.总体与样本 1.总体(population)的概念 2.总体的性质与参数 首先是:平均数(mean)µ 标准差(standard deviation,SD)σ希腊字母sigma 3 ...
- 【定量分析、量化金融与统计学】各种检验的H0假设与p-value究竟是什么含义
目录 一.各种检验的分类 二.事前检验 1.正态性检验 2.方差齐次性检验 3.共线性检验 4.协方差齐次性检验 三.事后检验 1.Turkey检验 2.tamhaneT2 检验 3.交叉图检验 4. ...
- 【定量分析、量化金融与统计学】纵向数据分析(1)——截面数据、时间序列数据和纵向数据
一.截面数据(Cross-sectional Data) 截面数据就是固定时间来分析其他变量同一时间内的关系. 例如:比较2022年的全国20个省市的GDP与人口,那么我们就是限定了2022年,去找G ...
最新文章
- 实训3:配置网络负载平衡服务_Linux系统配置及服务管理第十四章网络管理实战2...
- 信息系统项目管理知识--软件工程
- securecrt哪个版本好用_电脑跑分测试软件哪个好?好用的电脑跑分软件推荐
- SIP代理服务器(2)
- CCNA-第四篇-OSI模型-下
- 出现 java.lang.NullPointerException 的几种原因、可能情况
- AC日记——简单密码 openjudge 1.7 10
- 【报告分享】5G赋能中国智慧城市白皮书.pdf(附下载链接)
- centos7挂载nas存储_NAS同步百度云全攻略!一篇打尽win虚拟机、黑群、Docker操作演示...
- (转)pycharm快捷键
- SQL Server中 缓冲和池的不同点
- PyGame:Python 游戏编程入门-1
- H5:100款html5微信小游戏最新最新源码
- 好看好用的字体软件-字体下载大全提供下载
- Windows超级管理器,堪比火绒管家
- Q 系列PLC ST 语言编程笔记
- 周公恐惧流言日,王莽谦恭未篡时
- MySQL查询不同年份母亲节_日期习俗大不同,走近七个国家的母亲节!
- 图书管理系统之普通用户、超级管理员页面布局(四)
- Java中hashcode和equals详解
热门文章
- 游戏中找CALL的万能方法
- Tensorflow 模型文件结构、模型中Tensor查看
- KO02内部订单修改
- 如何撰写专利技术交底书?交底书中有哪些坑?
- Aptos VS Sui,盘点两大 Move 系新公链的创新异同
- Basic Concepts in Graphics and Architecture
- 移动端H5实现手动选择地图点的一种解决方案
- 地图中的矢量POI兴趣点
- 「一题多解」【CodeForces 85D】Sum of Medians(线段树 / 分块)
- 手机上好用的apm测试软件,在哪才能找到测apm的软件 及如合使用 – 手机爱问...