双变量OLS回归模型(Python3)
模型为Y=B1+B2X+u
Y—平均小时工资
X—读书年数
import statsmodels.api as sm
Y=[4.4567,5.77,5.9787,7.3317,7.3182,6.5844,7.8182,7.8351,11.0223,10.6738,10.8361,13.615,13.531]
X=[6,7,8,9,10,11,12,13,14,15,16,17,18]
X1=sm.add_constant(X)#在X前加上一列常数1,方便做带截距项的回归
model = sm.OLS(Y,X1)
results = model.fit()
print(results.params)
print(results.summary())
得到回归方程Y=-0.0145+0.7241X
说明读书年数每增加一个单位,平均小时工资增加0.7241个单位,截距项没有实际意义。
输出结果如下:
样本容量n=13
残差平方和RSS的自由度=n-2=11
回归平方和ESS的自由度=1
R^2=0.908 ,表明 X 解释了Y的约90.8%的变异,拟合效果很好
对回归系数的t-检验:H0:Bi=0,H1:Bi≠0 (置信水平α=0.05,统计量t=(bi-Bi)/se(bi))
b1=-0.0145 ,p值=0.978>0.05, 不拒绝原假设,认为B1的值=0,b1的t-检验不显著,回归系数b1未通过t-检验(考虑过原点模型?)。
b2=0.7241 ,p值=0.000表示当自由度为n-2=11时,得到一个t值≥现在的t值(=10.406)的概率是0.000
p值=0.000<0.05, 拒绝原假设,认为B2的值≠0,b2的t-检验显著,回归系数b2通过了t-检验。
对回归模型的F-检验(双变量模型可省略,多元回归必须做):H0:B2=0,H1:B2≠0 (置信水平α=0.05, 统计量F=ESS/(RSS/(n-2))
统计量F值=108.3,对应自由度(1,11)的p值=4.96e-07<0.05,表示如果拒绝原假设H0,犯第一类错误(弃真)的概率是4.96e-07,这个概率很小,所以拒绝原假设,认为模型的B2≠0
对残差的正态性检验(雅克-贝拉检验Jarque-Bera test):H0:残差为正态分布,H1:残差不是正态分布
JB统计量=0.829,对应的p值=0.661>0.05,不能拒绝原假设H0,认为残差服从正态分布。
双变量OLS回归模型(Python3)相关推荐
- lecture 8:OLS回归模型
先学习这个资料: OLS自编算法,不调用函数 重要的英文参考资料: Using Python for Introductory Econometrics kevinsheppard讲授Python做计 ...
- python回归模型_缺少Python statsmodels中OLS回归模型的截取
我正在进行滚动,例如在 this link( https://drive.google.com/drive/folders/0B2Iv8dfU4fTUMVFyYTEtWXlzYkk)中找到的数据集的1 ...
- python的ols模型_pythonstatsmodels中缺少OLS回归模型的截取
time X Y 0.000543 0 10 0.000575 0 10 0.041324 1 10 0.041331 2 10 0.041336 3 10 0.04134 4 10 ... 9.98 ...
- varclus变量聚类对变量有啥要求_互助问答第208期:递归的双变量probit模型问题...
递归的双变量probit模型的stata命令是什么?比如二元被解释变量为y1,内生的二元变量为t1,x1和x2是其他外生协变量,iv1为内生二元解释变量的工具变量,那么,递归双变量probit模型是否 ...
- 美赛 6:相关性模型、回归模型(十大模型篇)
目录 三.相关性模型(SPSS) 1.皮尔逊相关系数 2.皮尔逊相关系数假设检验 3.数据正态分布检验 4.斯皮尔曼相关系数 四.回归模型(Stata) 1.多元线性回归分析 2.逐步回归分析 3.岭 ...
- logit回归模型_常见机器学习模型的假设
> Photo by Thought Catalog on Unsplash 暂时忘记深度学习和神经网络. 随着越来越多的人开始进入数据科学领域,我认为重要的是不要忘记这一切的基础. 统计. 如 ...
- [DataAnalysis]定序回归模型OLM深入浅出
一.为什么使用定序回归: 定序变量介于连续变量和定类变量之间,是在测量层次上被分为相对次序的不同类别,但并不连续. 如果对定序变量使用多分类logit模型(MNL),那么会无视数据内在的排序从而导致排 ...
- 聚类分析、线性回归分析与分类分析(逻辑回归模型)
文章目录 前言 一.了解数据概况 二.单变量分析 三.可视化 四.建立模型 1.线性回归模型 ①导库.读取数据 ②了解数据概况且对后续建模进行数据处理 ③建立线性回归模型 2.逻辑回归模型 ①统计预测 ...
- 最佳回归模型选择指标——马洛斯CP值
本文介绍最佳回归模型选择指标--马洛斯CP指标,并通过示例说明选择过程及如何计算. 马洛斯CP(Mallows'Cp) 指标用于在多个不同模型中选择最佳回归模型.其计算公式为: Cp = RSSp/S ...
最新文章
- 微服务实践(七):从单体式架构迁移到微服务架构
- 常见八种安卓开发报错的方式
- 地表反射率影响因素_【热岛强度可影响城市夏季降水落区】
- LAMP平台架构浅析
- 利用ASP.NET MVC 的默认类型绑定器---将Jquery datatables中的数据强类型绑定到实体类中
- 《剑指Offer》 反转链表
- 计算机网络技术人员介绍,计算机网络技术专业介绍2021 计算机网络技术专业就业方向及前景...
- Linux常用命令(补充)--其他
- 黑客游戏未发先被黑:游戏开发商Ubisoft 和 Crytek遭勒索攻击
- webapp检测手机运动方向,可实现手机摇一摇功能的触发
- linux下mysql常用命令_linux 下 mysql 常用命令
- [框架]高并发中的惊群效应(干货多多)
- 实用的CSS3属性和使用技巧
- 【色彩管理】CMYK色彩模式详解
- Android——TextView实现真正的跑马灯效果
- 黑马程序员——多态和抽象类的相关知识
- 关于Value ‘0000-00-00 00:00:00‘ can not be represented as java.sql.Timestamp错误
- Linux-overlay启动挂载代码分析
- 解决办法: Vue cross-env NODE_ENV=production webpack --progress --hide-module
- Javascript——高级进阶
热门文章
- 学习笔记(4):Python语言家族-Python函数参数-默认参数、可变参数
- 100道Redis面试题及答案(2021最新)
- 番外篇 00-2022 元旦:四位主播居然都是“社恐”
- Qt入门教程【项目篇】Qt中linux平台的一些经验
- lucene随笔-FST(Finite State Transducer)有限状态传感器
- 文件管理精灵 v3.46 bt
- SpringSecurity自定义Filter的ignoring()失效问题源码分析
- Mysql实现根据经纬度坐标查询周围区域范围内的所有坐标,并按距离进行排序
- 更新系统后iphone6s无服务器,iPhone6S升级iOS14:出乎意料的流畅
- 在线实现微信跳转浏览器接口,一键跳转浏览器下载App/打开URL尽在Elephant-Jump