python虚拟变量回归_虚拟变量回归中的截距项问题
zhangli106601 发表于 2010-5-15 14:14
本人在做虚拟变量回归时如果包含截距项那么拟合优度R平方值比较低为0.7多,截距项和其他回归系数值均显著;但是如果去掉截距项R平方值会达到0.998,截距项和其他回归系数值也均显著。现在想请教下各位大虾到底要不要截距项啊???You need to post how you did it. According the limited information above, it is imposible.
Here is a simulation for your problem. The coef for x and r-square are the same. The only difference is the interpretation of dummy(c=0,1,2) + intercept. They are same.
data t1;
do i = 1 to 100;
c=mod(i,3);
x=rannor(123); error=rannor(123);
y=c+1*x + error;
output;
end;
run;
proc glm data=t1;
class c;
model y=c x/solution;
run;
quit;
proc glm data=t1;
class c;
model y=c x/solution noint;
run;
quit;
***********************
The SAS System 14:05 Saturday, May 15, 2010 30
The GLM Procedure
Class Level Information
Class Levels Values
c 3 0 1 2
Number of Observations Read 100
Number of Observations Used 100
The SAS System 14:05 Saturday, May 15, 2010 31
The GLM Procedure
Dependent Variable: y
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 3 154.4179842 51.4726614 60.01 <.0001>
Error 96 82.3390611 0.8576986
Corrected Total 99 236.7570452
R-Square Coeff Var Root MSE y Mean
0.652221 111.3991 0.926120 0.831354
Source DF Type I SS Mean Square F Value Pr > F
c 2 66.93327984 33.46663992 39.02 <.0001>
x 1 87.48470433 87.48470433 102.00 <.0001>
Source DF Type III SS Mean Square F Value Pr > F
c 2 65.47431949 32.73715975 38.17 <.0001>
x 1 87.48470433 87.48470433 102.00 <.0001>
Standard
Parameter Estimate Error t Value Pr > |t|
Intercept 1.962378170 B 0.16123655 12.17 <.0001>
c 0 -1.955754798 B 0.22800059 -8.58 <.0001>
c 1 -1.302729216 B 0.22633900 -5.76 <.0001>
c 2 0.000000000 B . . .
x 1.069740088 0.10592038 10.10 <.0001>
NOTE: The X'X matrix has been found to be singular, and a generalized inverse was used to solve the
normal equations. Terms whose estimates are followed by the letter 'B' are not uniquely
estimable.
The SAS System 14:05 Saturday, May 15, 2010 32
The GLM Procedure
Class Level Information
Class Levels Values
c 3 0 1 2
Number of Observations Read 100
Number of Observations Used 100
The SAS System 14:05 Saturday, May 15, 2010 33
The GLM Procedure
Dependent Variable: y
Sum of
Source DF Squares Mean Square F Value Pr > F
Model 4 223.5328621 55.8832155 65.15 <.0001>
Error 96 82.3390611 0.8576986
Uncorrected Total 100 305.8719232
R-Square Coeff Var Root MSE y Mean
0.652221 111.3991 0.926120 0.831354
Source DF Type I SS Mean Square F Value Pr > F
c 3 136.0481578 45.3493859 52.87 <.0001>
x 1 87.4847043 87.4847043 102.00 <.0001>
Source DF Type III SS Mean Square F Value Pr > F
c 3 141.7730055 47.2576685 55.10 <.0001>
x 1 87.4847043 87.4847043 102.00 <.0001>
Standard
Parameter Estimate Error t Value Pr > |t|
c 0 0.006623372 0.16126934 0.04 0.9673
c 1 0.659648954 0.15894131 4.15 <.0001>
c 2 1.962378170 0.16123655 12.17 <.0001>
x 1.069740088 0.10592038 10.10 <.0001>
python虚拟变量回归_虚拟变量回归中的截距项问题相关推荐
- 使用Python解决对比出两个Excel文件中的不同项并将结果重新写入一个新的Excel文件
使用Python解决对比出两个Excel文件中的不同项并将结果重新写入一个新的Excel文件 因为有统计成员到会情况的任务,每次汇总时都很麻烦,需要一个个对应腾讯会议导出名单的成员,然后在总表上进行标 ...
- python svr回归_使用sklearn库中的SVR做回归分析
sklearn中的回归有多种方法,广义线性回归集中在linear_model库下,例如普通线性回归.Lasso.岭回归等:另外还有其他非线性回归方法,例如核svm.集成方法.贝叶斯回归.K近邻回归.决 ...
- 逻辑回归是分类还是回归_分类和回归:它们是否相同?
逻辑回归是分类还是回归 You might have come across the terms Regression and Classification, and might as well th ...
- mysql表变量临时表_表变量和临时表详解
首先让我们来看看什么是表变量和临时表. sql server 表变量 1.初识表变量 表变量在sql server 2000中首次被引用.表变量的定义和创建一个表大致相同,只不过是使用DECLARE ...
- mysql声明变量关键字_声明变量的关键字
查询查看: 静态关键字static 同时在类中声明常量的关键字( 关键字final) 静态关键字static的作用 1,函数体内static变量的作用范围为该函数体,不同于auto变量,该变量的内 ...
- shell中文件路径用变量定义_环境变量
环境变量可以使得 bash shell 存储有关 shell 会话和工作环境的信息,允许在内存中存储数据. 在 bash shell 中,环境变量分为: 全局变量 局部变量 全局变量对 shell 会 ...
- java程序中类的成员变量定义在_.在类体中,变量定义部分所定义的变量称为类的________。...
.在类体中,变量定义部分所定义的变量称为类的________. .成员变量在整个类内都有效,________变量只在定义它的方法内有效. .Java中成员变量又分为实例成员变量和________. . ...
- python 运行r语言_如何在R中运行Python
python 运行r语言 尽管我很喜欢R,但很显然Python还是一种很棒的语言-既适用于数据科学又适用于通用计算. R用户想要在Python中做一些事情可能有充分的理由. 也许这是一个很棒的库,还没 ...
- vue删除数组中的一条数据_删除排序数组中的重复项 II
删除排序数组中的重复项 II题目 给定一个增序排列数组 nums ,你需要在 原地 删除重复出现的元素,使得每个元素最多出现两次,返回移除后数组的新长度. 不要使用额外的数组空间,你必须在 原地 修改 ...
- python偏最小二乘法回归分析_偏最小二乘回归(PLSR)- 2 标准算法(NIPALS)
1 NIPALS 算法 Step1:对原始数据X和Y进行中心化,得到X0和Y0.从Y0中选择一列作为u1,一般选择方差最大的那一列. 注:这是为了后面计算方便,如计算协方差时,对于标准化后的数据,其样 ...
最新文章
- 你真的理解“吃亏是福”么?
- mxnet基础到提高(21)-配置mxnet并运行第一个C++程序
- 夜读源码,带你探究 Go 语言的iota
- 向量积 和 它的计算_7
- 在网页设计中,引导页是所有页面中的重中之重,引导浏览者很快进入各栏目页面,是一个网站的灵魂所在。
- 使用HttpClient连接池进行https单双向验证
- 问题三十七:C++怎么解一元四次方程?(2)——怎么解一元三次方程
- function小记
- iOS ijkplayer 硬解H265(hevc)4k视频问题解决
- 基于(LinuxC语言)的UDP局域网聊天室
- mysql下载jdbc
- JVM 内存分析工具MAT
- php ping 检测电脑在线,怎么ping网速(教你如何用ping命令来检测电脑的网速)
- 计算机工程师考证要求
- mysql关系型数据库生成树形结构,Layui页面渲染树型结构图(详细)
- Quartz相关配置
- 计算机专业硕士学费,2015计算机工程硕士专业学费汇总
- 数据标准化 Data Normalization
- Flutter Icons图标库地址
- 来一个LM1875T