应用回归分析(知识点整理)(二)
文章目录
- 多元线性回归
- 基本假定,参数估计,显著性检验公式
- 中心化和标准化
- 中心化
- 标准化
- 相关系数
- 简单相关系数
- 复相关系数
- 偏相关系数
- 部分相关系数
- SPSS判断四种相关系数
多元线性回归
基本假定,参数估计,显著性检验公式
多元回归的基本假定有以下几个方面:
(1)解释变量x(i)是确定性变量,非随机变量;且rank(X) = p+1 < n***(矩阵列不相关,表明设计矩阵X*为满秩矩阵)
(2)误差项具备高斯马尔科夫条件
(3)误差项服从正态分布
多元线性回归方程的解释:
对一般情况下含有p个自变量的多元线性回归方程,每个回归系数(记为B(i))表示的是在回归方程中其它自变量保持不变的情况下,自变量x(i)每增加一个单位时,因变量y的平均增加幅度。(即多元回归的回归系数被称作偏回归系数[对回归方程求偏导可知])
一元线性回归中已经证明过参数估计,模型诊断和预测,不再证明;列出公式
要注意的是,拟合优度R也被称作复相关系数,表示的是回归方程对原有数据的拟合程度,R方与回归方程中的自变量的数目以及样本量n有关,当样本量n与自变量个数接近的时候,R方接近1,其中会隐含虚假成分,因此不能完全根据R方就判定模型的优劣程度。
中心化和标准化
自变量x(i)所用单位大多不同,数据的大小差异也往往非常大,这就不利于在同一个标准上进行比较,为了消除量纲不同和数量级差异所带来的差异,将样本数据做中心化和标准化处理。
中心化
中心化即将坐标原点移动到样本中心,样本中心即为(x(j)_m,y(j)_m)【x_m,y_m表示的是对应列向量的均值】
做对应坐标变换:
x(ij)’ = x(ij) - x(j)_m ; i = 1,…… ,n ; j = 1,……,p (1)
y(i)’ = y(i) - y(i)_m ; i = 1,……,n (2)
其中(2)式即为所求的中心化经验回归方程,方程中的常数项为0,回归系数的最小二乘估计保持不变。
标准化
样本标准化的公式为数值减去它的对应列均值再除以列标准差
标准化过程包括了中心化,因此常数项也为0
相关系数
简单相关系数
由样本观测值x(ip)分别计算x(i)与x(j)之间的简单相关系数,得到自变量样本相关阵
[1 r12 … r1p
r21 1 … r2p
…
rp1 rp2 … 1]
相关阵为对称矩阵
复相关系数
即拟合优度R=SSR/SST
偏相关系数
即偏决定系数的平方根,偏相关系数可以度量p+1个变量y,x§之中的任意两个变量的线性相关程度,这种相关程度是固定在其余p-1个变量的影响下的线性相关。
例如:
模型中只含有x1和y时,它们的残差平方和记为SSE(x1)
模型中含有x1,x2和y时,它们的残差平方和为SSE(x1,x2)
则此时的加入x2的偏决定系数为r21 = [SSE(x1)-SSE(x1,x2)] / SSE(x1)
二者的偏相关系数再对偏决定系数开平方根即可
部分相关系数
部分相关系数可以表示为:SSR(x2) = SSR(x1,x2) - SSR(x1)
即先引入x1再引入x2,SSR因此而产生的增量。
此时y对x2的部分相关系数的平方即为:SSR(x2) / SST
SPSS判断四种相关系数
上图中相关性(Correlations)中
简单相关系数(Zero-order)
ry2 = 0.746 ; ry1 = 0.807
其决定系数是对应简单相关系数的平方
1 - (1 - ry2^2)(1 - ry1^2) = R方(复相关系数的平方)
偏相关系数(Partial)
r21 = 0.739 ; r12 = 0.802
偏决定系数是对应偏相关系数的平方
部分相关系数(Part)
ry2 = 0.436 ; ry1 = 0.534
应用回归分析(知识点整理)(二)相关推荐
- 成成你好呀(C知识点整理二)
[函数快查] scanf – 格式化输入 [扩展阅读] ASCII字符表 [课后作业] S1E8:字符和字符串 | 课后测试题及答案 [知识点备忘] S1E8:字符和字符串 [扩展阅读] 运算符的优先 ...
- Java面试手册V2.0+突击V3.0知识点整理(一) 附封面图片
虚静出内功 1. Java语言三大特性 1. 封装: 属性用来描述同一类事物的特征,方法可描述一类事物可做的操作 封装就是把属于同一类事物的共性(包括属性和方法)归到一个类中,以方便使用 概念: 封装 ...
- 测试开发知识点整理(二)
软件测试基础 软件测试的概念 63.软件测试的重要性 64.软件测试的对象有哪些(掌握) 65. 软件测试的目的是什么(掌握) 66. 软件测试的依据是什么(掌握) 67.软件需求的类型及软件需求分析 ...
- 山东大学软件学院数据可视化知识点整理
数据可视化知识点整理 数据可视化主要工具: Google Refine Echarts Pyecharts Tableau R Rrocessing D3(JS) 主要编程工具: Python Lec ...
- python基础知识整理-python入门基础知识点整理-20171214
一.知识点整理 1.python2与python3的区别: (1)宏观比对 python2 源码不标准,较为混乱,并且重复的代码很多. python3 源码统一了标准,同时也去除了重复代码. (2)编 ...
- JS,JQ,PHP的小知识点整理
在日常开发中所使用的JS,JQ,PHP的小知识点整理 持续更新-- 1.js和jq获取当前的时间戳 方法一: <script>var timestamp = Date.parse(new ...
- 一天1个机器学习知识点(二)
陆陆续续整理的机器学习的知识点,资料大多数来自网上,不做盈利目的,如果侵权请告知即删!如果文章中有错误的地方还请各位同学指正,,一起学习,一起进步! 每天都在更新中,记得收藏,每天进步一点点!! 一天 ...
- 计算机地图制图知识点,地图制图知识点整理
地图制图知识点整理 第一章 地图的定义:按照严密的数学法则,用特定的符号系统,将地图或其他星球的空间事象,以二维或维静态或动态可视化形式,抽象概括.缩小模拟等手段表示在平面或球面上,科学地分析认知与交 ...
- 大数据 -- kafka学习笔记:知识点整理(部分转载)
一 为什么需要消息系统 1.解耦 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束. 2.冗余 消息队列把数据进行持久化直到它们已经被完全处理,通过这一方式规避了数据丢失风险.许多 ...
- 计算机软件在矿井地质中的应用,(完整版)遥感导论知识点整理(梅安新版)
遥感导论知识点整理 [题型] 一.选择题 二.填空题 三.名词解释 四.简答题 五.论述题 注意:标注页码的地方比较难理解,希望大家多看看书,看看ppt.[第一章]绪论 1.[名]遥感(remote ...
最新文章
- qq音乐 android pad版,QQ音乐HD(com.tencent.qqmusicpad) - 4.12.1.4 - 应用 - 酷安
- 使用ps命令输出进程列表--用Enki学Linux系列(17)
- axure命令行_Axure完成前端开发可行性探索
- 剑桥大学eap入学测试准备!!!救命稻草
- Debian 9.6.0 + OpenMediaVault 4.x : U盘作系统盘时遇到的问题
- axios_的请求响应结果的结构---axios工作笔记006
- sql查询初学者指南_适用于初学者SQL Server查询优化技巧与实际示例
- 服务器 异常自动关机,服务器自动关机
- 三星手机败走中国,血战印度
- java之集合ArrayList,LinkedList,HashMap运用
- CD 20 打气球的最大分数
- FPGA循环点亮流水灯
- matlab 非a到z,MATLAB命令大全(A-Z)
- jquery $.fn 是什么意思
- NFT“MetaBunny”公开发售后飙升近35倍 首轮公开发售1000枚后结束
- 灵活搭建50方局域网视频会议基本系统
- ply文件 java_ply之解析java文件,找出包名、类名、依赖类
- 海盗分赃(8行代码搞定!)
- CM10稳定版推出;CyanogenMod域名险被劫持
- python实现北京租房信息计算