R语言1-面板数据分析全过程 附代码

用途

面板数据常见于计量经济学领域,本质上是一种线性回归方法。截面数据和时间序列数据的组合可以更多的反应数据情况,同时也需要克服二者都存在的问题。

数据初步处理

在Excel中将原数据进行初步处理和排列并另存为csv格式,建议将文件存放于便于提取的路径下。
![因变量为export.value,自变量分别为gdp、sagr、iagr、tagr、gni.p、food…其中apec和close是哑变量。在这里插入图片描述](https://img-
blog.csdnimg.cn/20200530093827215.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L0NocmlzdGluZWFncg==,size_16,color_FFFFFF,t_70)
因变量为export.value,自变量分别为gdp、sagr、iagr、tagr、gni.p、food…其中apec和close是哑变量。截面为27个国家,时间跨度为2001-2018年。

数据清洗

在现实的经济数据中,数据不可避免的会存在缺失等问题。因此需要对数据进行清洗,并对缺失数据集进行插补。插补方法较多,R为面板数据提供了专门的程辑包:pan包。
首先进行缺失数据的可视化,然后针对缺失数据集进行插补。注意因变量应该是完整的,pan包主要是处理自变量的缺失。
[ 详细的插补步骤和方法请参考这篇博文

](https://blog.csdn.net/sinat_26917383/article/details/51265213?depth_1-utm_source=distribute.pc_relevant.none-
task-blog-BlogCommendFromBaidu-2&utm_source=distribute.pc_relevant.none-task-
blog-BlogCommendFromBaidu-2)

面板数据的单位根检验

    // 读取数据lndataI<-read.csv("E://lndataI.csv",header = TRUE);lnDATAI<-as.matrix(lndataI[,3:15])//加载程辑包library(plm)//matrix形式简化检验步骤purtest(lnDATAI,test = c("levinlin"),exo = c("trend"),lags = c("AIC"),pmax = 10)//可选参数test = c("levinlin", "ips", "madwu", "Pm", "invnormal", "logit", "hadri"),exo = c("none", "intercept", "trend"),lags = c("SIC", "AIC", "Hall")

注意:五种检验方式中,只有Hadri函数的原假设为平稳,其他均为不平稳。
若0阶不平稳,则对原数据进行差分再进行单位根检验,直至平稳。

协整检验

1.pco包提供 pedroni99m
方法。每个变量分割成矩阵再结合成(多维)数组,第一个矩阵必须是自变量,其余为因变量。每个矩阵第一维(行)是时间,第二维(列)是个体(截面),第三维是变量值。
该函数最多检验7维数组 ,即最多检验7个变量。
当standardized value服从标准正态分布(0,1)时,服从H0假设,即数组不协整。
引入ks检验标准正态分布

    // pedroni99m协整检验pedroni99m(array(t1,dim = c(19,27,6)),type.stat = 2)//标准正态分布检验ks.test(standardized value,"pnorm",mean=0,sd=1)

2.urca包提供ca.jo检验
最多检验11个变量,包容哑变量。但变量个数增多后会导致不显示边界值,很不方便。可以通过修改源代码,增加检验变量个数,同时显示所有的critical
values。
亲测可行
代码太长就不贴了。

面板回归详细代码

    // 读入标准面板格式数据panel<-pdata.frame(data,index = c("year","id"))//构建固定模型-双效应/时间效应/个体效应fix<-plm(export.value~gdp+sagr+iagr+tagr+gni.p+I+food+gid+safe+trans+taf+culture+apec+close,data = panel,model = "within")fix_two<-plm(export.value~gdp+sagr+iagr+tagr+gni.p+I+food+gid+safe+trans+taf+culture+apec+close,data = panel,model = "within",effect = "twoways")fix_time<-plm(export.value~gdp+sagr+iagr+tagr+gni.p+I+food+gid+safe+trans+taf+culture+apec+close,data = panel,model = "within",effect = "time")fix_individual<-plm(export.value~gdp+sagr+iagr+tagr+gni.p+I+food+gid+safe+trans+taf+culture+apec+close,data = panel,model = "within",effect = "individual")//构建随机模型-双效应/时间效应/个体效应ran<-plm(export.value~gdp+sagr+iagr+tagr+gni.p+I+food+gid+safe+trans+taf+culture+apec+close,data = panel,model = "random")ran_two<-plm(export.value~gdp+sagr+iagr+tagr+gni.p+I+food+gid+safe+trans+taf+culture+apec+close,data = panel,model = "random",effect = "twoways")ran_time<-plm(export.value~gdp+sagr+iagr+tagr+gni.p+I+food+gid+safe+trans+taf+culture+apec+close,data = panel,model = "random",effect = "time")ran_individual<-plm(export.value~gdp+sagr+iagr+tagr+gni.p+I+food+gid+safe+trans+taf+culture+apec+close,data = panel,model = "random",effect = "individual")//混合模型pool<-plm(export.value~gdp+sagr+iagr+tagr+gni.p+I+food+gid+safe+trans+taf+culture+apec+close,data = panel,model = "pooling")//F检验-个体or时间pooltest(fix_time,fix_individual)//F检验-混合or固定pooltest(fix,pool)//豪斯曼检验-随机or固定phtest(fix,ran)//==共线性检验==方差膨胀因子library(car)vif(ran)vif(pool)vif(fix)//==共线性检验==kappakappa(panel[,3:18])

结果分析

R语言1-面板数据分析全过程 附代码用途相关推荐

  1. R语言1-面板数据分析全过程 附代码

    R语言1-面板数据分析全过程 附代码 用途 面板数据常见于计量经济学领域,本质上是一种线性回归方法.截面数据和时间序列数据的组合可以更多的反应数据情况,同时也需要克服二者都存在的问题. 数据初步处理 ...

  2. 2015CDAS中国数据分析师行业峰会:R语言量化投资数据分析应用

    跨界知识聚会系列文章,"知识是用来分享和传承的",各种会议.论坛.沙龙都是分享知识的绝佳场所.我也有幸作为演讲嘉宾参加了一些国内的大型会议,向大家展示我所做的一些成果.从听众到演讲 ...

  3. R语言做面板VAR例子

    面板VAR步骤: (1)对各变量做平稳性检验(IPS.PP.ADF.LLC等方法检验) 是逐个变量检验??还是一起检验?? (2)面板数据的最优滞后阶数确定(AIC和SIC方法) (3)在PVAR系统 ...

  4. R语言广义线性模型Logistic回归案例代码

    R语言广义线性模型Logistic回归案例代码 在实际应用中,Logistic模型主要有三大用途: 1)寻找危险因素,找到某些影响因变量的"坏因素",一般可以通过优势比发现危险因素 ...

  5. R语言学习之数据分析实战(一)

    R语言学习之数据分析实战(一) 一.线性回归 回归(regression):通常指那些用一个或多个预测变量,也称自变量或解释变量,来预测响应变量,也称为因变量.效标变量或结果变量的方法. 普通最小二乘 ...

  6. 基于R语言一元线性回归模型实例及代码

    基于R语言一元线性回归模型实例及代码 题目描述 数据特征及可视化 建立模型与初步评价 (自己写lm()代码) 显著性检验 整体显著性检验 数学理论 系数显著性检验 代码实现系统显著性检验 回归诊断 异 ...

  7. 带你和Python与R一起玩转数据科学: 探索性数据分析(附代码)

    作者:Jose A Dianes 翻译:季洋 校对:丁楠雅 本文约5822字,建议阅读20+分钟. 本系列将介绍如何在现在工作中用两种最流行的开源平台玩转数据科学.先来看一看数据分析过程中的关键步骤 ...

  8. 为什么R语言是学习数据分析的第一选择

    数据时代已经到来,但数据分析.数据挖掘人才却十分短缺,据全球顶尖管理咨询公司麦肯锡(McKinsey)一份详细分析报告显示: >>>> 预计到 2018 年,大数据或者数据工作 ...

  9. (一)R语言入门指南——数据分析的第一步

    注:本博客旨在分享个人学习心得,有不规范之处请多多包涵! 目录 R语言 数值与逻辑运算符 变量类型与赋值 逻辑判定与循环 结束语 R语言 简单来说,R语言是一个免费开源.数据分析和可视化功能强大的编程 ...

  10. 豆瓣电影R语言爬虫和数据分析.

    主要内容: 1.r语言爬虫 rvest包的使用. 2.r语言字符串处理stringr包的使用. 3.r语言聚合dplyr 包的使用. 4.r语言可视化ggplot 包的使用. 5.r语言画词云图wor ...

最新文章

  1. 发送快递:配置静态路由
  2. C语言函数集(十二)
  3. 错误:mysql foreign key errno 150
  4. 『数据库』朴实无华且枯燥的数据库文章--关系数据理论
  5. redhat配置centos的yum源
  6. oppo的sd卡在哪里打开_oppo的sd卡在哪里打开
  7. C++中宏与内联函数
  8. 图解Java多线程设计模式
  9. 道理与例子【人人都是产品经理:9009】
  10. schema在oracle里是什么意思
  11. HDU2066 一个人的旅行【最短路径+Floyd算法】
  12. 阿里云ICON全部下载
  13. 利用Proteus 8.9运行stm32最简单的跑马灯程序
  14. 华为ensp常用操作命令 网络人凭经验含泪总结
  15. java乘法代码_java九九乘法表代码
  16. 全球首例,美国医生为患者移植猪心脏,术后情况良好
  17. Hinton最新演讲!一种新神经网络:前向-前向FF算法,论文已公开!
  18. openOCD和Jlink仿真器
  19. 运维与微服务结合?深度解析微服务框架Tars整体解决方案
  20. 高中计算机听课总结,信息技术优质课听课心得体会

热门文章

  1. 什么是 DataSource?什么又是 DruidDataSource?
  2. Qt编译报错:Error in Util.asciify(build-Project1_msvc-Desktop_Qt_5_8_0_MSVC2015_32bit_qt_58_w-Debug)
  3. python星号怎么输入_python 星号*使用方法
  4. 搭建一个属于自己的服务器,并实现内网穿透(外网访问本地服务器功能)
  5. 如何提高页面性能并充分利用主机
  6. N年前的实习记录 - 职场生涯应如何规划?
  7. 一文读懂POE交换机和普通交换机的区别
  8. VO快速搜索 宝马VO 宝马VO翻译 VO码查询工具
  9. python视频分段_Python玩转视频处理(四):视频按场景进行分割
  10. pb+api实际应用