微观数据库整理

  • UHS (Urban Household Survey)
  • CHIP (Chinese Household Income Project Survey)
  • Census
  • CHNS (China Health and Nutrition Survey)
  • RHS (Rural Household Survey)
  • 中国老年健康调查项目
  • CHARLS(China Health and Retirement Longitudinal Study)
  • 其它的数据
  • 中国营养和健康调查(CHNS):
  • 中国综合社会调查(CGSS)

UHS (Urban Household Survey)

简介:中国城镇住户调查数据。它是国家统计局城调总队负责调查的。现在可以拿到1986年至2006年的数据。如果可能的话,我们可以拿到全部省份的数据,但现在大家使用的是六个省份的数据(北京、广东、浙江、辽宁、陕西、四川)。每年大约有3500-4000户的数据。

目前根据搜索信息,可以获得至2015年

包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、文化程度、行业、职业、就业状况、工资、总收入、工作小时数、参加工作年份、退休金、财产性收入。(2)家庭层次上的变量。家庭总收入、家庭人口数、居住面积、房间个数、家庭财产、现金支出、现金流入、储蓄、借款、家庭消费。

可做的研究:
(1)教育回报率问题。
(2)收入不平等问题。
(3)劳动力供给问题。家庭财产、孩子(老人)、退休金。
(4)行业的分布及变化。
(5)职业的分布及变化。人力资源管理。
(6)就业问题。失业率和劳动参与率。
(7)教育决定因素及教育不平等问题。
(8)社会保障方面的研究(退休金)。
(9)财产性收入研究。
(10)房地产需求问题。它与人口结构的关系。
(11)非正规金融问题(借款)。
(12)家庭消费的决定因素及模式变化。

CHIP (Chinese Household Income Project Survey)

简介:中国家庭收入项目调查。它是由国家统计局农调总队和中国社会科学院经济研究所共同开展此项专门调查。调查内容主要包括:收入、消费、就业、生产等有关方面的情况。现在做了三轮,分别是1988,1995,2002,可能2006的也正在进行中。这个数据是全部省份。这个数据的好处是,农村及城镇的数据都有。城镇每年家庭的数据大约有6800户,人数大约为20000人。农村每年家庭的数据大约有9200户,人数大约有38000人。

包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、受教育年限、行业、所有制、职业、就业状况、工资、总收入、工作小时数、参加工作年份、是否中共党员、是否当过兵、是否当过干部、吸烟花多少钱、喝酒花多少钱、是否残疾、医药支出额多少、生病的时间、从事家务劳动的时间、照顾家里其它病人的时间、工资收入总额、退休金、股票红利、工作天数、工作小时数、找工作的渠道、居住条件、开始非农就业的年份。(2)家庭层次上的变量。家庭总收入、家庭人口数、居住面积、房屋所有权、贷款的数量、借钱的途径、自己及配偶父母的家庭成分、家庭收入、老人补助金、现金支出、家庭消费、家庭财产。

可做的研究:
(1)教育回报率问题。
(2)收入不平等问题。
(3)劳动力供给问题。家庭财产、孩子(老人)、退休金、家务劳动时间。
(4)找工作的方式问题。
(5)行业的分布及变化。
(6)职业的分布及变化。人力资源管理。
(7)就业问题。失业率和劳动参与率。
(8)教育决定因素及教育不平等问题。
(9)社会保障方面的研究(退休金)。
(10)财产性收入研究(股票)。
(11)房地产需求问题。它与人口结构的关系。
(12)住房解决方式问题。
(13)农村非正规金融问题(借款)。
(14)家庭消费的决定因素及模式变化。
(15)党员、当兵、当干部、父母家庭成分对收入和就业的影响
(16)吸烟、喝酒等支出的决定因素及变化趋势
(17)农村老人补助金问题。
(18)老人养老安排问题。
(19)老年人劳动供给问题(退休年龄的提高)。

Census

简介:中国人口普查数据。现在经常用到的人口普查数据是1982年、1990年、2000年的人口普查数据。一般的研究机构拿的数据是0.1%抽样的,但有的研究部门能够拿到1%抽样的。对做宏观变量的趋势(如性别比例的变化,离婚率的变化等),这种大样本的数据非常合适,非常有说服力。要想使用这种大型的数据库,对硬件的设备要求很高。要想使用1%抽样的数据,我们的电脑一般都不能承担。人口普查的一个缺陷是没有收入方面的数据,但是2005的中期普查,是有收入方面的数据的。

包含的变量:在不同的年份,包含的变量不一样。这里说的是比较全的。个人层次上的变量:年龄、性别、民族、婚姻状态、初婚年龄、行业、职业、工作单位的性质、不参加工作的原因、与户主的关系、户口、居住地、出生地、文化程度、何时迁入本地、迁来本地的原因、从何地迁来、迁出地的类型、五年前常住地、为什么现在住在本地、工作时间。家庭层次上的变量:家庭人口数、调查期内死亡人数、住房面积、住房用途、住房间数、住房来源、购入住房的成本,购入住房的时间、租房的成本、自来水与厕所的情况。如果是女性,还有总共生育了几个孩子,存活了几个孩子的信息。

可做的研究:
(1)人口预测、人口构成问题。
(2)性别比例问题。
(3)计划生育效果问题。
(4)人口老龄化问题。
(5)劳动力迁移问题。
(6)孩子的质量数量权衡问题。
(4)农村留守老人和孩子问题。
(5)房地产价格决定因素及变化趋势。
(6)老人居住问题(跟儿子还是跟女儿)。
(7)少数民族问题。

CHNS (China Health and Nutrition Survey)

简介:中国健康与营养调查。由美国北卡罗莱纳大学教堂山校区的罗莱纳州人口中心(the Carolina Population Center at the University of North Carolina at Chapel Hill)和中国疾病控制和预防中心的国家营养和食品安全所(the National Institute of Nutrition and Food Safety, and the Chinese Center for Disease Control and Prevention)合作建立的一个数据。这个数据最大的好处是,它是一个面板数据。而且,农村和城镇的数据都有。现有的数据有:1989, 1991, 1993, 1997, 2000, 2004,2006等年份。包括的省份:辽宁、黑龙江、江苏、山东、河南、湖北、湖北、湖南、广西、贵州。这些数据可以在网上下载。现在,国际一些好的刊物很多文章也是用这个数据做的。这个数据库涉及的变量较多,处理起来比较困难。以后年份的数据缺失可能比较严重。

包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、出生日期、民族、身高、体重、血压、病史、吸烟史、受教育年限(水平)、户口、是否干部、行业、职业、第二职业、工作单位的性质及人数、就业状况、工作时间(非常细致)工资、总收入、参加农业生产的情况。(2)家庭层次上的变量。农业生产、农作物价值、家庭总收入、家庭人口数、家庭支出(较详细)、家庭收入(较详细)、居住情况(详细)、交通工具、家庭消费、家庭财产、医疗费用(详细)、家庭成员生病(较详细)、食物消费(详细)。(3)社区层次变量。村人数、村户数、是否实行医疗保险、医院情况、消费结构、学校情况、计划生育情况、食品价格。

可做的研究:
(1)身高体重与食物结构的关系。
(2)劳动力市场上是否在身高等存在歧视。
(3)吸烟对健康的影响。
(4)健康对劳动力供给的影响。
(5)就业问题。
(6)劳动力供给时间问题。
(7)医疗保险对健康的影响。
(8)社区医疗结构(医院的多少)对健康的影响
(9)某些疾病的发病趋势。
(10)收入不平等问题。
(11)社会保障方面的研究。
(12)家庭消费的决定因素及模式变化。

数据来源:公开。

RHS (Rural Household Survey)

简介:中国农村住户调查数据。它是国家统计局农调总队负责调查的。它是与城镇调查相对应的一个数据,也是每年做一次,但因为涉及到的问题比较敏感,这一套数据比较难拿。

包含变量:(1)个人层次上的变量。与户主关系,性别、年龄、文化程度、当年在家居住的时间、是否在校学生、是否接受过技能培训、是否丧失劳动能力、从事、行业、从事农业生产的时间、从事非农行业的时间、是否乡镇企业职工、在乡镇企业工作的时间、外出方式、外出地区、在外务工时间、在外务工总收入
生活消费总支出。(2)家庭层次上的变量。家庭总收入、家庭人口数、家庭财产、现金支出、现金流入、家庭消费、缴纳的税费。

可做的研究:
(1)农村税费问题。
(2)农民工迁移问题,包括地区、迁移方式。
(3)农民工收入对家庭总收入的影响。
(4)研究乡镇企业问题。
(5)农村基础设施问题,电话、公路等等。
(6)农村地区财产性收入问题。
(7)农产品价格及农民收入问题。
(8)农业机械与农业产量。
(9)各种农作物种植面积的变化趋势。
(10)农村家庭消费的决定因素及模式变化。

数据来源:国家统计局。

中国老年健康调查项目

简介:全国老年人口健康状况调查项目(又名中国老人健康长寿影响因素研究)的项目主持人为北京大学中国经济研究中心教授与杜克大学教授及北大老龄健康与家庭研究中心主任曾毅。这一数据库主要是为有关老年人的研究服务。现有的数据包括:1998 2000 2002 2005年。

(内附2005年的调查问卷)

包含变量:性别、年龄、属相、出生日期、出生地、婚姻、受教育程度、以前所从事行业、生活能力、疾病、看病花费等信息

可做的研究:
(1) 老年人的居住安排(跟儿子住,还是跟女儿住)
(2) 老年人的疾病状况。
(3) 老年人医疗支出结构分析。
(4) 所从事行业对以后健康的影响。

CHARLS(China Health and Retirement Longitudinal Study)

简介:中国健康退休跟踪调查。这个数据库是由北京大学中国经济研究中心赵耀辉教授负责的一个项目。这个项目实际是跟美国的HRS数据库并行的,主要是为了研究健康和退休行为。这个数据选取的样本是,年龄大于等于45岁。这个数据库的质量非常好,为了得到血样的数据,专门对相关的数据采集员做了培训。这个数据库最快明年春天就能用,并且它是对所有的研究者公开的。这个数据另外的一个好处是,它是一个面板数据。

(内附调查问卷)

包含的变量:包含的变量非常丰富。基本在劳动经济学研究中,能用到的变量都考虑到了。举几个例子。教育水平,细分到了硕士和博士;英语水平细分到了过了国家几级;大学是同等学历还是正规毕业;村干部细分到了村书记还是村会计。

可做的研究:
(1) 社会保障方面的研究;
(2) 老龄化问题方面的研究;
(3) 其它劳动经济学方面的研究;
(4) 人口经济学方面的研究;
(5) 卫生经济学方面的研究;

其它的数据

(1) 第一次经济普查数据

  1. 工业普查
  2. 农业普查

(2) 第一次、第二次妇女社会地位调查数据

(3) CSMAR (China Stock Market & Accouting Reseach)。这是一个关于上市公司的数据。

(4) 关于全世界股票指数的数据库。

(5) 中国社会科学院劳动与人口研究所五个城市(上海、福州、沈阳、武汉和西安)的劳动力市场数据。

CHIP数据,是中国社会科学院经济研究所收入分配课题组(李实、赵人伟老师主持,福特基金赞助)于1988年、1995年和2002年,进行的全国调查中的中国农村和城市居民家庭收入分配调查得到的。1995年的调查覆盖19个省(市、自治区),调查了6931户城镇家庭和7998户农村家庭,分别涉及21696位城镇居民和34739位农村居民;2002年的调查覆盖22个省(市、自治区),调查了6835户城镇家庭和9200户农村家庭,分别涉及20632位城镇居民和37969位农村居民。刚开始CHIP(中国家庭收入项目)数据是在海外公开的,前几年我的老师用的时候还是花了好几千买的,而我们现在都已经能共享了,是由美国密西根大学校际政治及社会研究联盟(ICPSR)公布的,里面还有很多其他数据。(经济研究上有很多文章都是用的这个数据)
http://bbs.pinggu.org/thread-1275080-1-1.html

http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/9836;jsessionid=5C778733263D9AE441544F58422017E2?classification=ICPSR.IV.B

最近学微观计量,要用到许多数据,如CHIP、CHARLS、CFPS、CHNS等。刚开始也很被动,老向老师抱怨找不到数据,结果被批评了一番。狠下心来在Google和baidu里畅游了N久,终于功夫不负有心人,找到了很多有用的数据。
其中应用最广的CHIP数据,是中国社会科学院经济研究所收入分配课题组(李实、赵人伟老师主持,福特基金赞助)于1988年、1995年和2002年,进行的全国调查中的中国农村和城市居民家庭收入分配调查得到的。1995年的调查覆盖19个省(市、自治区),调查了6931户城镇家庭和7998户农村家庭,分别涉及21696位城镇居民和34739位农村居民;2002年的调查覆盖22个省(市、自治区),调查了6835户城镇家庭和9200户农村家庭,分别涉及20632位城镇居民和37969位农村居民。刚开始CHIP(中国家庭收入项目)数据是在海外公开的,前几年我的老师用的时候还是花了好几千买的,而我们现在都已经能共享了,是由美国密西根大学校际政治及社会研究联盟(ICPSR)公布的,里面还有很多其他数据。(经济研究上有很多文章都是用的这个数据)
而CHNS(中国健康与营养调查)、CHARLS(中国健康与养老追踪调查)、CFPS(中国家庭动态调查)、CHFS(China Health and Fertility Survey )等则是在老师上课时所给的链接中下的,大部分的数据下载页面都是英文界面的,而且需要先注册,通过邮件获得密码、ID之类的才能继续下载,所以可能需要点耐心。其中CFPS还需要寄信函到北京才能取得密码和ID,所以我暂时只下到它的Codebook和问卷!
PS:数据格式大部分是.dta格式的(Stata支持),也有SPSS等支持的数据。(压缩后有近300m)
因为部分数据文件较大,上传比较麻烦,所以现在暂时将这些数据的下载链接跟大家共享,另外还附带了学习Stata的比较好的网站,尤其是UCLA的那个,很受用!!希望大家合理利用这些数据,写出高质量的文章来!!

CHIP数据的链接:
http://www.icpsr.org/icpsrweb/ICPSR/studies/9836;jsessionid=5C778733263D9AE441544F58422017E2?classification=ICPSR.IV.B.

http://www.icpsr.org/icpsrweb/ICPSR/studies/3012;jsessionid=5C778733263D9AE441544F58422017E2?classification=ICPSR.IV.B.

http://www.icpsr.umich.edu/icpsrweb/ICPSR/studies/21741
劳动经济学数据库

A。免费的大型数据库

两个比较著名的免费的大型数据库是:

中国营养和健康调查(CHNS):

http://www.cpc.unc.edu/projects/china

调查由美国北卡罗来纳大学教堂山校区的卡罗莱纳人口中心(the Carolina Population Center at the University of North Carolina at Chapel Hill )和中国疾病预防和控制中心的营养和食品安全局联合主持展开。调查涉及9个有代表性的省份,涉及了4400个家庭和20000个左右的个人。

从1989年开始,现在完成了七轮调查,分别是1989年、1991年、1995年、1997年、2000年、2004年和2006年。根据其主页信息,2009年的调查将在近期启动。

这个数据库是完全免费的,只要注册提供自己的一些信息就可以下载相关数据了。调查问卷提供中英文两种版本。

中国综合社会调查(CGSS)

http://www.cssod.org/index.php

这个是由中国人民大学社会学系和香港科技大学社会学系联合主持完成的。使用者需要申请提供自己的详细信息并签订一份使用协议。

分别是2003年、2005年2006年。2010年,2014年
目前更新至:2016年

B.有偿使用的数据库

1.中国家庭收入调查(CHIP)

这个应该是目前最有影响中国微观数据库吧。调查覆盖面很广调查涉及了中国22个省、122个县和960多个行政村,缺省数据极少。

这个数据目前进行了3论,分别是1988年、1995年和2002年。最新一轮的调查应该会在今年展开吧(7年一轮)。

在此对李实老师等人的辛劳表示衷心的感谢,他们对中国应用微观经济研究的贡献无疑是相当巨大的。

2.中国国家统计局的1%调查样本

在读文献中看到不少论文使用国家统计局的城市调查和农村调查。

C。CHARLS——China Health and Retirement Longitudinal Study

这是CCER对中国经济学研究的有一个贡献。具体介绍看网站首页:http://charls.ccer.edu.cn/charls/index.asp

D。其他

还有许多根据各地调查的数据库,比如CCER赵耀辉教授曾经使用过的1995年的关于四川省的一个调查,以及Heckman使用过的中国城市家庭收入和支出调查(China Urban Household Income and Expending Survey, CUHIES),以及其他关于各个省份或者个别省份的调查,这些调查都有一定程度的适用性,只是使用的不是很广泛。

参考来源:
作者:Zenan Wang
链接:http://www.zhihu.com/question/26442107/answer/33010610
来源:知乎

作者:慧航
链接:http://www.zhihu.com/question/26442107/answer/32996470
来源:知乎

微观数据库整理(公开渠道获得-持续更新)相关推荐

  1. 2020今日头条面试真题及答案整理最新最全持续更新中~~~~

    大家好,我是好好学习天天编程的天天 一个整天在互联网上爬虫的程序员,每天给大家分享学习干货的攻城狮 2020今日头条面试真题及答案整理&最新最全&持续更新中~~~~ 2020今日头条面 ...

  2. 2020美团(开水团)面试题真题整理最新最全~持续更新中~~~

    大家好我是好好学习天天编程的天天 一个整天在互联网上种菜和砍柴的程序员~ 如果我们每天关注互联网行业,也有心做程序员的话,我们可能进场会听到一些关键词:一东(时间单位),一度(市值单位,一个拼多多是几 ...

  3. 数据库常用操作,会持续更新

    数据库常用操作,会持续更新 1.DDL-数据库操作show databases; 查询所有数据库 create database 数据库名: 创建数据库 use 数据库名: 进入所选的数据库中 sel ...

  4. 最值得收藏的 数字图像处理 全部知识点思维导图整理(武汉大学慕课课程)(持续更新中)

    本文的思维导图根据慕课上的武汉大学数字图像处理国家精品课程整理而来并标记出重点内容 思维导图就整理了这么多,之后应该也不会更新此内容了, 有需要的可以去 我的主页 了解更多学科的精品思维导图整理 本文 ...

  5. 专高六整理笔记(未完成,持续更新....)

    目录标题 1.说说你对Event Loop(事件循环)的理解? 2.说说你对BOM的理解,常见的BOM对象你了解哪些? DOM和BOW的区别: 常见的BOM对象都有哪些? 3.浏览器的内核都有哪些,什 ...

  6. Java面试题及答案整理(2022最新版) 持续更新

    发现网上很多Java面试题都没有答案,所以花了很长时间搜集整理出来了这套Java面试题大全,希望对大家有帮助哈~博主已将这些面试题整理到一个网站上,每天更新 Java 面试题,目前有 1万多道 Jav ...

  7. ⑤⭐全网首发☀️数据有道之数据库技术❤️干货大全【持续更新】❗❗❗

    目录 5.1 DBAS建模 考点1 方 法 考点2 UML 5.2 DBAS业务流程与需求表达 考点1 业务流程与活动图 考点2 系统需求与用例图 5.3 DBAS系统内部结构的表达 考点1 DBAS ...

  8. ③⭐全网首发☀️数据有道之数据库技术❤️干货大全【持续更新】❗❗❗

    目录 3.1 数据库概念设计 考点1 概念设计的任务 考点2 概念设计的依据及过程 考点3 数据建模方法 考点4 概念设计实例 3.2 数据库逻辑设计 考点1 任 务 考点2 目 标 3.3 数据库物 ...

  9. 【数据库及其应用】(持续更新中)

    数据库及其应用 第1章SQL基本语言 1.1 SQL数据的定义 1.1.1 数据库的建立和删除 建数据库 CREATE DATABASE database_name /*此处省略路径.文件长度等等参数 ...

  10. ④⭐全网首发☀️数据有道之数据库技术❤️干货大全【持续更新】❗❗❗

    目录 4.1 软件体系结构 考点1 定 义 考点2 功 能 考点3 分 类 4.2 软件设计过程 考点1 软件设计的目的 考点2 软件设计的原则 考点3 软件设计的分类 4.3 DBAS总体设计 考点 ...

最新文章

  1. 从一道面试题分析Thread.interrupt方法
  2. python多维字符数组_python多维数组内找指定字符串
  3. 微星z370黑苹果_记录一下装了第二台黑苹果(Z370 + High Sierra)
  4. C#中配置文件的使用
  5. 在Eclipse中使用Git
  6. python 爬虫抓取网页数据导出excel_如何用excel实现网页爬虫
  7. 水果店营业额下降原因,水果店如何提高营业额
  8. qq号被盗是什么原理_手机被盗之前(和之后)应该做什么
  9. 使用Mono.Cecil改变访问级别
  10. Prometheus -Grafana部署及部署告警
  11. 嵌入式跑马灯实验报告linux,ARM嵌入式跑马灯设计实验报告.doc
  12. 如何在微信公众号分享PPT?
  13. pyspark--创建DataFrame
  14. 小西的快乐乘法表(想不到怎么做到同时输入两个数,并同时输出两张乘法表,求助)
  15. (第16-17讲)STM32F4单片机,FreeRTOS中断管理简介【视频笔记、代码讲解】【正点原子】【原创】
  16. 利用MSCOMM控件通过串口MODEN实现来电显示-c# source code
  17. 网站关键词优化在短期内见到效果的方法
  18. operator理解
  19. linux-版本相关
  20. 宇道生物完成复星医药Pre-A轮融资,专注药物研发信息化和智能化开发...

热门文章

  1. Third《高质量程序设计指南—C++/C语言》(第二版)
  2. UnityWebPlayer使用(1) 单机环境下在WinForm中使用Unity3d
  3. Map 转 json格式 保留null值的解决办法
  4. java开发简历项目经验,面试必会
  5. C语言练手题(52个小练习)
  6. (原)ubuntu上安装Torch7及nn及dpnn
  7. python简单代码示例-python3简单代码示例
  8. linux系统镜像iso文件下载
  9. Matlab安装指南
  10. 凸包算法(Convex Hull Algorithm)