这里开个新坑,主题有关stata使用以及定量分析入门,主要内容来自于之前与之后的课程学习、作业以及资料查询整理,主要目的是对个人学习过程的一个记录,方便日后回顾。

1 导入数据

方法1:点击文件选项,选择导入,根据数据类型选择即可;

方法2::点击进入数据编辑器界面,点击“文件”选择打开。注意,该方式只能打开.dta文件,若数据量较小建议在Excel中的打开,全选后复制,粘贴至数据编辑器中。

若想将导入后的Excel文件转换成dta数据,可在主界面的文件中选择另存为即可。

2 修改变量标签

方法1:在数据编辑器的属性窗口直接输入即可

方法2:在命令窗口输入
label variable 城市 “city”
注意var后面的跟变量名称,即使是汉字也不需要加引号

3 检视数据

1.输入命令describe(可简写为d)看数据集中变量名称、标签等

2.若想看某几个变量的具体数据,则输入命令:
list A B C

3.也可通过逻辑关系来定义数据集子集,比如列出C变量大于等于10000的数据,则使用命令:
list A C if C>=10000

这里注意下其他表示关系的逻辑符号有“==”(等于)、“~=”(不等于,也可以用“!=”表示)。stata中等号的作用跟Python中类似,一个=是赋值,两个= =才表示等于。此外,if后面的等号必须是“= =”。
4.删改数据:
①若要删除满足“C<=10000”条件的观测值,可输入
drop if C<=10000
②若只要保留“C<=10000”条件的观测值,可输入
keep if C<=10000
注意,stata中没有撤回,所以删除数据需慎重。
5.若想将数据按变量C升序排列,可输入
sort C
list
若想按变量C降序排列,可输入
gsort -C

4 画图

1.hist 变量名 , width(5) frequency
其中hist全拼histogram,表示直方图,width(5)表示将组款设为5,frequency表示将纵坐标定为频数(默认使用密度)
2.sc 变量1 变量2 , mlabel(变量1)
其中sc全拼scatter,即画出两个变量的散点图来看二者的关系。mlabel表示以变量1作为标签,显示在图中

5 统计分析

1.su 变量1
其中su全拼summarize,计算变量1的样本容量、平均值、标准差、最小值与最大值。若不表明变量则输出所有变量的统计指标

2.ta 变量1
其中ta全拼tabulate,显示变量1的经验累积分布函数,Freq表示频数,Percent表示百分比,Cum表示累积百分比

3.cor 变量1 变量2 变量3
其中cor全拼correlate,显示变量1 2 3之间的相关关系

6 生成新变量

1.通过generate 简写为gen来实现。
gen lnB=ln(B)
上面命令可定义变量B的对数并生成名为lnB的新变量
gen squareB=B^2
上面命令表示生成新的B的平方变量
2.生成虚拟变量,即只包含0 1的二值项
gen 变量2=1 if 变量11
replace 变量2=0 if 变量2.
3.rename 变量1 变量一
变量1被重命名为变量一
4.drop 变量1
变量1被删除

7 链接新变量

若需要合并其他数据集中的变量,则要用到merge命令。例如表1中需要加入B变量,该变量位于表2中,其中共同字段为A,则可以通过以下命令来将B合并如表1中:
use C:\ 表1.dta,clear
merge m:1 A using E:\表2.dta , keepusing(B)
drop if _merge2
drop _merge
其中m;1表示数据对应关系为多对1,较为常见,关于merge用法的详解可以参考其他博文:https://blog.csdn.net/qq_42729246/article/details/105623056
keepusing(B)表示只引入B变量,若不加这个可选项则表示引入表2中的全部变量。
drop if _merge2表示删除不匹配数据
drop _merge表示删除新生成的 _merge变量

8 do文件


点击上图的新建do文件,即可撰写代码实现可重复性的使用

9 相关练习

1.计算gdp、college的变异系数
变异系数的公式为V=S/|x ̅ | ,其中S 为标准差,x ̅为平均值。两者均可通过Stata自带的函数进行运算,具体代码如下:

计算出来的结果为,gdp的变异系数为0.7695182,college的变异系数为0.4989674(保留小数点后7位)。


2.用Stata计算基尼系数
这里我将人口与GDP数据相结合,计算了各省份人均GDP方面的基尼系数。选用公式为

其中p_i为地区单元比重,w_i为地区某指标比重,q_i为累积比重。因为要计算人均GDP的基尼系数,因此,p_i为各省份人口所占总人口的比例,w_i为各省份GDP占总GDP的比例,q_i为按人均GDP排序后的累积GDP比例。具体代码如下:

计算得到的基尼系数为0.2032725(保留小数点后7位)。

3.对trade变量进行极差标准化并赋值给新变量
与上个问题同理,其公式的不同在于分母,换成了最大值减最小值的极差。具体公式为:


运算结果如下:

stata学习笔记(一)stata入门与基本操作相关推荐

  1. 计量经济学学习与Stata应用笔记(三)Stata入门实例

    计量经济学学习与Stata应用笔记(三)Stata入门实例 使用的版本为stata15. 电力行业规模报酬的经典研究 本例为Nerlove(1963)对电力行业规模的经典研究. 导入数据 Excel的 ...

  2. STATA 学习笔记 :相关系数

    STATA 学习笔记 :相关系数 为什么要计算变量之间的相关系数? 检测变量之间的多重共线性 相关系数呈现的几种方法 1. 散点图矩阵 help graph matrix Description: g ...

  3. STATA学习笔记:数据合并

    STATA学习笔记:数据合并 一 横向合并数据:merge 1. One-to-one merge on specified key variables merge 1:1 varlist using ...

  4. STATA学习笔记:egen函数

    STATA学习笔记:egen函数 1. egen (1)mean() webuse egenxmpl,clear egen avg = mean(cholesterol) gen deviation ...

  5. STATA学习笔记:外部命令

    STATA学习笔记:外部命令 1.设置外部命令存储地址 //在电脑里设置好文件夹以备存储外部命令 //Set location where packages will be installed //方 ...

  6. STATA学习笔记:缺漏值的处理

    STATA学习笔记:缺漏值的处理 1. 缺漏值的标记 stata中缺漏值默认标记为"." "."是数值,且是一个大于任何自然数的数值 [注意] sum.gene ...

  7. STATA学习笔记: do-file

    STATA学习笔记: do-file 1.注释 *注释句 /* 注释句*/ //注释句 2. 断行 将一条语句分行书写,避免语句过长不好阅读 (1) :/// sysuse auto, clear t ...

  8. STATA学习笔记:分组统计和分组回归

    STATA学习笔记:分组统计和分组回归 1. 分组统计 (1)对一个类别变量进行统计时 tabulate命令 tabulate oneway //for one-way tables of frequ ...

  9. Hadoop学习笔记(1) ——菜鸟入门

     Hadoop学习笔记(1) --菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分布式系统基础架构,由Apache基金会所开发.用户能够在不了解分布式底层细节的情况下.开发分布式 ...

  10. iOS学习笔记-地图MapKit入门

    代码地址如下: http://www.demodashi.com/demo/11682.html 这篇文章还是翻译自raywenderlich,用Objective-C改写了代码.没有逐字翻译,如有错 ...

最新文章

  1. jquery1.43源码分析之工具方法
  2. linux共享库 == windows动态库
  3. 在职研究生计算机相关专业有哪些专业,计算机方考研有哪些具体专业,方向
  4. golang第三方日志包seelog配置文件详解
  5. css3实践之图片轮播(Transform,Transition和Animation)
  6. linux内核设计与实现 epub_Epoll学习服务器的简单实现-Linux内核Epoll结构
  7. LoadRunner中添加weblogic监视器(JMX)
  8. 华为手机安卓系统可能停更,鸿蒙系统手机要来了
  9. html底部弹出选择,jQuery手机端底部弹出菜单列表特效代码
  10. sql azure 语法_方便SQL笔记本,用于在Azure Data Studio中进行故障排除
  11. python刚出来多少薪资-Python薪资待遇到底是多少?老男孩python学习
  12. GUI练习——列出指定目录内容
  13. (实例篇)php 使用redis锁限制并发访问类示例
  14. gbq6什么软件能打开_各种格式的文件用什么软件打开
  15. sqlhelper java_java 版本SQLHelper
  16. 探索性测试在哪里适合?
  17. win10系统遇到删不掉的文件夹怎么办
  18. searchEngin_设置bing国际版为默认引擎
  19. 荣耀首批老机型今日下午 4 点开启鸿蒙 HarmonyOS 2 内测
  20. 解决 NET::ERR_INCOMPLETE_CHUNKED_ENCODING 200 (OK)

热门文章

  1. 【matlab图像处理】matlab编程练习
  2. 读“计较,是贫穷的开始”有感
  3. 抖音极速版邀请码自动运行脚本写法分享
  4. 细数15款国外的英文开源商城网店系统
  5. Python 基础的语法用法
  6. 跳跳刷分php远吗_【跳跳刷分】想登顶跳一跳榜首的你还差这个秘籍!
  7. dwg格式文件用什么软件打开(在线看dwg格式文件)
  8. python爬虫实战三:爬取知乎评论
  9. ListPreference详解与使用
  10. 健脾祛湿的中成药有哪些?