stata是国内大学常用的统计型软件之一,相比于MATLAB、SAS这种相对专业型的数学编程软件来说,stata的学习相对简单,相对于SPSS来说,它又更侧重编程,当然这几种软件都可以进行编程,但以我个人感觉来讲,我更喜欢用MATLAB进行矩阵间的运算,尤其是数据量较大的情况下,更喜欢使用stata来进行数据的清理,至于SAS我只在几年前学习过一点皮毛,但SAS算是最近比较流行的统计软件之一。SPSS这个软件窗口操作很方便,适合没有学过编程的,但如果想在统计或者数据处理的道路上走的更远,建议还是学一个编程式的统计软件吧。

接下来我分几篇文章将我自学的stata进行数据清理的一些重要命令解释一下,其实到现在为止我都没有把stata完全学完,因为它的模块太多了,你们可以看看stata的使用手册就知道了,但我主要讲述大家在论文写作中遇见的一些数据清理问题,侧重点不同,如果你要想利用stata发邮件什么,那我也没用过,不过百度可以帮你解决这些问题。

1.数据的输入问题

方法一:点击窗口左上角的file,根据不同文件类型进行导入,(注:如果不熟悉英语可以下载中文版的更方便文件的初导入,但个人建议还是用英文吧,其实都是一些最基本都词汇,实现不懂就百度一下吧)

方法二:当你采用方法一导入后运行窗口其实已经自动的将这个过程转为代码,然后下次你就可以根据这个代码在命令行导入自己的文件了。

总结:个人比较喜欢采用方法一,因为文件的路径有时候记不住,所以就稍微偷懒没打代码了

2.数据导出保存问题

  • 如果是想保存成stata自带的格式,直接save 文件名就可以了
  • 如果想保存其他格式的文件,有两种方法,一种是窗口导出,即点击窗口左上角的file,根据不同文件类型进行导出,另一种就是在命令行输入相应的文件代码,如果不记得代码,就可以采用方法一就会有相应的代码。

3.do文件的使用保存

do文件可以用来保存自己所需要的代码,以便下次使用,减少代码的重复输入,同时do文件可以加入一些解释备注以便下次使用。

  • do文件的创建:命令行输入doedit
  • do文件注释问题:一种为整行注释,此时只需在行开头输入*即可,一种为在命令后加注释,只需在命令后输入//即可。
  • do文件保存:这个我没具体研究,我都是直接关闭,然后就会出现是否保存,这个方法其实不是很好,想研究的也可以自己下去操作一下,其实这些东西只有自己去使用才会印象深刻。

do文件的保存是非常重要的,可以大大提高你的效率,建议将你经常使用的命令保存成do文件,以便下次使用。其次就是进行论文写作如果你不保存do文件,一旦模型数据有误,如果你没保存do文件,那么就要全部再来一遍,一是浪费时间,二是命令不一定你都还记得,同时你的数据处理过程你可能记得也不是很清楚。

4.help命令的使用

这个命令非常非常重要,我将这个命令放在stata学习的第一课中。当你不明白一些命令的操作时,你就在命令行输入help加命令就可以看这个命令的具体含义和操作了,同时有些命令的帮助还会给出相关的例子,所以一定要学会help。

在我自学stata的过程中,上述四个过程贯穿了整个stata的学习中,所以我将这四个过程放在基础篇中,对于刚学习stata的人来讲,一定要学会这四个过程,至于接下来命令的使用一般都要根据你自身的数据和你自己的需求来进行相应的处理,但其实百度都可以解决,我只是将一些可能会频繁使用的命令系统性的讲解一下,形成一个体系,关于stata的书籍有很多,我刚开始学习的时候太侧重stata的模型那一块了,其实关于模型的命令通常都很简短,而在进行模型的检验之前有大量的工作都在对数据进行处理,因为你拿到的数据一般不像书本上的例子那么完美,第一步数据的处理没有做好,模型的构建回归绝对会出现很大的问题。

(一)数据清理之stata的使用----------数据的导入,导出;do文件的使用问题相关推荐

  1. python数据清理的实践总结_python 数据的清理行为实例详解

    python 数据的清理行为实例详解 数据清洗主要是指填充缺失数据,消除噪声数据等操作,主要还是通过分析"脏数据"产生的原因和存在形式,利用现有的数据挖掘手段去清洗"脏数 ...

  2. 如何在 MySQL / MariaDB 中导入导出数据,导入导出数据库文件、Excel、CSV

    文章目录 本教程将详细讲解 1. MySQL / MariaDB 数据库数据「导出」 2. MySQL / MariaDB 数据库数据「导入」 3. 使用「卡拉云」一键导入导出 MySQL / Mar ...

  3. 数据库学习day_02:表格相关sql语句 / 表格数据相关sql语句 / sql中的数据类型 / 导入外部sql文件 / 去重.是否为null.and与or.in.[x,y]

    1.表相关的SQL语句 操作表相关的SQL 必须先使用某个数据库 create database mydb1; show create database mydb1; use mydb1; 如果默认不 ...

  4. 数据同步Sqoop用法之mysql与Hive导入导出

    目录 一. Sqoop介绍 二. Mysql 数据导入到 Hive 三. Hive数据导入到Mysql 四. mysql数据增量导入hive 1). 新建一张表 2). 初始化hive表: 1). 创 ...

  5. DEV GridControl导入导出Excel文件 - 简单表格数据导入(Microsoft.Office自带)

    1.命名空间 using DevExpress.XtraEditors; using DevExpress.XtraGrid; using DevExpress.XtraGrid.Views.Grid ...

  6. oracle 命令行输出到文件路径,oracle数据泵导入导出dmp文件语法

    导入操作 (本次示例是多个数据泵文件的导入COSPACE.DMP.WISDOMGOV.DMP) 0.数据库登陆 plsql 使用sys账号,as sysdba身份登录orcl实例: 1.在被导入的数据 ...

  7. 05 -数据分析与SQL- Lesson5 SQL数据清理

    05 数据分析与SQL Lesson5 SQL数据清理 文章目录 05 数据分析与SQL Lesson5 SQL数据清理 1.视频:SQL 数据清理简介 2.视频:LEFT 与 RIGHT 4.解决方 ...

  8. 省级面板数据(2000-2019)十八:物质资本(原始数据、测算数据)(stata版本)

    省级面板数据(2000-2019)十八:物质资本(原始数据.测算数据)(stata版本) 数据来源:中国统计年鉴+EPS数据平台+各省统计年鉴 作者收集整理所得!!! 下载链接:https://bbs ...

  9. pinpoint,HBase数据清理

    文章目录 HBASE数据清理 HBase shell 查看表信息 查看表描述 如果修改表信息 HBASE数据清理 pinpoint使用HBASE储存数据,对于HBase进行数据清理. HBase sh ...

最新文章

  1. 除了数据还是数据?2018年5大 AI (人工智能)预测
  2. OpenVAS漏洞扫描基础教程之连接OpenVAS服务
  3. Dreamweaver8注册码
  4. Appium+python自动化2-环境搭建(windows下)
  5. Visual Studio:error MSB8020
  6. Android之项目中调用已有.so库
  7. 软件生成问候图片_这些社交软件你玩过几个?
  8. CVPR 2020 论文大盘点—目标跟踪篇
  9. PocketSphinx语音识别系统语言模型的训练和声学模型的改进
  10. Java基础(一)——基本语法
  11. Spark集群资源如何分配
  12. 毕设题目:Matlab图像融合
  13. 怎么查看linux系统硬盘,查看Linux磁盘空间的八大方法
  14. 2018年上半年阅读总结(系统架构师)
  15. web手机端真机测试
  16. 不小心把苹果手机备忘录删掉怎么恢复
  17. Camtasia2023简体中文标准版免费更新下载
  18. python中continue的用法_关于Python中continue用法问题
  19. Seata分布式事务控制整合Mybatis-Plus导致事务控制失效
  20. 【Algorithm】种子填充算法

热门文章

  1. Ubuntu 执行 bash 脚本异常
  2. Google公司介绍
  3. C# 将小写数字转换为 一般中文大写数字 和 人民币大写数字
  4. ipad iphone开发_如何查看您曾经在iPhone或iPad上下载的所有应用程序
  5. Windows上使用vs编译fdk-aac
  6. latex转word python_分分钟甩Word几条街,Python编辑公式竟可以如此简单!
  7. java 单例模式实现懒汉和饿汉
  8. 美军综合通用作战态势图发展现状及启示
  9. 【数据分析与可视化】Pandas可视化与数据透视表的讲解及实战(超详细 附源码)
  10. 理解一次调频和二次调频的区别