作者:连玉君 (知乎 | 主页 | 码云)

连享会-知乎推文列表

Note: 助教招聘信息请进入「课程主页」查看。

因果推断-内生性 专题 ⌚ 2020.11.12-15 主讲:王存同 (中央财经大学);司继春(上海对外经贸大学) 课程主页https://gitee.com/arlionn/YG | 微信版

http://qr32.cn/BlTL43 (二维码自动识别)

空间计量 专题 ⌚ 2020.12.10-13 主讲:杨海生 (中山大学);范巧 (兰州大学) 课程主页https://gitee.com/arlionn/SP | 微信版

https://gitee.com/arlionn/DSGE (二维码自动识别)


程序使用说明

ua 命令

适用于 stata15 用户。可以一次性对当前工作路径以及所有子文件夹中的文件进行转码(unicode),以保证中文字符可以正常显示。

安装

- 到这里 - 下载 ua.adoua.hlp,放置于 D:stata15adobaseuD:stata15adoplusu 文件夹中。(下载地址:https://gitee.com/arlionn/ua )

使用

  • 在 Stata 命令窗口中输入 help ua,查看命令介绍和 Stata 范例。参照范例使用即可。

Stata 范例

* Change current working directory (CWD). cd D:stata15adopersonalmypaper* Unicode all .dta files in CWD and files in sub-directories. ua: unicode encoding set gb18030. ua: unicode translate *.dta* Unicode all files (.do, .ado, .dta, .hlp, etc.) in CWD and files in sub-directories. ua: unicode encoding set gb18030. ua: unicode translate *

连享会 - 文本分析与爬虫 - 专题视频
主讲嘉宾:司继春 || 游万海

故事背景(程序撰写过程)

我昨天下午 5 点有个需求:我是从 Stata 13 直接跳到 15 的。可是,Stata 15 的中文编码方案全变了,导致 do-file 和数据文件中的中文字符全是乱码。Stata 提供了一组 unicode 开头的命令,可以很方便地进行转码。但只能一个文件夹一个文件夹地转。我用了 14 年的 stata,有成百上千个文件夹需要转码! 搜索了半天无果。只好求助涛哥 (李春涛是也)。
涛哥的第一反应是需要编程。我们的共识是需要遍历所有文件夹,记录下来,然后用循环语句进入每一个文件夹,进行转码。
我以为他会停几天再开始做这个工作。又不好催促他,以便搭他的便车。只好自己开始弄。或许他也不好意思搭我的便车,哈哈。
没想到今天晚上写好所有程序和说明文档后分享给他时,他居然也完工了!
看来,有好奇心的人都是一样的亟不可待!

背靠背工作记录

有想法:2017/12/18 17:05

同时完工:2017/12/19 22:28

我们的思路有何差别

整体思路:遍历当前文件夹下的所有子文件夹,对每个文件夹进行转码。问题的关键:如何遍历所有的子文件夹,并记录这些文件夹的名称。涛哥的思路:使用如下 dos 命令遍历当前工作文件夹下的所有子文件夹,并将他们存入一个文本文件 output.txt,随后使用infix命令读入内存:!dir /B /S /ad >> output.txtinfix strL v 1-2000 using "output.txt"

最终,涛哥的程序长这样:

君哥的思路:使用外部命令rcd实现上述功能,所有子文件夹名称均以返回值的形式存储于内存中。执行过程如下:

然后就可以写一个循环逐个文件夹进行转码了:

最终,君哥的程序长这样:

连享会最新专题直播

原始程序和使用方法

涛哥的程序

涛哥的程序尚未封装成 .ado 文件,但用起来到也方便。直接复制如下代码到一个 Do-file 中,使用 cd 命令进入需要转码的文件夹,然后选中如下命令,执行即可(快捷键是 Ctrl+D):

cd "D:stata15adopersonalmypaper" //自行修改
!dir /B /S /ad >> output.txt
clear
unicode analyze output.txt
unicode encoding set gb18030
unicode translate  "output.txt", transutf8
unicode erasebackups, badidea
infix strL v 1-2000 using "output.txt"
levelsof v ,local(urllist)
! del output.txt
clear
unicode translate * , transutf8
foreach c of local urllist{clearcd `"`c'"'unicode encoding set gb18030cap unicode translate * , transutf8
}

君哥的程序

已经封装成 .ado 文件,并配有说明文档。请到 Stata连享会-码云-ua项目中(链接为:https://gitee.com/arlionn/ua)下载 ua.adoua.hlp 文件,放置于 D:stata15adobaseuD:stata15adoplusu 文件夹中。然后在 Stata 命令窗口中输入 help ua,查看命令介绍和 Stata 范例。参照范例使用即可。

Stata 范例

* 进入需要转码的文件夹. cd D:stata15adopersonalmypaper* 对当前文件夹及子文件夹中的所有 .dta 文件转码. ua: unicode encoding set gb18030. ua: unicode translate *.dta* 对所有类型的文件转码. ua: unicode encoding set gb18030. ua: unicode translate *

结语

生活如此美好!因为有你有我!

精选课程

支持回看,课程不受直播时间限制,可以随时购买观看。

  • 游万海,Stata: 分位数回归,4.21 日 19:00-21:00,直播.
  • 司继春, 游万海, 文本分析与爬虫:专题视频,四天直播回放
  • 连玉君,Stata: 论文精讲与重现,6 小时
  • 连玉君,Stata: 实证研究设计,2.4小时,模型设定、稳健性、内生性
  • 连玉君,Stata: 动态面板模型,2.5小时,知其然,知其所以然
  • 范巧,Matlab: 空间计量前沿系列:动态设定、DID 等,5 次课,每次 2-3 小时

相关课程

连享会-直播课 上线了!http://lianxh.duanshu.com免费公开课:

  • 直击面板数据模型 - 连玉君,时长:1 小时 40 分钟
  • Stata 33 讲 - 连玉君, 每讲 15 分钟.
  • 部分直播课 课程资料下载 (PPT,dofiles 等)

课程一览

支持回看,所有课程可以随时购买观看。连享会 - 文本分析与爬虫 - 专题视频
主讲嘉宾:司继春 || 游万海

连享会 - 效率分析专题已上线:可随时购买学习+全套课件,课程主页 已经放置板书和 FAQs
主讲嘉宾:连玉君 | 鲁晓东 | 张宁课程主页微信版 https://gitee.com/arlionn/TE

Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。


关于我们

  • Stata 连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
  • 连享会-主页知乎专栏,300+ 推文,实证分析不再抓狂。
  • 公众号推文分类:计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。

连享会小程序:扫一扫,看推文,看视频……


扫码加入连享会微信群,提问交流更方便

eclipse中文乱码解决_Stata15:一次性转码,解决中文乱码问题相关推荐

  1. jsoncpp中文乱码,中文显示为\u问题处理;jsoncpp中文乱码解决;源码方式使用jsoncpp;UTF_8和ASSIC相互转换;

    一.jsoncpp中文写入为\u****问题处理:jsoncpp中文乱码解决: 当我们使用jsoncpp读取写入json文件时,会发现明明是中文字符串,但是赋值给Json::Value后却变成\u** ...

  2. Activiti保存.png 流程图片文件且解决idea中保存图片时显示中文乱码的解决方法

    Activiti保存.png 流程图片文件且解决idea中保存图片时显示中文乱码的解决方法 Eclipse 工具中的操作 流程图片生成的两种方式: 使用 activiti-designer 设计流程图 ...

  3. JAVA-----乱码的处理 乱码的解决方法总结

    为什么说乱码是程序员无法避免的话题呢?这个首先要从编码机制上说起,大家都是中文和英文的编码格式不是一样,解码也是不一样的!工作遇到各种各样的乱码的解决方法总结一下. 对于Java由于默认的编码方式是 ...

  4. python ogr_解决python ogr shp字段写入中文乱码的问题

    首先,先确认一下你的字段值是不是乱码,如果是,按照以下方法: 我的字段值是来自于一个geojson字符串,我在对它解析时做了如下处理: properties = fea.get("prope ...

  5. java zhs16gbk_JAVA-----乱码的处理 乱码的解决方法总结

    为什么说乱码是程序员无法避免的话题呢?这个首先要从编码机制上说起,大家都是中文和英文的编码格式不是一样,解码也是不一样的!工作遇到各种各样的乱码的解决方法总结一下. 对于Java由于默认的编码方式是 ...

  6. 解决在英文版MSSQL中插入中文乱码的问题

    解决在英文版MSSQL中插入中文乱码的问题 英文版的MSSQL(据说还有Access,但是我没用过)中直接在SQL语句中插入中文最终会显示??? 但是在中文版的管理器中插入中文却没有问题. 解决的方法 ...

  7. 解决天堂2单机/JAVAL2J源码CMD后台乱码

    解决天堂2单机/JAVAL2J源码CMD后台乱码## 解决天堂2单机/JAVAL2J源码CMD后台乱码 ​前言:我们知道现在大部分L2J开源都是国外的,所以很多天堂2源码/开源项目组我们在使用的时候, ...

  8. centos php 中文乱码,XShell连接CentOS 7.2显示中文乱码问题的解决方法

    背景 使用U盘往Windows主机.Linux主机传文件还是经常的事,但有时候文件名有中文, 传到Linux机器会有乱码,选择起来也很麻烦,最近刚好遇到,写下解决方法. 环境 Linux [root@ ...

  9. bug:生产问题,Golang解决csv文件用excel打开中文乱码问题及常见编码和BOM头关系

    bug:Golang解决csv文件用excel打开中文乱码问题 1 场景及分析 场景:今天在生成csv文件之后,测试发现用office和wps打开乱码 分析:经过测试之后发现使用记事本打开不乱码,同时 ...

  10. 通俗易懂地解决中文乱码问题(2) --- 分析解决Mysql插入移动端表情符报错 ‘incorrect string value: '\xF0......

    原文:[原创]通俗易懂地解决中文乱码问题(2) --- 分析解决Mysql插入移动端表情符报错 'incorrect string value: '\xF0... 这篇blog重点在解决问题,如果你对 ...

最新文章

  1. 堆和栈的差别(转过无数次的文章)
  2. 【PAT (Basic Level) 】1028 人口普查 (20 分)
  3. android 内部类的优化
  4. 从任何兼容 TWAIN 的设备获取图象的控件Dynamic Web TWAIN
  5. json 语法_JSON的基本语法
  6. 现在做Android开发有前途吗?复习指南
  7. java怎么输出点,Java实现控制台输出两点间距离
  8. DevExpress控件使用经验总结
  9. 基于阈值的损失函数_推荐 :常见损失函数和评价指标总结(附公式amp;代码)...
  10. matlab 字符串处理(单引号、拼接、char)
  11. mysql免安装 配置_MySql免安装版配置方法
  12. 北斗导航 | 两个地面站之间的多跳卫星通信链路(附matlab代码)
  13. macOS: 卸载 Flash Player 迎接 2021
  14. [Android6.0][MTK6737] 修改默认允许位置来源第三方应用安装
  15. 【工具封装】Python 字典列表按中文姓名首字母排序
  16. python unpacking_Python函数调用时unpacking参数特性
  17. 黑盒测试的原理及内容
  18. 搭建直播平台,你需要先知道这些
  19. 痞子衡嵌入式:ARM Cortex-M文件那些事(3)- 工程文件(.ewp)
  20. 计算机sng,腾讯高级执行副总裁汤道生:腾讯SNG正在大力布局人工智能

热门文章

  1. 碎片知识总结_刷题篇
  2. 理解Java主函数中的String[] args
  3. C# 获得当前应用程序路径
  4. linux输出重定向
  5. UVA 167 - The Sultan's Successors
  6. 基于留一法的快速KNN代码
  7. HTML5与HTML4区别
  8. 编程语言(C语言,JAVA),程序设计,APP开发,算法
  9. 智能优化算法:旗鱼优化算法-附代码
  10. 基于arcpy包在arcmap里面实现图层的随机选取