eclipse中文乱码解决_Stata15:一次性转码,解决中文乱码问题
作者:连玉君 (知乎 | 主页 | 码云)
连享会-知乎推文列表
Note: 助教招聘信息请进入「课程主页」查看。
因果推断-内生性 专题 ⌚ 2020.11.12-15 主讲:王存同 (中央财经大学);司继春(上海对外经贸大学) 课程主页:https://gitee.com/arlionn/YG | 微信版
http://qr32.cn/BlTL43 (二维码自动识别)
空间计量 专题 ⌚ 2020.12.10-13 主讲:杨海生 (中山大学);范巧 (兰州大学) 课程主页:https://gitee.com/arlionn/SP | 微信版
https://gitee.com/arlionn/DSGE (二维码自动识别)
程序使用说明
ua 命令
适用于 stata15 用户。可以一次性对当前工作路径以及所有子文件夹中的文件进行转码(unicode),以保证中文字符可以正常显示。
安装
- 到这里 - 下载 ua.ado
和 ua.hlp
,放置于 D:stata15adobaseu
或 D:stata15adoplusu
文件夹中。(下载地址:https://gitee.com/arlionn/ua )
使用
- 在 Stata 命令窗口中输入
help ua
,查看命令介绍和 Stata 范例。参照范例使用即可。
Stata 范例
* Change current working directory (CWD). cd D:stata15adopersonalmypaper* Unicode all .dta files in CWD and files in sub-directories. ua: unicode encoding set gb18030. ua: unicode translate *.dta* Unicode all files (.do, .ado, .dta, .hlp, etc.) in CWD and files in sub-directories. ua: unicode encoding set gb18030. ua: unicode translate *
连享会 - 文本分析与爬虫 - 专题视频
主讲嘉宾:司继春 || 游万海
故事背景(程序撰写过程)
我昨天下午 5 点有个需求:我是从 Stata 13 直接跳到 15 的。可是,Stata 15 的中文编码方案全变了,导致 do-file 和数据文件中的中文字符全是乱码。Stata 提供了一组
unicode
开头的命令,可以很方便地进行转码。但只能一个文件夹一个文件夹地转。我用了 14 年的 stata,有成百上千个文件夹需要转码! 搜索了半天无果。只好求助涛哥 (李春涛是也)。
涛哥的第一反应是需要编程。我们的共识是需要遍历所有文件夹,记录下来,然后用循环语句进入每一个文件夹,进行转码。
我以为他会停几天再开始做这个工作。又不好催促他,以便搭他的便车。只好自己开始弄。或许他也不好意思搭我的便车,哈哈。
没想到今天晚上写好所有程序和说明文档后分享给他时,他居然也完工了!
看来,有好奇心的人都是一样的亟不可待!
背靠背工作记录
有想法:2017/12/18 17:05
同时完工:2017/12/19 22:28
我们的思路有何差别
整体思路:遍历当前文件夹下的所有子文件夹,对每个文件夹进行转码。问题的关键:如何遍历所有的子文件夹,并记录这些文件夹的名称。涛哥的思路:使用如下
dos
命令遍历当前工作文件夹下的所有子文件夹,并将他们存入一个文本文件output.txt
,随后使用infix
命令读入内存:!dir /B /S /ad >> output.txt
infix strL v 1-2000 using "output.txt"
最终,涛哥的程序长这样:
君哥的思路:使用外部命令
rcd
实现上述功能,所有子文件夹名称均以返回值的形式存储于内存中。执行过程如下:
然后就可以写一个循环逐个文件夹进行转码了:
最终,君哥的程序长这样:
连享会 最新专题 直播
原始程序和使用方法
涛哥的程序
涛哥的程序尚未封装成 .ado
文件,但用起来到也方便。直接复制如下代码到一个 Do-file 中,使用 cd
命令进入需要转码的文件夹,然后选中如下命令,执行即可(快捷键是 Ctrl+D
):
cd "D:stata15adopersonalmypaper" //自行修改
!dir /B /S /ad >> output.txt
clear
unicode analyze output.txt
unicode encoding set gb18030
unicode translate "output.txt", transutf8
unicode erasebackups, badidea
infix strL v 1-2000 using "output.txt"
levelsof v ,local(urllist)
! del output.txt
clear
unicode translate * , transutf8
foreach c of local urllist{clearcd `"`c'"'unicode encoding set gb18030cap unicode translate * , transutf8
}
君哥的程序
已经封装成 .ado
文件,并配有说明文档。请到 Stata连享会-码云-ua项目中(链接为:https://gitee.com/arlionn/ua)下载 ua.ado
和 ua.hlp
文件,放置于 D:stata15adobaseu
或 D:stata15adoplusu
文件夹中。然后在 Stata 命令窗口中输入 help ua
,查看命令介绍和 Stata 范例。参照范例使用即可。
Stata 范例
* 进入需要转码的文件夹. cd D:stata15adopersonalmypaper* 对当前文件夹及子文件夹中的所有 .dta 文件转码. ua: unicode encoding set gb18030. ua: unicode translate *.dta* 对所有类型的文件转码. ua: unicode encoding set gb18030. ua: unicode translate *
结语
生活如此美好!因为有你有我!
精选课程
支持回看,课程不受直播时间限制,可以随时购买观看。
- 游万海,Stata: 分位数回归,4.21 日 19:00-21:00,直播.
- 司继春, 游万海, 文本分析与爬虫:专题视频,四天直播回放
- 连玉君,Stata: 论文精讲与重现,6 小时
- 连玉君,Stata: 实证研究设计,2.4小时,模型设定、稳健性、内生性
- 连玉君,Stata: 动态面板模型,2.5小时,知其然,知其所以然
- 范巧,Matlab: 空间计量前沿系列:动态设定、DID 等,5 次课,每次 2-3 小时
相关课程
连享会-直播课 上线了!http://lianxh.duanshu.com免费公开课:
- 直击面板数据模型 - 连玉君,时长:1 小时 40 分钟
- Stata 33 讲 - 连玉君, 每讲 15 分钟.
- 部分直播课 课程资料下载 (PPT,dofiles 等)
课程一览
支持回看,所有课程可以随时购买观看。连享会 - 文本分析与爬虫 - 专题视频
主讲嘉宾:司继春 || 游万海
连享会 - 效率分析专题已上线:可随时购买学习+全套课件,课程主页 已经放置板书和 FAQs
主讲嘉宾:连玉君 | 鲁晓东 | 张宁课程主页,微信版 https://gitee.com/arlionn/TE
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
- Stata 连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。直播间 有很多视频课程,可以随时观看。
- 连享会-主页 和 知乎专栏,300+ 推文,实证分析不再抓狂。
- 公众号推文分类:计量专题 | 分类推文 | 资源工具。推文分成 内生性 | 空间计量 | 时序面板 | 结果输出 | 交乘调节 五类,主流方法介绍一目了然:DID, RDD, IV, GMM, FE, Probit 等。
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
eclipse中文乱码解决_Stata15:一次性转码,解决中文乱码问题相关推荐
- jsoncpp中文乱码,中文显示为\u问题处理;jsoncpp中文乱码解决;源码方式使用jsoncpp;UTF_8和ASSIC相互转换;
一.jsoncpp中文写入为\u****问题处理:jsoncpp中文乱码解决: 当我们使用jsoncpp读取写入json文件时,会发现明明是中文字符串,但是赋值给Json::Value后却变成\u** ...
- Activiti保存.png 流程图片文件且解决idea中保存图片时显示中文乱码的解决方法
Activiti保存.png 流程图片文件且解决idea中保存图片时显示中文乱码的解决方法 Eclipse 工具中的操作 流程图片生成的两种方式: 使用 activiti-designer 设计流程图 ...
- JAVA-----乱码的处理 乱码的解决方法总结
为什么说乱码是程序员无法避免的话题呢?这个首先要从编码机制上说起,大家都是中文和英文的编码格式不是一样,解码也是不一样的!工作遇到各种各样的乱码的解决方法总结一下. 对于Java由于默认的编码方式是 ...
- python ogr_解决python ogr shp字段写入中文乱码的问题
首先,先确认一下你的字段值是不是乱码,如果是,按照以下方法: 我的字段值是来自于一个geojson字符串,我在对它解析时做了如下处理: properties = fea.get("prope ...
- java zhs16gbk_JAVA-----乱码的处理 乱码的解决方法总结
为什么说乱码是程序员无法避免的话题呢?这个首先要从编码机制上说起,大家都是中文和英文的编码格式不是一样,解码也是不一样的!工作遇到各种各样的乱码的解决方法总结一下. 对于Java由于默认的编码方式是 ...
- 解决在英文版MSSQL中插入中文乱码的问题
解决在英文版MSSQL中插入中文乱码的问题 英文版的MSSQL(据说还有Access,但是我没用过)中直接在SQL语句中插入中文最终会显示??? 但是在中文版的管理器中插入中文却没有问题. 解决的方法 ...
- 解决天堂2单机/JAVAL2J源码CMD后台乱码
解决天堂2单机/JAVAL2J源码CMD后台乱码## 解决天堂2单机/JAVAL2J源码CMD后台乱码 前言:我们知道现在大部分L2J开源都是国外的,所以很多天堂2源码/开源项目组我们在使用的时候, ...
- centos php 中文乱码,XShell连接CentOS 7.2显示中文乱码问题的解决方法
背景 使用U盘往Windows主机.Linux主机传文件还是经常的事,但有时候文件名有中文, 传到Linux机器会有乱码,选择起来也很麻烦,最近刚好遇到,写下解决方法. 环境 Linux [root@ ...
- bug:生产问题,Golang解决csv文件用excel打开中文乱码问题及常见编码和BOM头关系
bug:Golang解决csv文件用excel打开中文乱码问题 1 场景及分析 场景:今天在生成csv文件之后,测试发现用office和wps打开乱码 分析:经过测试之后发现使用记事本打开不乱码,同时 ...
- 通俗易懂地解决中文乱码问题(2) --- 分析解决Mysql插入移动端表情符报错 ‘incorrect string value: '\xF0......
原文:[原创]通俗易懂地解决中文乱码问题(2) --- 分析解决Mysql插入移动端表情符报错 'incorrect string value: '\xF0... 这篇blog重点在解决问题,如果你对 ...
最新文章
- 堆和栈的差别(转过无数次的文章)
- 【PAT (Basic Level) 】1028 人口普查 (20 分)
- android 内部类的优化
- 从任何兼容 TWAIN 的设备获取图象的控件Dynamic Web TWAIN
- json 语法_JSON的基本语法
- 现在做Android开发有前途吗?复习指南
- java怎么输出点,Java实现控制台输出两点间距离
- DevExpress控件使用经验总结
- 基于阈值的损失函数_推荐 :常见损失函数和评价指标总结(附公式amp;代码)...
- matlab 字符串处理(单引号、拼接、char)
- mysql免安装 配置_MySql免安装版配置方法
- 北斗导航 | 两个地面站之间的多跳卫星通信链路(附matlab代码)
- macOS: 卸载 Flash Player 迎接 2021
- [Android6.0][MTK6737] 修改默认允许位置来源第三方应用安装
- 【工具封装】Python 字典列表按中文姓名首字母排序
- python unpacking_Python函数调用时unpacking参数特性
- 黑盒测试的原理及内容
- 搭建直播平台,你需要先知道这些
- 痞子衡嵌入式:ARM Cortex-M文件那些事(3)- 工程文件(.ewp)
- 计算机sng,腾讯高级执行副总裁汤道生:腾讯SNG正在大力布局人工智能