连享会[4]-直播平台上线了!
http://lianxh.duanshu.com 

直播:动态空间面板 | 空间双差分 SDID


下面是详细介绍 (如果你的问题已经解决,就不用看了)

Stata中文转码问题很难有一个让所有人满意的通用解法,对于我这样的 Stata 小白用户,一般是采取 case by case 的原则,以下是我最近处理 CGSS 数据过程中遇到的中文乱码问题和解决方法。在「Stata 学习-连享会」QQ 群中 (QQ号:225012362) 讨论后,连老师鼓励我把处理过程记录下来分享给大家,于是形成了这篇小文。

本文使用的版本是 Stata15,其中,CGSS 数据源于经管之家。


按照 Stata 官方的介绍,我们通常采用如下命令来转换 Stata 13 以前生成的文件:

clear //转码的时候数据不能打开cd "D:\data" //设置工作路径, 填入存放待转换数据的文件路径

*-开始转码unicode analyze *//任何文件类型unicode encoding set gb18030unicode translate *

上述命令只能转换当前工作路径下的文件,对于子孙文件夹下的文件就无能为力了。此时可以使用连玉君老师之前编写的 ua 以及 uall (项目地址:https://gitee.com/arlionn/uall ),一次性转换当前工作路径下的所有文件夹及子孙文件夹中的文件。

可以看到,并没有完全转码。Stata 提示 File not translated because it contains unconvertable characters


变量标签也是乱码:


此时,变量标签 label 乱码问题并没有解决,根据 Stata 的提示信息,把最后一行改成:

unicode retranslate *, invalid

此时,我们附加了 invalid 选项,转码结果如下


完成上述操作后,大部分汉字乱码以及显示正常了,还是有个别带中文的数据产生乱码,如图


这时,Stata 会推荐如下命令:

unicode translate   "CGSS2012.dta", transutf8unicode retranslate "CGSS2012.dta", transutf8

我试过,但没什么用。

最终,我采用如下命令顺利解决了问题:

*-路径设定. clear  //执行下面的命令之前务必先清空内存,否则会提示错误信息. cd "D:\data"  //存放待转换数据的路径, 请务必事先备份一份数据

*-转码

. unicode retranslate *, invalid(ignore) transutf8 nodata replace

最终效果如下图所示:


结语

导致转码失败或者不完全的原因有很多,如果读者没时间了解 Stata 的深层架构,希望本文可以作为一种即用的方法惠及更多人。


4天直播-连享会-文本分析与爬虫专题

mysql中文乱码解决_Stata 中文乱码顽疾解决方法相关推荐

  1. eclipse中文乱码解决_Stata中文乱码顽疾解决方法-一行命令

    作者:于翔 (1026281310@qq.com) Stata连享会   计量专题 || 直播间 || 知乎推文 一行命令的事儿: 如果你试了各种现有方法都无法解决 Stata 的中文乱码问题,或许可 ...

  2. MySQL 插入数据时,中文乱码问题的解决

    MySQL 插入数据时,中文乱码问题的解决 参考文章: (1)MySQL 插入数据时,中文乱码问题的解决 (2)https://www.cnblogs.com/sunzn/archive/2013/0 ...

  3. 通俗易懂地解决中文乱码问题(2) --- 分析解决Mysql插入移动端表情符报错 ‘incorrect string value: '\xF0......

    原文:[原创]通俗易懂地解决中文乱码问题(2) --- 分析解决Mysql插入移动端表情符报错 'incorrect string value: '\xF0... 这篇blog重点在解决问题,如果你对 ...

  4. ssh linux mysql 乱码_JAVA ,SSH中文及其乱码问题的解决 6大配置点 使用UTF-8编码

    JSP,mysql,tomcat下(基于struts2)中文及其乱码问题的解决 6大配置点 使用UTF-8编码 目前对遇到J2EE 开发中 中文及其乱码问题,参考网上资料做个总结, 主要是6大配置点: ...

  5. myeclipse连接mysql生成数据表时中文字符乱码或问号(解决方法)

    myeclipse连接mysql生成数据表时中文字符乱码或问号(解决方法) 参考文章: (1)myeclipse连接mysql生成数据表时中文字符乱码或问号(解决方法) (2)https://www. ...

  6. Mysql插入中文的字段内容时乱码的解决方法

    Mysql插入中文的字段内容时乱码的解决方法 参考文章: (1)Mysql插入中文的字段内容时乱码的解决方法 (2)https://www.cnblogs.com/charlypage/p/10780 ...

  7. mysql阿里云不显示中文乱码_MySQL命令窗口下中文显示乱码的解决过程

    MySQL命令窗口下中文显示乱码的解决过程 在dos客户端输出窗口中查询表中的数据,还有项目部署到服务器上时前台的页面,中文数据都显示成乱码,如下图所示: 这个问题困扰了我一天,后来解决了才发现原来我 ...

  8. mysql导入中文数据_MYSQL导入中文数据乱码的四种解决办法

    方式一:通过增添参数 –default-character-set = utf8 解决乱码问题 方式一:通过增添参数 –default-character-set = utf8 解决乱码问题 mysq ...

  9. mysql中文乱码解决方案_Mysql中文乱码解决方案

    Mysql中文乱码解决方案 时间:2017-07-11     来源:华清远见JAVA学院 中文乱码问题一直是我们编程过程中比较常见又让人头疼的问题,但是只要按照标准进行配置,就能很好的避免出现中文乱 ...

最新文章

  1. 本地打包Docker镜像上传至阿里云远程仓库(一站式脚本)
  2. 一种监控全部账户登陆及操作命令的方法
  3. 粉丝回馈 | 用30天换来了这辈子独一无二的纪念
  4. IDA工具各个功能总结
  5. 原型 继承 原型链 闭包
  6. java 代码智能提示,如何在Eclipse中设置Java、JavaScript、HTML智能代码提示
  7. 网络安全之Bot学习笔记
  8. matlab配置vlfeat工具箱
  9. 计算机财务应用实验心得,金蝶财务软件实训心得.doc
  10. python矩阵连乘_动态规划之矩阵连乘问题Python实现方法
  11. kali系统修改中文
  12. COMSOL光学仿真专题案例展示
  13. funnyface表情包制作神奇
  14. 安卓华为魅族等手机含有副账号登陆问题
  15. 搞一下整车以太网技术 | 04 CBS基于信用整形
  16. AutoHotKey进阶 --- 单击网页中的按钮(Acc库)
  17. 为什么量化交易中盈利的稳定性比利润率重要
  18. 9.nodejs 内置模块
  19. 剑指offter-面试题7.用两个栈实现队列
  20. CyberArticle(eLib电子图书馆)网文快捕

热门文章

  1. 将TreeView中导出为XML数据
  2. 批处理引擎MapReduce程序设计
  3. 阿里云智能财务软件好会计进销记账专用软件
  4. linux下网络监听与发送数据包的方法(即libpcap、libnet两种类库的使用方法)
  5. 用户空间与内核空间,进程上下文与中断上下文[总结]【转】
  6. WAS6.1在JDK1.5环境下JSP无法编译问题
  7. [水力建模]EPANET代码解读1
  8. 蚂蚁式管理(Style of Ant Management)
  9. 良好的用户界面设计技巧
  10. linux 下的sar工具命令小结