本文用于记录数据处理过程中出现的问题


目录

一、所用命令

二、实例

1. 使用encode

2. 使用destring

三、可能存在的问题

1. 存在无法转成数值型的数据

2. 取对数时出错

四、参考


一、所用命令

encode varname [if] [in] , generate(newvar) [label(name) noextend]

  • 例子:encode gdp, g(newgdp)

destring [varlist] , {generate(newvarlist)|replace} [destring_options]

  • 例子:destring gdp, replace force (直接替换原数据)
  • 例子:destring gdp, g(newgdp) (另外生成新的一列)

二、实例

字符型数据在Stata中显示为红色,数值型为黑色

1. 使用encode

输入以下命令,可得到转为数值型的人均GDP

encode PG, g(npg)

 

可发现数据为蓝色,此时数据也为数值型

2. 使用destring

输入以下命令,也可得到数值型的人均GDP

destring PG, g(npg2)

此时数据为黑色


三、可能存在的问题

1. 存在无法转成数值型的数据

提示:contains nonnumeric characters; no generate

检查是否有15万这种以中文字符存在的数据

2. 取对数时出错

encode生成的数值型数据在取对数时会出现错误,如下图所示

原因不清楚,因此最好直接用destring

可能的原因来自Stata help encode的说明,如下:

Do not use encode if varname contains
    numbers that merely happen to be stored as strings; instead, use generate
    newvar = real(varname) or destring; see real() or [D] destring.


四、参考

Stata help文件的说明

help ecode
help destring

Stata字符型数据转为数值型数据相关推荐

  1. 【20210805】【数据分析】标称型数据和数值型数据

    (参考:两个基本概念 标称型数据和数值型数据) 监督学习使用的目标变量一般有两种:标称型数据 和 数值型数据. 1. 标称型数据 即离散值.只在有限目标集中取值,如:"真" 或 & ...

  2. Excel VBA 小程序 - 文本型数字转为数值型数字

    实现功能:选中当前工作表中的所有数据内容,将文本型数字转换为数值型数字. 缺点:日期格式的字符串会变成数值 Sub 转数值型数字() With ActiveSheet.UsedRange.Number ...

  3. 标称型数据和数值型数据_2017-12-9 机器学习(4)-标称型和数值型

    [标称型数据和数值型数据] 监督学习一般使用两种类型的目标变量:标称型和数值型 标称型:一般在有限的数据中取,而且只存在'是'和'否'两种不同的结果(一般用于分类) 数值型:可以在无限的数据中取,而且 ...

  4. 机器学习学习笔记 --- 标称型数据和数值型数据

    [标称型数据和数值型数据] 监督学习一般使用两种类型的目标变量:标称型和数值型 标称型:一般在有限的数据中取,而且只存在'是'和'否'两种不同的结果(一般用于分类) 数值型:可以在无限的数据中取,而且 ...

  5. Excel:如何批量将文本数字转为数值型数据

    将文本数字转为数值型数据就是:将单元格里的000231转为231形式.前者是文本形式,后者是数值形式. 单个逐个点击单元格旁边的 报错号,逐个转换太麻烦了. 选择需要转换的某列,选择"数据& ...

  6. 标称型数据和数值型数据

    在学习机器学习的工程中,发现有一种名为标称型的数据,具体如下: 标称型:一般在有限的数据中取,而且只存在'是'和'否'两种不同的结果(一般用于分类) 数值型:可以在无限的数据中取,而且数值比较具体化, ...

  7. stata里php代码,stata字符型数据如何转数值型

    stata字符型数据转数值型的方法:首先依次点击[File-import-Excel spreadsheet]:然后点击右上角的browser选项,并点击打开按钮:最后勾选[import first. ...

  8. 【问题解决】【excel】求平均值、求和 结果为0 ->将excel中文本型数据转化为数值型数据

    问题:求平均值.求和 结果为0 原因:表格中数据是文本型数据,而不是数值型数据,文本型数据平均值求和都为0 解决办法:将excel中文本型数据转化为数值型数据 选中文本型数值区域,发现在选中区域的左上 ...

  9. EXCEL公式-文本型数据转换为数值型数据

    从后台导出的销售数据中,金额.订单数等均为文本型数据,无法进行求和计算. 这个时候可以通过*1将文本型数据快速转换为数值型数据. 如下所示: 其中clean函数用于去除字符串中的非打印字符,如Tab制 ...

最新文章

  1. 洛谷mNOIP模拟赛Day2-入阵曲
  2. 利用matlab处理点云
  3. 手机号归属地区编码_这些关于手机号码的冷知识 你知道吗
  4. 【算法】深度学习神经网络都调哪些参数?
  5. 自监督和语言监督我全都要?Facebook多模态预训练模型SLIP给你答案!
  6. SPOOLing技术的再思考
  7. poj Shortest Prefixes ——trie树、字典树,基础!!
  8. 视频教程-ThreeJS视频教程-JavaScript
  9. 李宏毅机器学习Lesson2——Logistic Regression实现收入预测
  10. 《职场动物进化手册》笔记整理
  11. Java SE 第三讲(原生数据类型使用陷阱 Pitfall of Primitive Data Type)
  12. 2020年中国工程机械租赁行业现状及市场竞争格局分析,工程机械运营市场集中度极低,高空作业平台市场集中度较高「图」
  13. 手动安装ceph和使用
  14. 结构化数据和非结构化数据、半结构化数据的区别-归纳总结整理
  15. matlab三维曲线的绘制
  16. 画质超高的仙侠java游戏_画质超高的游戏有哪些?顶级画质大型游戏盘点
  17. LUA语言教程 [转]
  18. 掌握这个方法,让工作经验配得上工作时间
  19. 百信计算机管理员登录账号密码,192.168.1.1登陆入口管理员密码是多少?
  20. leetcode 953.验证外星语词典(js)

热门文章

  1. java 中介者模式
  2. Android5.0 静音模式下让闹钟仍然响铃
  3. USB gadget设备驱动解析
  4. Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy(PTAV)论文笔记
  5. 在线制作平台H5制作
  6. 如何在cmd命令行窗口打开QQ
  7. 【转】未能加载文件或程序集“XXX”或它的某一个依赖项。试图加载格式不正确的程序。...
  8. 企业上云是什么?有什么优点
  9. 新版天猫刷红包js代码以及使用方式增加砸金砖代码
  10. APP启动时白屏/黑屏 或者 Activity打开时白屏/黑屏