在数据整理及分析中,我们经常遇到需要根据现有变量生成新变量的情况,比如将连续型的年龄划分为年龄段,将BMI的具体值转换为“标准”、“超重”等分组,提取地址变量中的某个字段,提取时间变量中的年月日等等。

在常用的一些编程统计分析软件中,我们需要记住一些函数才能够实现。而在JMP中,这些需求都可以通过清晰直观的“公式编辑器”点击操作实现,某些甚至可以一键生成。

今天这篇文章我们将介绍几个平时分析中最常用的情境,帮助大家直观感受JMP生成新变量的方便与快捷。

为了帮助更多的临床医师学习如何运用JMP高效地开展数据分析,提高日常工作和发表论文的效率,2020年8月起,JMP资深用户、JMP特约专栏作者、资深统计学家冯国双博士及其团队将在JMP数据分析平台为大家分享一系列统计及数据分析、JMP实战操作、JMP分析报表解读等干货内容,每期一个经典话题,帮助大家掌握一个新技能。值得注意的是,这些话题并非仅针对临床医师,对所有运用JMP软件开展数据分析的小伙伴都适用。本文为此系列文章的第7期。

01 如何利用"公式编辑器”生成新变量?

我们首先选取JMP自带样本数据库中的Diabetes数据,如图1。

图1 JMP样本库自带示例数据Diabetes

插入新变量

假设我们要根据BMI产生分类变量。

首先,创建一个新变量用来指示分组。这里有两种方式,第一种是在任何一个变量顶部变量名处单击右键弹出菜单选择插入列,如图2。

图2 插入新变量(方式1)图2 插入新变量(方式1)

第二种是在空列处双击左键,如图3。

图3 插入新变量(方式2)图3 插入新变量(方式2)

插入新变量后,我们可以在该列名处单击右键进行列信息的设置,包括变量名称及类型等(关于变量名称的转换,可点击这里回顾)。这里我们将该变量命名为[BMI分组],变量类型设置为名义变量。

编辑公式
假设将BMI分为三组:正常为<25,超重为25-<30,肥胖为>=30,我们需要利用条件公式,也就是常说的if-then创建新变量。那么在JMP中如何实现呢?

首先,我们在BMI分组变量名处右键菜单中选择【公式…】,即弹出针对该变量的公式编辑对话框,如图4所示。
图4 公式编辑器界面

通过JMP中的条件和比较两部分语句,我们可以生成BMI的分组变量,具体操作步骤如图5和图6。
图5 条件语句操作步骤(1)


图6 条件语句操作步骤(2)

注意:双箭头后面的0、 1、 2是我们给分类的命名,分类名称不局限于数字,我们还可以给分类命名为“正常”、“超重”、“肥胖”。

公式编辑完毕之后,点击应用,确定,即可生成BMI分组变量,如图7所示。

图7 生成BMI分组变量图7 生成BMI分组变量

可能有的朋友觉得这样编辑公式也很麻烦,希望有更简便的操作,那么有没有呢?答案是:有!那就是通过JMP的“新建公式列”也可以快速生成新变量。

02 如何利用“新建公式列”快速生成新变量?

JMP将一些常用的公式集合成了快捷选项,可以通过在变量名处单击鼠标右键触发,达到一键生成新变量的目的。但需要注意的是,不是所有的公式都有,比如上面讲到的按照一定条件分组的操作,还是必须将条件公式输入进去才能生成满足需求的新变量。

那么这个快捷选项怎么操作呢?我们这里举两个例子,示例数据是2019年我国部分城市空气气象数据,见图8。

图8 示例数据图8 示例数据

一键提取日期变量中的月份等信息

在date变量名处单击右键,然后如图9所示依次选择新建公式列→日期时间→月,点击后,即生成月份列,并自动命名为【月】,如图10所示。

图9 一键提取日期中的月份(1)

图10 一键提取日期中的月份(2)

从图9中,我们还可以看到,步骤3中,除了可以选择月,还可以选择年、季度、周、星期等,可以一键提取出想要的日期信息,在我们进行时间序列相关的分析时,你会发现这些快捷选项非常实用。大家感兴趣的话可以每一个功能都实际操作一下看看效果。

一键实现变量变换
新建公式列选项中除了日期相关的提取,更多的是关于连续型变量的变量变换,如图11中,我们可以直接在新列中对选取列进行四舍五入、平方、对数变换、指数变换等操作。

图11 一键实现变量变换(1)

还有针对多列的计算,比如新建公式列→合并→求和,可以得到多个列的加和值,如图12,对其他选项感兴趣的朋友们也可以一一尝试下。

图12 一键实现变量变换(2)

此外,我们甚至可能一键进行更复杂的变换,如图13所示,我们可以针对目标列进行一键中心化、标准化、显示秩次,甚至Box-Cox变换,当然这些操作都需要建立在一个清晰的分析目的基础上。

图13 一键实现变量变换(3)

今天的文章我们分享了如何根据现有变量在JMP中利用“公式编辑器”和“新建公式列”生成满足分析需要的新变量,希望可以帮助大家在数据清洗的过程中事半功倍。

需要强调下的是,这里只是列举了几个比较常用的情况,还有非常多且同样实用的但本文没有具体介绍的公式和选项,希望大家使用一些样本数据多进行尝试和练习,体会无需编程也能快速便捷实现数据处理的乐趣。

如果你也想体验JMP生成新变量的小技巧,欢迎点击这里下载JMP试用,跟着文章练起来吧。

巧用JMP公式,让新变量的生成更简单相关推荐

  1. js中Object类型和Array类型的变量被赋值(复制)给其他变量后,修改被赋值(复制)的新变量的值,会影响原始变量的值,这是为什么呢?

    JavaScript中的Object和Array都是指针变量类型,例如我声明 let obj={a:1};let arr=[1,2,3]; 其中的obj和arr存放的仅仅是对应的对象和数组内容所存放的 ...

  2. 【剑指offer】不使用新变量,交换两个变量的值,C++实现

    # 题目 不使用新变量,交换两个变量的值. # 思路 方法一:使用加减法操作,交换两个变量的值. A = A+B B = A-B A = A-B 方法二:使用异或运算,交换两个变量的值 A = A^B ...

  3. 织梦添加新变量和删除新变量的方法

    1.添加新变量 (1)织梦后台--系统--系统设置--系统基本参数--添加新变量,如下图: (2)打开"添加新变量"的输入框后,以添加站长QQ新变量为例,添加变量值如下图: 变量名 ...

  4. 网易云解码实时音视频社交 成就游戏产业发展新变量

      近年来,网络直播的兴起使实时音视频社交刮起了一阵旋风,裹挟着大批应用进入大众生活.这其中有小咖秀.秒拍这类独立性音视频社交平台,也有嵌入到社交平台的直播类应用,如陌陌视频.而一再引发关注的是实时音 ...

  5. [转载]织梦后台添加新变量-内容模型

    [转载]织梦后台添加新变量-内容模型 收藏 原文地址:织梦后台添加新变量-内容模型作者:吴晓震 织梦网站管理系统以它的使用简便.二次开发能力强而闻名.坐着一直非常喜欢用,虽然IT站长都说他的漏洞非常多 ...

  6. append生成新变量的时候,没有如预期(It's a feature,not a bug?)

    这是我在写一个项目中,遇到的一个golang的feature,如代码所示,我在for循环里,每次用append生成一个新的数组,(当然我以前一直以为可以这样,直到我在stackoverflow上发现不 ...

  7. R语言给数据集创建新变量

    再数据分析的过程中往往需要先创建新变量再进行分析.根据经验,主要包括两方面. 1.独立创建变量,再利用新变量数据进行数据整理和分析,这样比较简单,代码如下: data$newvar<-data$ ...

  8. R语言数据处理 之 创建新变量

    初步的数据处理,通常要创建新的变量.其实,创建新变量可以: 避开未经处理的数据未有所需数据的难处: 变换一些已有数据,以更好的为下一步分析作准备: 而常创建的新变量有: 缺失值指针 (Missingn ...

  9. R语言创建新变量方法

    R语言创建新变量方法 在数据分析中,可能需要对数据进行求和.求均值等处理,并且将处理后的数据重新保存到原来的数据框中,这里提供三种可供解决的方法: 数据框$变量名 <- 表达式.若原数据框中含有 ...

  10. R语言变量的处理(创建新变量 变量重新赋值

    创建新变量: 方法一: #在mydata数据库中创建新变量sum,sum是mydata数据库中x1和x2之和 mydata$sum <- mydata$x1 + mydata$x2 #在myda ...

最新文章

  1. 68页PPT教你撰写一篇优秀的机器学习研究论文!
  2. 在Linux上安装其他版本的cmake 或 升级cmake
  3. 机器学习中的损失函数
  4. html一个层下面两个小层并奇,我是一个奇数是一个两位数,十位数字与个位数字的积是2,猜猜看我是几?——青夏教育精英家教网——...
  5. 运筹学的课程笔记 markov decision process
  6. ITK:将矢量图像投射为另一种类型
  7. [JS]手写动画最小时间间隔设置
  8. WAF指纹识别和XSS过滤器绕过技巧
  9. springmvc 结合ajax批量新增
  10. LeetCode Weekly Contest 142
  11. 数据库oracle修改属性列,Oracle修改表结构
  12. C语言 n的作业,C语言作业练习
  13. MySql 8 命令
  14. 有一个测试微信删除软件叫wool,如果出现这三种情况,便可以删除这些微信好友,此操作适用所有人...
  15. Mysql数据库高可用方案
  16. 教育机构如何从0开始做抖音获客
  17. linux 文件管理器,linux终端文件管理器ranger使用详解
  18. 大学计算机实验基础第二版,大学计算机基础实验指导(第2版)
  19. 每日总结-05-23
  20. PL/SQL 工具远程连接Oracle数据库方法,plsql免安装oracle客户端直接配置oci实战演示

热门文章

  1. 基于网络安全相关的开源项目技术预研分析报告
  2. vs 登录按钮验证_外服战网新增登录方式:关联Apple ID即可快速登录
  3. 2021高考成绩答题卡查询,【助力高考】2021届高考答题卡原来长这样,赶快看看...
  4. 数据结构视频教程 -《[北大张铭 精品课程版]数据结构与算法(C++)》
  5. 程序员必备的画图工具汇总
  6. IT运维服务体系建设思路
  7. AdventureWorks安装问题总结 exe安装
  8. html css js肝撸淘宝官网代码(淘宝web端官网页面+部分js功能实现)
  9. python 多线程爬取网络小说
  10. 前端日志输出分享(没有技术,纯娱乐)