本文就带大家来学习一个小技巧,如何运用SPSS标识重复个案。我们都知道在Excel中,通常会用到“筛选”功能来选出指定条件相同的单元格。

那么在SPSS中,如何在成千上百万个数据中筛选出重复的个案呢? 小编就是要告诉你,几个步骤轻轻松松搞定。

Step1:当然是导入或者打开数据,前面文章已经介绍到了不同格式的文件如何导入到SPSS中。(如果错过了之前文章的伙伴,可以进入公众号查看历史消息。)

本文,选择了某超市双十一当天的交易明细部分数据。如图1.1。

图1.1 某超市双十一交易明细

Step2:选择“数据”菜单下的“标识重复个案”,弹出相应对话框。如图1.2。

图1.2 标识重复个案对话框

Step3:在上个步骤的基础上,将左边的所有变量都移至右边“定义匹配个案的依据”中,其他的选项没有特殊要求的可保持默认,如图1.3。单击“确定”即完成。

Tip:在第3步,左边的变量移至右边框中时,可按住第一个变量,然后用Shift键同时按住最后一键,搞定所有变量。

图1.3 标识重复个案对话框2

Step4:完成之后,就会出现一个新变量“最后一个基本个案”,如图1.4。

图1.4 标识重复个案结果展示

Step5:然后,右击“最后一个基本个案”变量,选择“升序排序”,这时就会将重复个案展现在最前面了。

Tip:如果不想要显示值标签,想要以0或者1的形式进行显示,可以在“查看”菜单下,将“值标签”前的√去掉,那么变量“最后一个基本个案”,就会以“0(表示重复)”和“1(表示不同个案)”呈现。如图1.5。

一般默认是不显示值标签,所以没有上述情况的伙伴请忽略本条Tip。

图1.5 标识重复个案结果(去除值标签)

Step6:选中“最后一个基本个案”下的变量值为0的个案,鼠标右键,“清除”,就将重复的个案删除了。

以上就是本文的如何标识重复个案的操作步骤,是不是很简单呢,只要找到“标识重复个案”的功能键就可以啦。

快来动手操作下吧。

有问题可在下方留言哦。

到SPSS学堂,回复20180108,可以获取本文原始数据哦~

快去练习吧~

spss练习数据_SPSS篇——如何在成千上百万个数据中标识重复个案相关推荐

  1. python爬斗鱼直播数据图片_Python爬取2000万直播数据——看20万游戏主播能否月入100万...

    原标题:Python爬取2000万直播数据--看20万游戏主播能否月入100万 她那时候还太年轻,不知道命运赠送的礼物,早已暗中标好了价格. --茨威格 社会在发展,时代在进步.伴随着未曾停息的拥护声 ...

  2. vue项目结合iview4UI组件实现树状结构及复杂动态表头列表 Tree-Table 及复杂header 省市区树状表格联动 数据优化后台一次性返回一万条数据页面卡死问题

    一.首先看看需求最终效果图,该需求总共罗列以下几点 最左侧采用树状结构将地址省市区县街道展示出来,并且控制名称长度限制,多余的用省略号表示,鼠标悬浮上去名称展示出来 列表默认展示市一级数据,县及街道数 ...

  3. java poi导入50万数据_java从oracle读取50万条数据写入Excel中抛GC overhead limit exc

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 package com.OracleExcel; import java.sql.*; import java.io.*; import java.uti ...

  4. 女友问粉丝过万如何庆祝,我发万字长文《保姆级大数据入门篇》感恩粉丝们支持,学姐|学妹|学弟|小白看了就懂

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 粉丝破万了 新星计划申 ...

  5. es 删除重复数据_怎么标识并删除SPSS数据库里的“重复个案”?

    背景:测试学生体质数据时,由于部分学生第1次测试成绩不合格,让他们进行了补测.但是,录入数据时,没有替换,造成这部分学生有2个体测成绩,现在需要找到这些重复个案并删除较差的成绩. 1. 数据概览2. ...

  6. 女友问粉丝过万如何庆祝,我发长文《保姆级大数据入门篇》感恩粉丝们支持,学姐|学弟看了就懂

    文章目录 粉丝破万了 新星计划申请时粉丝数 新星内卷抢热榜之旅 运营整顿新星执行新规 重整旗鼓输出内容为王 女友问粉丝过万如何庆祝 保姆级大数据入门篇 一.学习重点划定 二.Java和大数据关系 三. ...

  7. Java 中ArrayList中的重复数据

    以下介绍五种-不同的方法去除 Java 中ArrayList中的重复数据 1.使用LinkedHashSet删除arraylist中的重复数据 LinkedHashSet是在一个ArrayList删除 ...

  8. R语言 数据集某一列中不重复的数据以及其个数

    R语言 数据集某一列中不重复的数据以及其个数 提取出某一列中不重复的数据 unique(data$Symbol) 不重复的数据个数(Symbol的个数) length(unique(totaldata ...

  9. mysql 十万条 输出_mysql - php导出十多万条数据有没有办法更快?

    现在是用phpExcel导出大概需要十分钟多,而且内存报错... 有没有什么办法可以让大量数据导出可以更快呢? ...忘了说因为是一些数据客户需要用到的,所以要用excel格式 回复内容: 现在是用p ...

最新文章

  1. 这可能是最中肯的Redis规范了
  2. matplotlib画图绘制辅助线
  3. 团队开发博客成员介绍(发在个人博客中了)
  4. Python之深入解析如何制作国际空间站实时跟踪器
  5. java 持久化线程_java – Spring Hibernate Envers多线程 – 会话关...
  6. 前端学习(3201):react插件
  7. 【Javascript 拾遗之三】Closure 闭包
  8. shell脚本spawn_如何使用child_process.spawn将Python / Ruby / PHP Shell脚本与Node.js集成
  9. 【华为云技术分享】鲲鹏弹性云服务器GCC交叉编译环境搭建指南
  10. mysql用户管理--密码管理
  11. 6-1 多态性与虚函数
  12. Python学习心得
  13. anbox android 镜像,Anbox:容器中的 Android
  14. 第二章 数据查询语言DQL
  15. 奋什么直什么的成语(奋什么直什么四字成语大全)
  16. iOS使用UICollectionView只允许向左方向滑动,不允许向右方向滑动。
  17. accept()使用
  18. HTTPS证书过期|SSL证书过期 |华硕路由器| NAS|Certtificate is not valid
  19. 医学图像分割之TransUNet
  20. 关于ImportError: DLL load failed: 找不到指定的模块

热门文章

  1. stylus在vue中的使用
  2. 软件开发工具(第1章:绪论)
  3. Python查找指定文件
  4. What Are You Talking About HDU1075
  5. visual studio code搭建本地服务器(node.js+express)
  6. Docker容器的自动化监控实现
  7. 我们怎样确保从大数据计算中获得价值
  8. Java for LeetCode 061 Rotate List
  9. POJ 2152 Fire
  10. Mac OS X Glut build instructions