数据抽取也成为数据拆分,是指保留、抽取原数据表中某些字段、记录的部分信息,形成一个新字段、新纪录。分为:字段拆分和随机抽样两种方法。

一:字段拆分

如何提取“身份证号码”字段。身份证号码里面包含了许多信息,例如省份、城市、出生日期、性别等等。我们将它抽取出来,就可以得到相应的字段。也就可以做相应的分析了。如用户的省份分布、出生日期、性别等。

大家都知道在excel中使用字符函数(right、mid、left)就可以将这些信息提取出来。那么在spss中该如何使用呢?接下来教给大家一个在spss中的函数方法。

Substr函数,它跟excel中的mid函数的用法是一致的。函数如下:

Substr(字符串 , 提取的起始位置 , 提取的字符个数)

操作步骤:

【转换】--【计算变量】,弹出【计算变量】对话框,如图

首先在【函数组】框中找到“字符串”类,在【函数和特殊变量】中选择“char.substr(3)”函数,双击,这时该函数就会被移入【数字表达式】框中,然后将表达式修改为“CHAR.SUBSTR(身份证号码,7,4)”,这样就完成了公式的编写。

接着在【目标变量】框中,输入变量名称“年份”,并在【类型与便签】功能中设置为“字符串”

最后点击【确定】按钮。这样就新增加了一个变量“年份”。

拓展:SPSS中计算变量这个功能非常常用,类似于excel的编辑栏功能,可以输入函数或者计算公式来新增变量,后续还会使用它来进行相关的数据处理操作。

二:数据合并

数据合并是指综合数据表中某几个字段的信息或记录,组合成一个新字段、新记录。主要分为两种:A、字段合并、B、记录合并。

A、字段合并,是指将几个字段合并为一个新字段。例如将前面从身份证号码中提取出来的年、月、日三个单独的字段进行合并,得到出生日期。

介绍一个函数concat

操作步骤如上

最后新增加一步:如果想要对年龄进行计算,需要将变量视图中“出生日期2”的数据类型更改为日期。

B、记录合并,也称纵向合并。是将具有共同的数据字段、结构,不同的数据记录表信息合并的一个新的数据表中。数据分析师培训

操作步骤:

【数据】-【合并文件】-【添加个案】,弹出【添加个案】对话框。

选择【浏览】,打开文件

点击【继续】按钮。

如果正确,点击【确定】按钮。完成男女数据合并工作。

python数据导入spss_spss-数据抽取-拆分与合并相关推荐

  1. python csv库,Python 中导入csv数据的三种方法

    Python 中导入csv数据的三种方法,具体内容如下所示: 1.通过标准的Python库导入CSV文件: Python提供了一个标准的类库CSV文件.这个类库中的reader()函数用来导入CSV文 ...

  2. python 批量读取xlsx并合并_如何用Python快速导入多个excel文件并合并文件数据

    日常工作中,每个月都会遇到那么个固定的工作,将业务方同事整理的数据导入GP数据库中的某张表中:听起来是很简单的活呢! 但每次业务MM总会发来一个文件夹,里面有三四十个Excel文件(.xlsx格式,且 ...

  3. 【Python处理EXCEL】基础操作篇:在Python中导入EXCEL数据

    一.前期准备 此篇使用两种导入excel数据的方式,形式上有差别,但两者的根本方法实际上是一样的. 首先需要安装两个模块,一个是pandas,另一个是xlrd. 在顶部菜单栏中点击文件,再点击设置,然 ...

  4. 利用sqoop将hive数据导入导出数据到mysql

    http://niuzhenxin.iteye.com/blog/1726414 运行环境  centos 5.6   hadoop  hive sqoop是让hadoop技术支持的clouder公司 ...

  5. DE连接,创建数据集,数据导入以及数据导出(转载)

    转自:http://blog.csdn.net/kone0611/article/details/51532006 界面 2.数据库的连接 [csharp] view plaincopy IWorks ...

  6. mysql 导入数据 索引_MySQL 索引、数据导入、数据导出

    1.定义:对数据库表的一列或多列的值进行排序的一种结构(Btree方式) 2.优点:加快数据检索速度 3.缺点:占用物理存储空间:当对表中数据更新时,索引需要动态维护,降低数据维护速度 4.索引示例 ...

  7. python如何导入matlab数据,python学习-python到matlab数据的传输

    1..mat文件 matlab和python间的数据传输一般是基于matlab的文件格式.mat,python中numpy和scipy提供了一些函数,可以很好的对.mat文件的数据进行读写和处理.在这 ...

  8. python怎样导入excel数据_python导入excel数据

    1 .导入模块 import xlrd 2 .打开 Excel 文件读取数据 data = xlrd.open_workbook('excelFile.xls') 3 .使用技巧 获取一个工作表 ta ...

  9. python怎样导入excel数据,如何将excel中的数据导入python数组?

    我有一个非常基本的神经网络.对于数组数据,要将数组指向excel文件中的数据,需要执行哪些代码?在 这是数据硬编码的代码.在 如何告诉数组查看计算机上的另一个文件?在import numpy as n ...

  10. 起点小说免费看 Scrapy爬取起点小说网数据导入MongoDB数据

    本文中我们将详细介绍使用Scrapy抓取数据并存入MongoDB数据库,首先给出我们需要抓取得数据: 抓取起点网得全部作品,网址为:https://www.qidian.com/all 关于Scrap ...

最新文章

  1. html显示数据库图片django,django将图片上传数据库后在前端显式的方法
  2. 天之痕java版不能捉妖_〖天之痕游戏常见问题汇总(更新版)〗
  3. SSM-SpringMVC-16:SpringMVC中小论注解式开发之访问方式篇
  4. iovec结构体定义及使用
  5. [HDCTF2019]MFC
  6. delphi7升级delphi2007可以互用马_奶爸带娃玩“升级版摇摇马”火了,像极了传说中的“甘为孺子牛”...
  7. C++ 内存分配层次以及memory primitives的基本用法
  8. javascript 盒子模型
  9. 卢松松分享独立博客运营推广经验
  10. ChainerCV︱堪比Opencv--深度学习工具库(Faster R-CNN、SSD 和 SegNet)
  11. [Bzoj1143][CTSC2008]祭祀river
  12. 系列教程丨用 Docker 探索开源软件 —— Elasticsearch(一)
  13. 单个H扩展到多个H时,机器学习的保证
  14. SuperSocket服务器架设(一):认识SuperSocket
  15. 从VLP-16讲起的激光雷达原理(一)概念篇
  16. WinRT surface屏幕常亮设置
  17. 国家两部委印发《智慧家庭综合标准化体系建设指南》
  18. 聚合支付里各扫码支付的返回报文样例
  19. O365结合ADFS限制用户登录地址 (一) - 开篇介绍
  20. 各大游戏公司面经笔试题汇总(资源来自网络)(实时更新)

热门文章

  1. 微信公众号选择什么服务器好,微信开发选择订阅号还是服务号好?
  2. jmeter中插件管理工具Plugins Manager
  3. 2021-10-28
  4. Java:等额本息还款计算
  5. excel转置怎么操作_Excel----选择性粘贴,工作中必须学会的技能
  6. 首次使用计算机鼠标键盘不能用,电脑鼠标键盘都不能用如何解决 开机后鼠标键盘不能用怎么办...
  7. 使用Scrapy框架爬取网页并保存到Mysql
  8. iOS 视图控制器转场详解
  9. xh2.54母头转换为杜邦线母头
  10. WhatsApp营销工具有哪些?