python数据导入spss_spss-数据抽取-拆分与合并
数据抽取也成为数据拆分,是指保留、抽取原数据表中某些字段、记录的部分信息,形成一个新字段、新纪录。分为:字段拆分和随机抽样两种方法。
一:字段拆分
如何提取“身份证号码”字段。身份证号码里面包含了许多信息,例如省份、城市、出生日期、性别等等。我们将它抽取出来,就可以得到相应的字段。也就可以做相应的分析了。如用户的省份分布、出生日期、性别等。
大家都知道在excel中使用字符函数(right、mid、left)就可以将这些信息提取出来。那么在spss中该如何使用呢?接下来教给大家一个在spss中的函数方法。
Substr函数,它跟excel中的mid函数的用法是一致的。函数如下:
Substr(字符串 , 提取的起始位置 , 提取的字符个数)
操作步骤:
【转换】--【计算变量】,弹出【计算变量】对话框,如图
首先在【函数组】框中找到“字符串”类,在【函数和特殊变量】中选择“char.substr(3)”函数,双击,这时该函数就会被移入【数字表达式】框中,然后将表达式修改为“CHAR.SUBSTR(身份证号码,7,4)”,这样就完成了公式的编写。
接着在【目标变量】框中,输入变量名称“年份”,并在【类型与便签】功能中设置为“字符串”
最后点击【确定】按钮。这样就新增加了一个变量“年份”。
拓展:SPSS中计算变量这个功能非常常用,类似于excel的编辑栏功能,可以输入函数或者计算公式来新增变量,后续还会使用它来进行相关的数据处理操作。
二:数据合并
数据合并是指综合数据表中某几个字段的信息或记录,组合成一个新字段、新记录。主要分为两种:A、字段合并、B、记录合并。
A、字段合并,是指将几个字段合并为一个新字段。例如将前面从身份证号码中提取出来的年、月、日三个单独的字段进行合并,得到出生日期。
介绍一个函数concat
操作步骤如上
最后新增加一步:如果想要对年龄进行计算,需要将变量视图中“出生日期2”的数据类型更改为日期。
B、记录合并,也称纵向合并。是将具有共同的数据字段、结构,不同的数据记录表信息合并的一个新的数据表中。数据分析师培训
操作步骤:
【数据】-【合并文件】-【添加个案】,弹出【添加个案】对话框。
选择【浏览】,打开文件
点击【继续】按钮。
如果正确,点击【确定】按钮。完成男女数据合并工作。
python数据导入spss_spss-数据抽取-拆分与合并相关推荐
- python csv库,Python 中导入csv数据的三种方法
Python 中导入csv数据的三种方法,具体内容如下所示: 1.通过标准的Python库导入CSV文件: Python提供了一个标准的类库CSV文件.这个类库中的reader()函数用来导入CSV文 ...
- python 批量读取xlsx并合并_如何用Python快速导入多个excel文件并合并文件数据
日常工作中,每个月都会遇到那么个固定的工作,将业务方同事整理的数据导入GP数据库中的某张表中:听起来是很简单的活呢! 但每次业务MM总会发来一个文件夹,里面有三四十个Excel文件(.xlsx格式,且 ...
- 【Python处理EXCEL】基础操作篇:在Python中导入EXCEL数据
一.前期准备 此篇使用两种导入excel数据的方式,形式上有差别,但两者的根本方法实际上是一样的. 首先需要安装两个模块,一个是pandas,另一个是xlrd. 在顶部菜单栏中点击文件,再点击设置,然 ...
- 利用sqoop将hive数据导入导出数据到mysql
http://niuzhenxin.iteye.com/blog/1726414 运行环境 centos 5.6 hadoop hive sqoop是让hadoop技术支持的clouder公司 ...
- DE连接,创建数据集,数据导入以及数据导出(转载)
转自:http://blog.csdn.net/kone0611/article/details/51532006 界面 2.数据库的连接 [csharp] view plaincopy IWorks ...
- mysql 导入数据 索引_MySQL 索引、数据导入、数据导出
1.定义:对数据库表的一列或多列的值进行排序的一种结构(Btree方式) 2.优点:加快数据检索速度 3.缺点:占用物理存储空间:当对表中数据更新时,索引需要动态维护,降低数据维护速度 4.索引示例 ...
- python如何导入matlab数据,python学习-python到matlab数据的传输
1..mat文件 matlab和python间的数据传输一般是基于matlab的文件格式.mat,python中numpy和scipy提供了一些函数,可以很好的对.mat文件的数据进行读写和处理.在这 ...
- python怎样导入excel数据_python导入excel数据
1 .导入模块 import xlrd 2 .打开 Excel 文件读取数据 data = xlrd.open_workbook('excelFile.xls') 3 .使用技巧 获取一个工作表 ta ...
- python怎样导入excel数据,如何将excel中的数据导入python数组?
我有一个非常基本的神经网络.对于数组数据,要将数组指向excel文件中的数据,需要执行哪些代码?在 这是数据硬编码的代码.在 如何告诉数组查看计算机上的另一个文件?在import numpy as n ...
- 起点小说免费看 Scrapy爬取起点小说网数据导入MongoDB数据
本文中我们将详细介绍使用Scrapy抓取数据并存入MongoDB数据库,首先给出我们需要抓取得数据: 抓取起点网得全部作品,网址为:https://www.qidian.com/all 关于Scrap ...
最新文章
- html显示数据库图片django,django将图片上传数据库后在前端显式的方法
- 天之痕java版不能捉妖_〖天之痕游戏常见问题汇总(更新版)〗
- SSM-SpringMVC-16:SpringMVC中小论注解式开发之访问方式篇
- iovec结构体定义及使用
- [HDCTF2019]MFC
- delphi7升级delphi2007可以互用马_奶爸带娃玩“升级版摇摇马”火了,像极了传说中的“甘为孺子牛”...
- C++ 内存分配层次以及memory primitives的基本用法
- javascript 盒子模型
- 卢松松分享独立博客运营推广经验
- ChainerCV︱堪比Opencv--深度学习工具库(Faster R-CNN、SSD 和 SegNet)
- [Bzoj1143][CTSC2008]祭祀river
- 系列教程丨用 Docker 探索开源软件 —— Elasticsearch(一)
- 单个H扩展到多个H时,机器学习的保证
- SuperSocket服务器架设(一):认识SuperSocket
- 从VLP-16讲起的激光雷达原理(一)概念篇
- WinRT surface屏幕常亮设置
- 国家两部委印发《智慧家庭综合标准化体系建设指南》
- 聚合支付里各扫码支付的返回报文样例
- O365结合ADFS限制用户登录地址 (一) - 开篇介绍
- 各大游戏公司面经笔试题汇总(资源来自网络)(实时更新)