前言

我知道这个标题很唬人,但容我解释两点:首先我是说【数据处理】,不是数据分析更不是数据挖掘,只涉及从获得数据到开始正式分析之前的准备工作,也称【数据清洗】;其次,这只是【比较】,只是比较粗浅的罗列而已,整理一下我最近俩月驳杂的学习内容。

首先介绍使用版本与工具:Python:Python 3.6.6(Anaconda custom)/Jupyter Notebook、pandas、numpy

Excel:Office 365(2016)

SPSS:Statistics 25

SQL:MySQL 8.0/Navicat Premium 12.1

然后提一下背景知识:列(Python/Excel)=字段(SQL)=变量(SPSS)

行(Python/Excel)=记录(SQL)=个案(SPSS)

OK,LET'S DANCE.

Python本地数据

这里说的是读取为pandas的数据框DataFrame格式。首先需要导入pandas和numpy:

import numpy as np

import pandas as pd

一般使用pandas读取表格型数据。如果是本地文件,如csv或xlsx,则常用两个函数:

df=pd.read_csv('路径')

df=pd.read_excel('路径')

这里的路径需要使用反斜杠\,但如果路径中出现中文则会报错,可以这样避开错误:

f=open('中文路径')

df=pd.read_csv(f)

csv文件可能会出现乱码,因此更加推荐使用xlsx格式的数据。读取后默认将第一行作为列名,也就是字段名。数据库数据

这里如运行在本地默认端口的MySQL数据库,其中有一个名叫xtest的数据库中有一个名叫xxx的表,就用如下方式导入到Python:

import pymysql

connect=pymysql.connect(host=‘127.0.0.1',user='root',passwd='密码',db='xtest')

df=pd.read_sql('select * from xxx',connect)

Excel本地数据

如果是csv文件或xlsx文件,直接打开即可。数据库数据及其他

可以使用如下做法:数据-获取外部数据。这里有可以导入Access数据库(自Access)和SQL Server数据库(自其它来源-来自SQL Server)数据,也可以导入文本和XML数据。

值得注意的是这里的 自网站。可以通过这个选项打开一个有表格型数据的网站,导入到本地,可以说是快捷性爬虫了。

更多高级导入来自:自其它来源-来自Microsoft Query,这里不细说。

另外,外部数据如果更新后,Excel不用再次导入,直接使用 数据-连接-全部刷新,即可刷新数据。

Excel真是最熟悉的陌生人,大多数人只用了大概百分之五的功能,这还不算VBA。

SPSS本地数据

当然可直接打开本地的sav文件。

如果是xlsx文件或者csv文件,可以使用如下做法:文件-导入数据-Excel(Csv数据)-选择文件确定-读取选项确定。这里读取选项一般默认第一行作为变量名,其余也是默认就好。数据库数据

SPSS连接数据库需要首先安装ODBC服务,对于MySQL需要从下载安装ODBC插件,

之后在SPSS中:文件-导入数据-数据库-新建查询-选择ODBC数据源-选择表,即可。

SQL本地数据

如果是本地的xlsx文件或者csv文件,推荐使用Navicat的导入向导来导入。

右键点击数据库下拉菜单中的表菜单(不是某个表)

-选择导入向导

-选择导入类型

-选择导入文件(以及导入文件中的某个表)

-导入选项(确定字段名行+确定第一个和最后一个数据行+日期格式,都默认就好)

-选择目标表(这里新文件一般是勾选新建表并命名目标表;如果是追加到某个表后,需要确保字段顺序和格式完全一致,否则会导入不完全)

-确定字段映射(这里可以指定主键)

-确定导入模式(追加或复制)

-开始,开始导入后可以观察已处理和已更新的数据,如果有错误可可以观察是哪里出错,这样比较稳健。数据库数据

当然这里主要是指从别的数据库导入到当前数据库中。

首先连接两个数据库x和y,如果要把y中的wen表导入到x中命名为new,则首先需要连接x库和y库,之后在x中新建以下SQL查询:

create table new as select * from y.wen;

以上就是至今我在四种工具中导入数据的经验。

最后,血泪吐槽:多使用xlsx,少用csv,益寿延年。

python数据导入spss_Python/Excel/SPSS/SQL数据处理方法比较之1 - 数据导入相关推荐

  1. spss与python和sql区别_Python/Excel/SPSS/SQL数据处理方法比较之2 - 数据查看

    继续这个系列.我们导入了数据,接下来做一下基本的查看. Python 我们的处理对象依然是DataFrame对象df. 首先使用head()函数(或tail()函数)查看最前(最后)的5条记录,获取粗 ...

  2. python excel数据处理 空格替换_Python/Excel/SPSS/SQL数据处理方法比较之5 - 空格清理...

    我说的空格清理,是存在于字符串前后(以及中间)的空格. 做过数据清洗才知道空格有多么恶心(平静脸 Python 1.左右两侧空格 如果不使用包,则对于一个字符串左右两边的空格,可以使用字符串函数str ...

  3. php把路由放在数据库,PHP导入Excel到数据库的方法 PHP把数据库数据导出到方法

    PHP导入Excel到数据库的方法 PHP把数据库数据导出到方法 本文实例讲述了PHP将Excel导入数据库及数据库数据导出至Excel的方法.分享给大家供大家参考.具体实现方法如下: 一.导入 导入 ...

  4. python xlrd读取excel-使用Python xlrd模块读取Excel格式文件的方法

    这是一篇关于如何使用Python xlrd模块读取Excel格式文件的方法的文章,下面的python代码中使用 了xlrd模块的方法,这样就能够很方便的读取 excel 文件内容.同是这个xlrd模块 ...

  5. php自定义表单怎么导入excel,织梦dedeCMS将自定义表单数据导入到excel文档实现方法...

    这篇文章主要为大家详细介绍了织梦dedeCMS将自定义表单数据导入到excel文档实现方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴. 织梦的自定义表单适用起 ...

  6. 如何用Python执行常见的Excel和SQL任务

    本教程的代码和数据可在 Github 资源库 中找到.有关如何使用 Github 的更多信息,请参阅本指南. 数据从业者有许多工具可用于分割数据.有些人使用 Excel,有些人使用SQL,有些人使用P ...

  7. 如何用 Python 执行常见的 Excel 和 SQL 任务

    作者:ROGER HUANG 本文翻译自:http://code-love.com/2017/04/30/excel-sql-python/ 来源:https://www.jianshu.com/p/ ...

  8. Pandas数据处理方法(包括数据库数据和普通文件数据)

    pandas是一个强大的分析结构化数据的工具集:它的使用基础是Numpy(提供高性能的矩阵运算):用于数据挖掘和数据分析,同时也提供数据清洗功能. Pandas中常见的数据结构有两种: Series ...

  9. matlab 两列数据相乘,在EXCEL中,两列完全相同的数据,求和结果不一样??单元格两列相乘的公式...

    excel表格中怎样求和以及计算两列的乘积 一.这可以用SUMPRODUCT函数来完成. 二.比如是要 =A1*B1 A2*B2 .....A100*B100,则这个公以简化成 =SUMPRODUCT ...

  10. 计算机表格行列,excel表格中行列数据切换-在excel中如何切换图表的行/列数据

    Word表格中怎样进行行列互换 excel表格如何部分行列置换 Excel中实现行列互换的具体操作知如下: 1.打开excel. 2.选中表格,然后点击[复制]. 3.选择一个空白单元格. 4.点击[ ...

最新文章

  1. ffmpeg 怎么处理udp音频_STREAM: srs 2.0release,ffmpeg实时转码udp流,出现只有音频没有视频的问题?...
  2. c# 泛型有什么作用?
  3. java ssm常用注解_SSM框架中常用的注解
  4. Leetcode-260. 只出现一次的数字 III
  5. 带旋treap概念及模板,带例题:普通平衡树
  6. 2019年1月16日【第三天学习】
  7. Unable to start ServletWebServerApplicationContext due to missing ServletWebServerFactory bean 解决方案
  8. ssg国际数字货币商城源码货币商城+数字货币+双端APP
  9. Linux acpi off报告ACPI bug处理方法
  10. vue3实现动态组件加载写法
  11. HTTP请求的过程和原理
  12. 关于《训练指南》中的“翻棋子游戏”
  13. onlyoffice mysql_Onlyoffice部署文档
  14. Java经典书籍推荐
  15. 中文数字与阿拉伯数字转换(Python)
  16. 微信缓存dat怎么转图片_PC微信dat如何转图片?方式方法
  17. opencv模拟景深效果
  18. NAM: Normalization-based Attention Module,一种新的注意力计算方式,无需额外的参数...
  19. Postgresql适配国产化人大金仓(kingbase)
  20. 二维码如何转为链接,看了这篇文章才知道多好用!

热门文章

  1. 3dmax最基础的建模教程
  2. 职场领导想逼你走时,他会用哪些奇招逼你走?
  3. 小米9下拉状态栏失效
  4. Word基础(三十六)题注与标题样式
  5. ArduinoUNO驱动RGB模块全彩效果示例
  6. java 1.5 jdk_jdk1.5安装及配置
  7. BZOJ4487 [Jsoi2015]染色问题
  8. C语言入门——printf(““)左对齐与右对齐问题
  9. 迅雷下载出错应版权方要求文件无法下载
  10. 2018年博客之星,需要您宝贵的一票!