16

2020-08

文科生带你学Python|Pandas读取数据

距离上一次更新时间有点久,原因么,被大佬的代码打击到了,于是回去自闭充了一波电……

LEARN MORE

图片来自网络,如侵删

向万能的pandas低头

之前的教程讲了什么是第三方库和开源软件的基础知识,由于时间比较久了,大家可以点下面链接回顾一下:

基础知识回顾

接下来我们就从一个非常常用且万能的第三方库:pandas开始吧~

对于绝大多数非专业码农来说,处理数据和办公自动化就是核心需求,所以从pandas上手是一个非常不错的选择。

我在之前的文章中有强调过,学习开源软件,阅读文档是非常非常重要的,因为我自己在这个方面吃过亏,过于相信网上所谓的教程而忽视了文档的阅读导致走了一些弯路(具体来说就是教程已经过时了)。下面是pandas官方文档的链接:https://pandas.pydata.org/pandas-docs/stable/,大家没事的时候可以多看看,阅读英文文档有障碍的可以考虑看中文文档,不过我建议还是看英文比较好,因为中文文档的翻译总是有些地方不太对劲。

pandas官方文档

(User guide是我们一般意义上所说的文档,Getting started可以看,其他两个文档偏开发人员,我们业余选手就没必要看了)

从import开始

第三方库的使用是从import 开始的,想用哪个库就用import+库名开始,比如我们想用pandas,就用import pands作为第一行代码。

后续如果我们想要使用pandas中内置的函数和方法,就用pandas.函数名进行使用就可以了。由于pandas名字太长了,每次都输入全称非常麻烦,就好像我们在写文章的时候经常写:《关于XXXX的XXX的办法》(以下简称办法)一样。我们习惯上把pandas缩写为pd,这样后续调用的时候会省很多事,“以下简称”这样的文字在代码中用as表示(说句题外话,mysql中也是用as表示缩写哦,以及as是可以省略的)。在实际使用的过程中,我们一般这么写:

当然,你也可以缩写成其他的,不缩写的pd。不过还是建议按照大家的习惯用法来哈~

pd.read_一切

pandas读取数据还是非常容易记住:pd.read_一切。下面这个就是pandas支持读取的文件类型,你能想到的,pandas都可以,并且读取的代码都很好记忆,比如:

读取csv就是pd.read_csv(路径名),读取excel文件就是pd.read_excel(路径名),读取txt文件的就是pd.read_table(路径名),读取json文件就是pd.read_json(路径名)……

下图以读取excel表为例,展示一下读取excel文件的过程:

如上图所示,读取一个excel文件,因为文件的路径名中包含中文,所以需要在路径名之前加一个r进行转义,如果路径名中全是英文,并且是‘//’形式的就不需要在前面加r进行转义。此外,建议路径中不要有中文字符,用r转义有可能出错。

read_excel参数

读取excel文件有很多参数可以用,用好了这些参数可以解决很多问题。

使用help(pd.read_excel)可以查看read_excel对应的参数和使用方法及示例。

pd.read_excel的参数列表如下,虽然在上面的图示中我只用了io(路径)一个参数。

sheet_name参数可以指定sheet的名称,在读取多sheet文件的时候非常适用。

header参数可以指定表头是哪一行,对于开头有空行的文件和表头为多行的文件非常适用。

此外,还可以用index_col参数指定只读取某几列,用dtype指定数据类型……

具体参数的使用给大家推荐两个教程:

文字版

视频版:https://www.bilibili.com/video/BV1Ni4y1t7tf【这个up主的视频超赞】

HR大数据

用数据赋能人力资源管理

关注公众平台点击下方菜单查看更多

pandas 不要编号 加一行_文科生带你学Python|Pandas读取数据相关推荐

  1. python中数据读写_【循序渐进学Python——文件中数据的读写以及操作】

    [循序渐进学Python--文件中数据的读写以及操作] [循序渐进学Python--文件中数据的读写以及操作] [循序渐进学Python--文件中数据的读写以及操作] 相信大家都想过自己有一天,可以用 ...

  2. 白噪声检验python_python 加一个白噪声跟老齐学Python之Python安装

    任何高级语言都是需要一个自己的编程环境的,这就好比写字一样,需要有纸和笔,在计算机上写东西,也需要有文字处理软件,比如各种名称的OFFICE.笔和纸以及office软件,就是写东西的硬件或软件,总之, ...

  3. pandas 做柱状图 显示中文_官方调研重磅发布,Pandas或将重构?

    为指引 Pandas 未来开发方向,Pandas 官方团队于 2019 年夏搞了一次调研,这次调研历时 15 天,共有 1250 条反馈数据.问卷数据保存在 data 文件夹的 2019.csv.zi ...

  4. oracle oci.dll无法加载_基于OGG 实现Oracle到Kafka增量数据实时同步

    背景 在大数据时代,存在大量基于数据的业务.数据需要在不同的系统之间流动.整合.通常,核心业务系统的数据存在OLTP数据库系统中,其它业务系统需要获取OLTP系统中的数据.传统的数仓通过批量数据同步的 ...

  5. pythonfor循环100次_【零基础学Python】For循环和RANGE()函数

    while循环不断循环,而其条件是True.那如果要限制循环代码块的次数,就可以使用for循环语句和range()函数来执行. 在代码中,一条for语句始终包含以下内容:for关键字 变量名 in关键 ...

  6. python的def语句_【零基础学Python】def语句,参数和None值

    像之前的print().input()和len()功能,Python提供了一些类似的内置函数,另外也可以自己编写自定义函数. 示例: def hello(): print('Howdy!') prin ...

  7. python私人定制_手把手教你学python第十五讲(魔法方法续私人“定制”)

    python无处不对象的深刻理解 前面写了这么多,我觉得有必要从一个大的层面,也就是OO来看问题的本质.只要你调用对象的语法是合乎python的习惯的,那就是可以的,我们以前从来没有像下面这么写过,对 ...

  8. python如何读取数据保存为新格式_Python -- 数据加载、存储与文件格式

    标签(空格分隔): Python 读入读出通常可以划分为几个大类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据,利用Web API操作网络资源. 读写文本格式的数据 pandas提供了一 ...

  9. python array赋值_从踩坑学Python内部原理(5):执行时机的差异

    (给Python开发者加星标,提升Python技能) 英文:Satwik Kansal,翻译:暮晨 Python开发者整理自 GitHub [导读]:Python 是一个设计优美的解释型高级语言,它提 ...

最新文章

  1. 震精~python运算符还能这么玩~到底这么做到的?神级程序员解密!
  2. E. coli 大肠杆菌 短read ERR022075
  3. 【贪心】P1056 排座椅
  4. [Java] Hashmap分析
  5. linux将所有文件生成lst_Linux自定义repo文件
  6. 初识C++之运算符重载
  7. 零式机器人_最帅机器人作品“EVA”“天元突破”谁才是男人真正的浪漫
  8. yum mysql 如何启动_CentOS7用yum安装MySQL与启动
  9. Vue——知识体系总结
  10. 对不起,离开平台,你什么都不是
  11. Java 的三种 Base64
  12. windows清理系统垃圾bat脚本
  13. B1105 Spiral Matrix (画图)
  14. 计算机上睡眠和休眠区别,计算机睡眠和休眠的区别
  15. CentOS7下的软件安装方法及策略详解
  16. java毕业生设计中小型连锁超市配送中心配送管理计算机源码+系统+mysql+调试部署+lw
  17. python代码如何加密
  18. C++学习需要看的书籍
  19. 电子产品销售数据分析
  20. kalman、particle filter直白理解

热门文章

  1. Unity面试题精选(1)
  2. excel三次样条函数_用于数字成像的双三次插值技术?
  3. java读取word文档内容_合并多个Word文档内容,还在复制粘贴就out了,同事五秒轻松搞定...
  4. java 注解 jpa_详解Spring Data JPA使用@Query注解(Using @Query)
  5. harbor 多端口_安装Harbor并修改默认使用的80端口
  6. 螺旋进刀非法平面选择_进刀方法、刀片类型、术语...螺纹加工重点知识你都知道吗?...
  7. if condition 大于_EXCEL中IF函数由浅入深实例分析
  8. potplayer 多个进程_什么是进程
  9. linux安装配置java,Linux 安装配置 java 环境
  10. 查询所有_学会DSUM函数,轻松搞定所有的数据查询与数据求和