导读:pandas.read_excel接口用于读取Excel格式的数据文件,由于它使用非常频繁、功能强大、参数众多,因此本文专门做详细介绍。

作者:李庆辉

来源:大数据DT(ID:hzdashuju)

01 语法

pandas.read_excel接口的语法如下:

pd.read_excel(io, sheet_name=0, header=0,names=None, index_col=None,usecols=None, squeeze=False,dtype=None, engine=None,converters=None, true_values=None,false_values=None, skiprows=None,nrows=None, na_values=None,keep_default_na=True, verbose=False,parse_dates=False, date_parser=None,thousands=None, comment=None, skipfooter=0,convert_float=True, mangle_dupe_cols=True, **kwds)

02 文件内容

io为第一个参数,没有默认值,也不能为空,根据Python的语法,第一个参数传参时可以不写。可以传入本地文件名或者远程文件的URL:

# 字符串、字节、Excel文件、xlrd.Book实例、路径对象或者类似文件的对象
# 本地相对路径
pd.read_excel('data/data.xlsx') # 注意目录层级
pd.read_excel('data.xls') # 如果文件与代码文件在同一目录下
# 本地绝对路径
pd.read_excel('/user/gairuo/data/data.xlsx')
# 使用URL
pd.read_excel('https://www.gairuo.com/file/data/dataset/team.xlsx')

与read_csv一样,需要注意,Mac和Windows中的路径写法不一样。

03 表格

sheet_name可以指定Excel文件读取哪个sheet,如果不指定,默认读取第一个。

# 字符串、整型、列表、None,默认为0
pd.read_excel('tmp.xlsx', sheet_name=1) # 第二个sheet
pd.read_excel('tmp.xlsx', sheet_name='总结表') # 按sheet的名字# 读取第一个、第二个、名为Sheet5的sheet,返回一个df组成的字典
dfs = pd.read_excel('tmp.xlsx', sheet_name=[0, 1, "Sheet5"])
dfs = pd.read_excel('tmp.xlsx', sheet_name=None) # 所有sheet
dfs['Sheet5'] # 读取时按sheet名

04 表头

数据的表头参数为header,如不指定,默认为第一行。

# 整型、整型组成的列表,默认为 0
pd.read_excel('tmp.xlsx', header=None)  # 不设表头
pd.read_excel('tmp.xlsx', header=2)  # 第三行为表头
pd.read_excel('tmp.xlsx', header=[0, 1])  # 两层表头,多层索引

05 列名

用names指定列名,也就是表头的名称,如不指定,默认为表头的名称。

# 序列,默认为None
pd.read_excel('tmp.xlsx', names=['姓名', '年龄', '成绩'])
pd.read_excel('tmp.xlsx', names=c_list) # 传入列表变量
# 没有表头,需要设置为None
pd.read_excel('tmp.xlsx', header=None, names=None)

06 其他

其他参数与pandas.read_csv的同名参数功能一致,如果想使用仅pandas.read_csv有的参数,可以考虑将数据保存为CSV文件,因为CSV文件相对通用、读取数据快且处理方法比较丰富。

用Python读取CSV文件的操作详解可戳:史上最全!用Pandas读取CSV,看这篇就够了。

07 小结

本文介绍了pandas.read_excel相对于pandas.read_csv专有的参数功能。由于Excel文件在日常工作中较为常用,所以需要熟练掌握Excel的数据读取功能。另外对于一些量比较小的Excel数据文件,在做数据临时处理时,可以复制并使用pd.read_clipboard()来读取,非常方便。

关于作者:李庆辉,数据产品专家,某电商公司数据产品团队负责人,擅长通过数据治理、数据分析、数据化运营提升公司的数据应用水平。精通Python数据科学及Python Web开发,曾独立开发公司的自动化数据分析平台,参与教育部“1+X”数据分析(Python)职业技能等级标准评审。中国人工智能学会会员,企业数字化、数据产品和数据分析讲师,在个人网站“盖若”上编写的技术和产品教程广受欢迎。

本书摘编自《深入浅出Pandas:利用Python进行数据处理与分析》,机械工业出版社华章公司2021年出版。转载请与我们取得授权。

延伸阅读《深入浅出Pandas》

点击上图了解及购买

转载请联系微信:DoctorData

推荐语:这是一本全面覆盖了Pandas使用者的普遍需求和痛点的著作,基于实用、易学的原则,从功能、使用、原理等多个维度对Pandas做了全方位的详细讲解,既是初学者系统学习Pandas难得的入门书,又是有经验的Python工程师案头必不可少的查询手册。《利用Python进行数据分析》学习伴侣,用好Python必备。

划重点????

干货直达????

  • 数据分析怎么学?我画了一个导图,又找到22本书

  • 3个最常见案例详解DBA日常维护

  • 终于有人把平均数、中位数和众数讲明白了

  • 史上最全!用Pandas读取CSV,看这篇就够了

更多精彩????

在公众号对话框输入以下关键词

查看更多优质内容!

PPT | 读书 | 书单 | 硬核 | 干货 讲明白 | 神操作

大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化

AI | 人工智能 | 机器学习 | 深度学习 | NLP

5G | 中台 | 用户画像 1024 | 数学 | 算法 数字孪生

据统计,99%的大咖都关注了这个公众号

????

手把手教你用Python读取Excel相关推荐

  1. 手把手教你用Python实现Excel中的Vlookup功能

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 像树一样成长. 一.前言 大家好, ...

  2. python制作excel表格-手把手教你用Python处理Excel表格

    openpyxl是一个第三方库,可以处理xlsx格式的Excel文件.pip install openpyxl安装. 读取Excel文件 需要导入相关函数from openpyxl import lo ...

  3. python表格处理免费教程_手把手教你用Python处理Excel表格

    openpyxl是一个第三方库,可以处理xlsx格式的Excel文件.pip install openpyxl安装. 读取Excel文件 需要导入相关函数from openpyxl import lo ...

  4. 手把手教你用Pandas读取所有主流数据存储

    导读:从常见的Excel和CSV到JSON及各种数据库,Pandas几乎支持市面上所有的主流数据存储形式. 作者:李庆辉 来源:大数据DT(ID:hzdashuju) Pandas提供了一组顶层的I/ ...

  5. 手把手教你用Python批量实现在Excel后里面新加一列,并且内容为excel 表名(附源码)...

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 打起黄莺儿,莫教枝上啼. 大家好, ...

  6. 手把手教你用Python批量实现文件夹下所有Excel文件的第二张表合并

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 怀君属秋夜,散步咏凉天. 大家好, ...

  7. 手把手教你学Python之Pandas(一文掌握数据分析与处理库-Pandas)

    目录 基本结构之Series Series对象的创建 Index对象介绍 Series中数据的访问 Series中常用方法 基本结构之DataFrame DataFrame的创建 ​DataFrame ...

  8. python爬虫爬取房源_手把手教你用Python网络爬虫爬取新房数据

    项目背景 大家好,我是J哥. 新房数据,对于房地产置业者来说是买房的重要参考依据,对于房地产开发商来说,也是分析竞争对手项目的绝佳途径,对于房地产代理来说,是踩盘前的重要准备. 今天J哥以「惠民之家」 ...

  9. 手把手教你用Python替代Mapinfo更快查找两张表中距离最近的点

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 嫦娥应悔偷灵药,碧海青天夜夜心. ...

最新文章

  1. java中怎样存储遍历的数据_【数据算法】Java实现二叉树存储以及遍历
  2. Mybatis简约执行过程
  3. (DFS)n皇后问题
  4. java集合迭代器_java集合迭代器
  5. 小米 MIX4 发布、三年要拿下全球第一、还有一只 9999 元的狗?快看 3 个小时雷军都讲了什么!
  6. WebService学习总结(四)——调用第三方提供的webService服务
  7. 对象不支持“attachEvent”属性或方法的解决办法
  8. mysql锁的级别_mysql 锁和各锁级别
  9. 如何修改文件的编码格式
  10. DRILLNET 2.0------第九章 套管设计模块
  11. Activity流程引擎表结构
  12. 文华编程是c 语言吗,华中科技大学文华学院级软件工程c语言.docx
  13. [php fqm说明]以及nginx和apache的一些说明
  14. 误删的苹果电脑硬盘和数据库的数据怎么恢复
  15. 6种不同画法画平行线_平行线的画法
  16. VC++MFC使用VLC实现窗体中播放流媒体、磁盘视频文件完整例程--全部代码可下载
  17. 【100个 Unity实用技能】☀️ | Unity 将秒数转化为00:00:00时间格式
  18. Photoshop制作漂亮的圣诞树
  19. 思维导图如何辅助程序设计师工作
  20. C语言的if语句!!!

热门文章

  1. Web笔记-通过版本号控制客户端浏览器中的缓存
  2. C++|Qt工作笔记-对explicit的认识(Qt中一般情况下为什么会自动加上这个关键字)
  3. transporter上传卡正在交付_Xcode11,Transporter上传卡在——正在验证 APP - 正在通过App Store进行认证...
  4. c语言图案问题,C语言绘图问题
  5. HTML跳转为啥会404,为什么网页会出现404 not found?
  6. gateway sentinel 熔断 不起作用_微服务Gateway新一代网关
  7. (软件工程复习核心重点)第三章需求分析-第五节:验证软件需求
  8. (计算机组成原理)第二章数据的表示和运算-第一节5:本章习题
  9. 3-3:类与对象中篇——默认成员函数之构造函数和析构函数
  10. 1313. 解压缩编码列表