pandas.read_excel()的作用:将Excel文件读取到pandas DataFrame中。

支持从本地文件系统或URL读取的xls,xlsx,xlsm,xlsb和odf文件扩展名。 支持读取单一sheet或几个sheet。

以下是该函数的全部参数:

pandas.read_excel(io,sheet_name=0,header=0,names=None,index_col=None,usecols=None,squeeze=False,dtype=None,engine=None,converters=None,true_values=None,false_values=None,skiprows=None,nrows=None,na_values=None,keep_default_na=True,verbose=False,parse_dates=False,date_parser=None,thousands=None,comment=None,skipfooter=0,convert_float=True,mangle_dupe_cols=True,**kwds)

我创建了一个excel,用作数据源:

sheet1:CRM

共39行

sheet2:成绩单

共50行

sheet3:销量表

共31行

1.基本用法(io)

直接使用pd.read_excel(r"文件路径"),默认读取第一个sheet的全部数据

实际上就是第一个参数:io,支持str, bytes, ExcelFile, xlrd.Book, path object, or file-like object

2.sheet_name(str, int, list, None, default 0)

str字符串用于引用的sheet的名称

int整数用于引用的sheet的索引(从0开始)

字符串或整数组成的列表用于引用特定的sheet

注意,读取后的数据类型是OrderedDict,将两个sheet的数据合并到了一个list中

None 表示引用所有sheet

默认为0,表示不输入sheet_name的参数下,默认引用第一张sheet的数据

3.header(int, list of int, default 0)

表示用第几行作为表头,默认header=0,即默认第一行为表头

hearder=1:选择第二行为表头,第一行数据就不要了。其他以此类推

hearder=[1,2,3]:选择第2,3,4行的数据作为表头,第二行之上的数据不用

header=None :表示不使用数据源中的表头

4.names(array-like, default None)

表示自定义表头的名称,需要传递数组参数。

图例中更改了原始的表头。

5.index_col(int, list of int, default None)

指定列为索引列,默认为None,也就是索引为0的列用作DataFrame的行标签。

None:

int整数:指定第几列为索引列

选择第一列"ID"列为索引列

list of int:选择列表中的整数列为索引列

6.usecols(int, str, list-like, or callable default None)默认为None,解析所有列。

如果为str,则表示Excel列字母和列范围的逗号分隔列表(例如“ A:E”或“ A,C,E:F”)。范围全闭。

如果为int,则表示解析到第几列。

如果为int列表,则表示解析那几列。

str:usecols="A:C",只读取从A列到C列的数据

int:usecols=3,表示解析第0,1,2,3列,共4列

int of list:usecols=[0,1,4],表示解析第1列,第2列,第5列的数据

7.squeeze(bool, default False)

默认为False。如果设置squeeze=True则表示如果解析的数据只包含一列,则返回一个Series。

默认情况下:

设置squeeze=True情况下:

8.dtype(Type name or dict of column -> type, default None)

列的类型名称或字典,默认为None,也就是不改变数据类型。

其作用是指定列的数据类型。

先看下目前的各列数据类型:

再将ID和年龄列的数据类型从int64转换为float64和str

这是pandas的所有数据类型

9.engine(str, default None)

可以接受的参数有“ xlrd”,“ openpyxl”或“ odf”,用于使用第三方的库去解析excel文件。

10.converters(dict, default None)

对指定列的数据进行指定函数的处理,传入参数为列名与函数组成的字典。key 可以是列名或者列的序号,values是函数,可以def函数或者直接lambda都行。

先读取前三列数据:

对第2列的所有名称加上"",把第三列的所有年龄都减10

11.true_values(list,default None)

将指定的文本转换为True,默认为None

12.false_values(list,default None)

将指定的文本转换为False,默认为None

将性别中的女转换为True,男转换为False

13.skiprows(list like)

跳过指定的行

skiprows=1 跳过第1行

skiprows=3 跳过前3行

skiprows=[1,3,5] 跳过第1,3,5行

skiprows=lambda x: x % 2 == 0 跳过偶数行

14.nrows(int, default None)

默认为None

指定需要读取前多少行,通常用于较大的数据文件中。

nrows=3 读取前三行

15.na_values(scalar, str, list-like, or dict, default None)

指定某些列的某些值为NaN

na_values='大专',指定大专为NaN

16.keep_default_na(bool, default True)

表示导入数据时是否导入空值。

默认为True,即自动识别空值并导入

常用的参数就这么多~觉得有用的各位记得点赞收藏哦~Tao:Python处理数据常用方法(pandas版)​zhuanlan.zhihu.com

python read函数参数_最新Pandas.read_excel()全参数详解(案例实操,如何利用python导入excel)...相关推荐

  1. c++常引用做参数可以有默认参数吗_最新Pandas.read_excel()全参数详解(案例实操,如何利用python导入excel)...

    pandas.read_excel()的作用:将Excel文件读取到pandas DataFrame中. 支持从本地文件系统或URL读取的xls,xlsx,xlsm,xlsb和odf文件扩展名. 支持 ...

  2. python海量数据分析师职业技能_大数据分析师技能图谱详解与零基础自学内容大全...

    全球的数据量正在以每18个月翻一倍的惊人速度增长,世界正在高速数字化,大数据堪比石油,如何掘金大数据是所有个人.企业和国家的机遇和挑战.中国是人才大国,能理解和应用大数据的创新人才更是稀缺资源.大数据 ...

  3. Python open()函数文件打开、读、写操作详解

    python的文件读写和打开操作都有自己特定的函数和方法,操作起来很简单.下面就来简单的了解下python文件的基本操作方法有哪些. 一.Python open()函数文件打开操作 打开文件会用到op ...

  4. 分段二次插值函数表达式_【插值】插值方法原理详解

    插值问题详解 1. 我在具体的应用(如数学建模竞赛)中,常常需要根据已知的函数点进行数据.模型的处理和分析,而通常情况下现有的数据是极少的,不足以支撑分析的进行,这时就需要使用一些数学的方法,&quo ...

  5. git原理详解与实操指南_全网最精:学git一套就够了,从入门到原理深度剖析

    以上资源收集至互联网 如有侵权请联系删除 资源获取方式 扫码关注资源库公众号 回复密码'20190812' 即可获得 截图展示 课程信息 课程难度:中级 学习人数:148352 课程状态:已完结 时长 ...

  6. python setdefault函数_python 字典 setdefault()和get()方法比较详解

    dict.setdefault(key, default=None) --> 有key获取值,否则设置 key:default,并返回default,default默认值为None dict.g ...

  7. python自动售货机_自动售货机支付系统详解

    自动售货机从机械自动售货机发展到今天已经有智能自动售货机了.机械式自动售货机功能性很差,能售卖的产品也有限.一般被用于饮料的售卖.而智能自动售货机可以连接物联网和互联网.支持移动支付,可以售卖几乎任意 ...

  8. python关键词 打标签详解_Python学习日记13|利用python制作简书首页热门文章关键词标签云...

    今天是6.16号. 昨天去面越秀金融风险控制部计算机实习生,去面了才知道主要也就是做数据抓取这一块.面试过程中有问到分词,然后自己心虚的说了有接触过分词这一块,面试结果就不去想了,过不过都其实不重要了 ...

  9. git原理详解与实操指南_基于dockercompose的Gitlab CI/CD实践amp;排坑指南

    长话短说 经过长时间实操验证,终于完成基于Gitlab的CI/CD实践,本次实践的坑位很多, 实操过程尽量接近最佳实践(不做hack, 不做骚操作),记录下来加深理解. 看过博客园<docker ...

最新文章

  1. 用特征迭代次数区分minst数据集的0和1
  2. forward 和redirect
  3. 5种JavaScript中常用的排序方法
  4. 牛客网【每日一题】4月28日题目精讲 美味菜肴
  5. js如何获取jwt信息_谈房地产公众号如何涨粉?一篇文章让你轻松获取信息
  6. 《剑指Offer》 变态跳台阶
  7. 转!!URL和URI区别
  8. java代码怎么动态修改xml配置文件内容_[MyBatis]-MyBatis框架-05-动态sql
  9. 基于qt的贪吃蛇游戏 c语言,基于QT的贪吃蛇游戏设计
  10. easy_install安装,更新模块 python
  11. 001.Heartbeat简介
  12. 史上最搞笑的程序员段子,你看懂了吗?
  13. 通俗理解ROC曲线(Receiver Operating Characteristic Curve)
  14. Cannot define dimension expressions when an array initializer is provided 错误
  15. Scrum敏捷培训课堂小记
  16. keil uvision5 cannot write project file 和 cannot read project file 解决建议
  17. SQL 查询语句报错
  18. 在职研究生(多重继承)
  19. 京东坐稳全渠道最大家电零售商之位,苏宁怼京东815恐无成效
  20. OpenStack基础知识及搭建云平台先电的基本虚拟机配置

热门文章

  1. php json数组大小,php json转换成数组形式
  2. 从html富文本中提取纯文本
  3. Thrift搭建分布式微服务(四)
  4. 【原创】大数据基础之Spark(1)Spark Submit即Spark任务提交过程
  5. Redis(十五)Redis 的一些常用技术(Spring 环境下)
  6. python class 2
  7. Java单例模式实现(线程安全)
  8. IOS 归档 即序列化与反序列化
  9. 关于updatepanel回传之后JS失效问题
  10. 【数据结构】BFS 代码模板