【Python处理EXCEL】--pandas导入Excel文件
本文使用的是Python集成运行环境 Anaconda
0.前期准备
安装好Anaconda后,到你的“终端”(Linux, macOS)或者“命令提示符”(Windows)下面,
执行以下命令:
conda install pandas
conda install xlrd
下载完成后,执行
jupyter notebook
进入 jupyter notebook
1.导入excel
1.1 利用pandas中的read_excel()函数读取excel内容
read_excel()函数能够读取的格式包含:xls, xlsx, xlsm, xlsb, odf, ods 和 odt 文件扩展名。支持读取单一sheet或几个sheet。
import pandas as pd
rd=pd.read_excel(r"C:\Users\whw\Desktop\文件名.xlsx","Sheet1",header=0)
结果如下图所示:
1.2 下面详细了解一下read_excel()函数
read_excel默认参数
def read_excel(io, #io为必填,文件类对象,即读取文件的路径,其余可选sheet_name=0, header=0,names=None,index_col=None,parse_cols=None,usecols=None,squeeze=False,dtype=None,engine=None,converters=None,true_values=None,false_values=None,skiprows=None,nrows=None,na_values=None,keep_default_na=True,na_filter=True,verbose=False,parse_dates=False,date_parser=None,thousands=None,comment=None,skip_footer=0,skipfooter=0,convert_float=True,mangle_dupe_cols=True,**kwds)
1.2.1 io
io为文件类对象,一般作为读取文件的路径:
rd=pd.read_excel(r"C:\Users\whw\Desktop\products.xlsx")
1.2.2 sheet_name
该参数为指定读取excel的表格名,两种方式:
(1)直接写入sheet名
rd=pd.read_excel(r"C:\Users\whw\Desktop\products.xlsx","Sheet名",header=0)
(2)参数默认从0开始,即若想读第2张表则将参数改为1即可
rd=pd.read_excel(r"C:\Users\whw\Desktop\products.xlsx",sheet_name=0,header=0)
1.2.3 header
该参数为指定列表中从第几行作为列索引/列名(默认为值为0)
1.2.4 names
此参数接收一个数组,将列名重定义赋值:
excel=pd.read_excel("products.xlsx",names=['ID','Name','1','2','3'])
1.2.5 index_col
此参数为指定从第几列开始索引(即将第几列选择为第一列进行索引),默认为0(0基)
1.2.6 usecols
该参数为返回指定的列,
usecols="A,C:E" #返回excel中的A列,C到E列,也可以传入列表usecols=[0,2],或者usecols=[“ID”,"name"]这种形式
excel=pd.read_excel(r"r"C:\Users\whw\Desktop\文件名.xlsx",usecols="A,C:D")
1.2.7 parse_cols
指定需要解析的字段,自0.21.0版后不推荐使用:改为使用usecols。
1.2.8 squeeze
若待处理的excel数据仅有一列时,此时设定为True将转换为Series
1.2.9 dtype
指定读取列的数据类型,可接收字典。
1.2.10 engine
该参数为指定Excel处理引擎
可以接受的参数有“ xlrd”,“ openpyxl”或“ odf”,用于使用第三方的库去解析excel文件。
- engine=xlrd 支持较旧格式(.xls)
- engine=openpyxl 支持较新的格式
- engine=odf 支持OpenDocument电子文档 (.odf, .ods, .odt)
- engine=pyxlsb 支持二进制表格 (.xlsb)
- engine = None 自动根据格式选择 默认。
- 注: 可以考虑用xlrd读取,用openpyxl写入。但是xlrd对.xlsx文件的支持不太好,可能还需要用老版本才行。
excel=pd.read_excel(r"r"C:\Users\whw\Desktop\文件名.xlsx",engine='xlrd')
1.2.11 converters
指定列数据类型转换函数,包括了dtype的功能,也可以对某一列使用Lambda函数,进行某种运算
1.2.12 nrows
指定需要读取前多少行,通常用于较大的数据文件中。
1.2.13 date_parser
处理日期类数据,可以将日期类字段组合成日期格式。
parse_dates={"日期" : [0,1,2]} #{ "新列名" : [指定列/字段] }
【Python处理EXCEL】--pandas导入Excel文件相关推荐
- 初学python,利用pandas读取excel出现乱码的问题
初学python,利用pandas读取excel出现乱码的问题 初学python,利用pandas读取excel文件时,出现中文乱码: 左侧出现中文乱码 解决过程: 初始判断是是pandas读取中文出 ...
- pandas导入excel
pandas导入excel 添加头文件 导入目标数据 指令和形式 读取行和列 列 行 其他 添加头文件 import pandas as pd 导入目标数据 file_name = "文件所 ...
- Excel原封不动导入txt文件
要Excel原封不动导入txt文件,包括不漏掉数字前面的0,要在导入的时候,选择固定宽度导入,然后 选中每一列,再选 文本 而不是常规,就行了.别忘了从第一列一直到最后一列都要选.
- 实现pandas导入excel时保留公式的文本内容
实现pandas导入excel时保留公式的文本内容 excel数据(存在公式): 直接使用pandas读取excel时,无法保留公式的文本信息: 结合使用openpyxl模块中的data_only=F ...
- 如何使用python快速完成批量导入一个文件夹下多个excel文件
前两天一直想把1400多个excel文件导入到数据库中,上网搜索一直没找到对应的代码,大多是一个excel文件中多个表单的批量导入.作为小白的我试了很多次,终于在东拼西凑中写出来了一个比较实用的代码. ...
- Pandas 导入excel、csv、txt 文件数据
Python 数据分析 导入.xlsx 文件 基本导入 指定导入 指定行索引 指定列索引 指定导入行 指定导入列 导入.csv 文件 直接导入 指明分隔符 指明读取行数 指明读取列数 engine 指 ...
- python导入excel数据-如何把python中的数据导入excel
python将数据导入excel的方法:1.在python官网下载xlrd第三方库:2.利用xlrd中的open_workbook函数读入excel文件,即可在python中导入excel数据. 一. ...
- python日记Day18——Pandas之Excel绘图
python日记--Pandas之Excel绘图 利用pandas和pyplot进行数据可视化,绘图过程中使用到的excel文件如下:excel文件,提取码:falj 柱图的绘制 1.柱状图: imp ...
- java txt数据导入excel,java导入excle文件《如何用java 将txt数据导入excel》
如何用java 将txt数据导入excel 代码如下: import java.io.*; import jxl.*; import jxl.write.*; public class CreateX ...
最新文章
- 还在为论文发愁?ACL组委会手把手教你论文投稿小技巧 | ACL 2017
- 理解C#值类型与引用类型(摘录)
- 占用过高_Windows10电脑磁盘占用率过高,用这二招轻松解决
- python表白对话框-python文件选择对话框的操作方法
- 【C / C++】关于数组默认初值问题
- mysql 更改 uf_SQL经典实例(四)插入、更新和删除
- 关于SAP Fiori Smart Template开发的一些实际例子
- 《魔鸟》:上帝可以宽恕,魔鬼却一个都不放过
- 大数据胸_喂母乳会导致胸下垂?!你被这个谣言骗了多少年?
- 信息学奥赛一本通 1023:Hello,World!的大小 | OpenJudge NOI 1.2 10
- 《剑指Offer》 数值的整数次方
- 如何在Kaggle比赛上击败98%的对手?你需要一份七步秘笈
- webstorage html5,HTML5-WebStorageAPIs的简述
- cad 打开硬件加速卡_CAD运行用加速技巧
- 中国分省市地图导航-SVG格式(基于Raphaël)
- python词频统计并按词频排序
- CSS 字体加粗,导致布局宽度改变怎么处理?
- 屏幕绘图最佳利器Pointfix,绿色中文版_我是亲民_新浪博客
- 网页数据提取----网络投票软件开发
- 学并发编程,透彻理解这三个核心是关键