pandas 读表格_pandas电子表格的读取(pandas中的read_excel)
上面那篇文章中,初步介绍了一个文本文件的读取;接下来介绍另外一种常见的本地数据格式,那就是Excel电子表格,如果读者在学习或者工作中需要使用Python分析某个Excel表格数据,改如何完成第一个的数据读取呢?
1.Pandas模块中的read_excel
方法原型:
pd.read_excel(io,sheetname=0,header=0,skiprows=None,skipfooter=None,index_col=None,names=None,parse_cols=None,parse_date=False,
na_values=None,thousands=None,convert_float=True)
io:指定电子表格的具体路径
sheetname:指定需要读取电子表格中的第几个sheet,既可以传递整数也可以传递具体的Sheet名称
header:是否需要将数据集的第一行用作表头,默认为是需要的
skiprows:读取数据时,指定跳过的开始行数
skipfooter:读取数据时,指定跳过的末尾行数
index_col:指定哪些列用作数据框的行索引(标签)
names:如果原数据集中没有字段,可以通过该参数在数据读取时给数据框添加具体的表头 #如: ['Prod_Id','Prod_Name','Prod_Color','Prod_Price'] 通过列表的 形式
parse_cols:指定需要解析的字段
parse_dates:如果参数值为True,则尝试解析数据框的行索引;如果参数为列表,则尝试解析对应的日期列;如果参数为嵌套列表,则将某些列合并为日期列;
如果参数为字典,则解析对应的列(字典中的值),并生成新的字段名(字典中的键)
na_values:指定原始数据中哪些特殊值代表了缺失值
thousands:指定原始数据集中的千分位符 #同上篇
convert_float:默认将所有的数值型字段转换为浮点型字段
converters:通过字典的形式,指定某些列需要转换的形式 #用法:converters = {0:str} 第0列转换为字符型
例题:如有以下Excel表格以及数据
观察数据信息,发现以下几点需要注意到的
该数据集反映的是儿童类服装的产品信息。在读取数据是需要注意两点:
1.该表没有表头,如何读取数据的同时就设置好具体的表头;
2.数据集的第一列实际上是字符型的字段,如何避免数据读入时自动变成数值型字段
import pandas as pd
child_cloth = pd.read_excel(io = r'D:\data_test02.xlsx', header = None,
names = ['Prod_Id','Prod_Name','Prod_Color','Prod_Price'], converters = {0:str})
child_cloth
out:
pandas 读表格_pandas电子表格的读取(pandas中的read_excel)相关推荐
- pandas 读表格_pandas 读写 Excel
pandas 读写 Excel,可以用于将重复的数据加工工作交给 pandas,节省手工劳动,使用起来也比较方便,但输出的格式并不太美观.本文介绍 read_excel() 和 to_excel() ...
- python 读取 word 表格_Python实现批量读取word中表格信息的方法
本文实例讲述了Python实现批量读取word中表格信息的方法.分享给大家供大家参考.具体如下: 单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个py ...
- pandas 读表格_手把手教你数据分析(1)--Pandas读取Excel信息
00准备工作: 素材:一份全国各省市市委书记数据表.xls (链接: https://pan.baidu.com/s/1gbgvcLbfEMM-9hFCZw1VlQ 密码: p66u) 编程环境:ma ...
- python的pandas库下载_pandas库下载安装-Pandas for python下载v0.25.0最新版-西西软件下载...
Pandas for python是一款python的数据分析包,pandas的索引对象负责管理轴标签和其他元数据.index对象是不可以修改(immutable)的.最初被作为金融数据分析工具而开发 ...
- pandas 生成html表格_Pandas 读写html
Pandas 读写html,pandas提供read_html(),to_html()两个函数用于读写html格式的文件.这两个函数非常有用,把DataFrame等复杂的数据结构转换成HTML表格很简 ...
- 第6章 数据结构化与数据存储(6.1数据结构化神器——pandas库,读取网页中的表格数据)
通过pandas库可以方便地爬取网页中的表格数据,对数据进行结构化处理,并导出为Excel工作簿等文件. 6.1.1用read_html()函数快速爬取网页表格数据 使用pandas库中的read_h ...
- 详解 16 个 Pandas 读与写函数
导读:今天这篇文章我是学习pandas官方文档,做的一个总结性学习笔记,大家可以作为科普性文章,了解下哪些常用文件可以使用pandas来读写,以及一些常用的读写方法.文章较长,建议收藏. 稀疏矩阵co ...
- pandas 第一行_Pandas数据预处理相关经验
在这里记录一些平常用的pandas操作以供参考. 学习相关操作的最好方法还是找官方的文档最好,否则就会产生百度1小时,查文档3分钟的尴尬处境,之前为了找python里类似 in 的操作搜了半天资料也没 ...
- pandas 索引去重_Pandas 同元素多列去重的实例
Pandas 同元素多列去重的实例 有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现. 首先我们看一下数据类型: G1 G2 a b b a c d ...
最新文章
- linux centos7安装git服务器配置,CentOS7 Linux环境下搭建Git仓库
- Maven Build Lifecycle
- Spring的@ImportResource注解
- Android 错误: 找不到符号 符号: 类 x 位置: 类 MainActivity
- Hibernate的CURD操作
- 分析一段H264视频数据
- 那些在家啃书自学算法的人,最后都找到工作了吗?
- 4.Flow Layout Pane
- Cat.5e/Cat.6系统测试要点和常见工程问题解答
- Java多线程学习三十五: CyclicBarrier 和 CountDownLatch 有什么不同
- Atitit 项目沟通管理 艾提拉总结 目录 1. 项目中沟通对象	2 1.1. 主要为项目干系人 产品部门 运营部门组员等	2 1.2. 适当越级沟通, 与高层直接沟通	3 2. 沟通频率	3
- live555源码分析(七)播放过程
- 更改绩效管理流程的5个步骤
- testerhome学习笔记1_互联网测试技术
- vnc桌面手机版,推荐5款好用的vnc桌面手机版软件
- MySQL在服务里找不到(未卸载)
- ul 原点显示_li前面的原点或者方的样式修改html中列表项li所显示的圆点的颜色?,以及相关样式的设定...
- 谷歌账户无法添加_如何将另一个Google帐户添加到您的Android设备
- cassandra实战--物化视图(Materialized View)
- H3C无线控制器支持的认证方式