上面那篇文章中,初步介绍了一个文本文件的读取;接下来介绍另外一种常见的本地数据格式,那就是Excel电子表格,如果读者在学习或者工作中需要使用Python分析某个Excel表格数据,改如何完成第一个的数据读取呢?

1.Pandas模块中的read_excel

方法原型:

pd.read_excel(io,sheetname=0,header=0,skiprows=None,skipfooter=None,index_col=None,names=None,parse_cols=None,parse_date=False,

na_values=None,thousands=None,convert_float=True)

io:指定电子表格的具体路径

sheetname:指定需要读取电子表格中的第几个sheet,既可以传递整数也可以传递具体的Sheet名称

header:是否需要将数据集的第一行用作表头,默认为是需要的

skiprows:读取数据时,指定跳过的开始行数

skipfooter:读取数据时,指定跳过的末尾行数

index_col:指定哪些列用作数据框的行索引(标签)

names:如果原数据集中没有字段,可以通过该参数在数据读取时给数据框添加具体的表头  #如: ['Prod_Id','Prod_Name','Prod_Color','Prod_Price']  通过列表的                   形式

parse_cols:指定需要解析的字段

parse_dates:如果参数值为True,则尝试解析数据框的行索引;如果参数为列表,则尝试解析对应的日期列;如果参数为嵌套列表,则将某些列合并为日期列;

如果参数为字典,则解析对应的列(字典中的值),并生成新的字段名(字典中的键)

na_values:指定原始数据中哪些特殊值代表了缺失值

thousands:指定原始数据集中的千分位符        #同上篇

convert_float:默认将所有的数值型字段转换为浮点型字段

converters:通过字典的形式,指定某些列需要转换的形式     #用法:converters = {0:str}   第0列转换为字符型

例题:如有以下Excel表格以及数据

观察数据信息,发现以下几点需要注意到的

该数据集反映的是儿童类服装的产品信息。在读取数据是需要注意两点:

1.该表没有表头,如何读取数据的同时就设置好具体的表头;

2.数据集的第一列实际上是字符型的字段,如何避免数据读入时自动变成数值型字段

import pandas as pd

child_cloth = pd.read_excel(io = r'D:\data_test02.xlsx', header = None,

names = ['Prod_Id','Prod_Name','Prod_Color','Prod_Price'], converters = {0:str})

child_cloth

out:

pandas 读表格_pandas电子表格的读取(pandas中的read_excel)相关推荐

  1. pandas 读表格_pandas 读写 Excel

    pandas 读写 Excel,可以用于将重复的数据加工工作交给 pandas,节省手工劳动,使用起来也比较方便,但输出的格式并不太美观.本文介绍 read_excel() 和 to_excel() ...

  2. python 读取 word 表格_Python实现批量读取word中表格信息的方法

    本文实例讲述了Python实现批量读取word中表格信息的方法.分享给大家供大家参考.具体如下: 单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个py ...

  3. pandas 读表格_手把手教你数据分析(1)--Pandas读取Excel信息

    00准备工作: 素材:一份全国各省市市委书记数据表.xls (链接: https://pan.baidu.com/s/1gbgvcLbfEMM-9hFCZw1VlQ 密码: p66u) 编程环境:ma ...

  4. python的pandas库下载_pandas库下载安装-Pandas for python下载v0.25.0最新版-西西软件下载...

    Pandas for python是一款python的数据分析包,pandas的索引对象负责管理轴标签和其他元数据.index对象是不可以修改(immutable)的.最初被作为金融数据分析工具而开发 ...

  5. pandas 生成html表格_Pandas 读写html

    Pandas 读写html,pandas提供read_html(),to_html()两个函数用于读写html格式的文件.这两个函数非常有用,把DataFrame等复杂的数据结构转换成HTML表格很简 ...

  6. 第6章 数据结构化与数据存储(6.1数据结构化神器——pandas库,读取网页中的表格数据)

    通过pandas库可以方便地爬取网页中的表格数据,对数据进行结构化处理,并导出为Excel工作簿等文件. 6.1.1用read_html()函数快速爬取网页表格数据 使用pandas库中的read_h ...

  7. 详解 16 个 Pandas 读与写函数

    导读:今天这篇文章我是学习pandas官方文档,做的一个总结性学习笔记,大家可以作为科普性文章,了解下哪些常用文件可以使用pandas来读写,以及一些常用的读写方法.文章较长,建议收藏. 稀疏矩阵co ...

  8. pandas 第一行_Pandas数据预处理相关经验

    在这里记录一些平常用的pandas操作以供参考. 学习相关操作的最好方法还是找官方的文档最好,否则就会产生百度1小时,查文档3分钟的尴尬处境,之前为了找python里类似 in 的操作搜了半天资料也没 ...

  9. pandas 索引去重_Pandas 同元素多列去重的实例

    Pandas 同元素多列去重的实例 有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现. 首先我们看一下数据类型: G1 G2 a b b a c d ...

最新文章

  1. linux centos7安装git服务器配置,CentOS7 Linux环境下搭建Git仓库
  2. Maven Build Lifecycle
  3. Spring的@ImportResource注解
  4. Android 错误: 找不到符号 符号: 类 x 位置: 类 MainActivity
  5. Hibernate的CURD操作
  6. 分析一段H264视频数据
  7. 那些在家啃书自学算法的人,最后都找到工作了吗?
  8. 4.Flow Layout Pane
  9. Cat.5e/Cat.6系统测试要点和常见工程问题解答
  10. Java多线程学习三十五: CyclicBarrier 和 CountDownLatch 有什么不同
  11. Atitit 项目沟通管理 艾提拉总结 目录 1. 项目中沟通对象 2 1.1. 主要为项目干系人 产品部门 运营部门组员等 2 1.2. 适当越级沟通, 与高层直接沟通 3 2. 沟通频率 3
  12. live555源码分析(七)播放过程
  13. 更改绩效管理流程的5个步骤
  14. testerhome学习笔记1_互联网测试技术
  15. vnc桌面手机版,推荐5款好用的vnc桌面手机版软件
  16. MySQL在服务里找不到(未卸载)
  17. ul 原点显示_li前面的原点或者方的样式修改html中列表项li所显示的圆点的颜色?,以及相关样式的设定...
  18. 谷歌账户无法添加_如何将另一个Google帐户添加到您的Android设备
  19. cassandra实战--物化视图(Materialized View)
  20. H3C无线控制器支持的认证方式

热门文章

  1. Class.forName和ClassLoader
  2. 信道和物理媒体的区别
  3. mysql宏参数_C语言带参数的宏定义
  4. 编程随想 关系图_IT什么岗位比较好找工作?一张金字塔图就能明白
  5. 迷宫回溯问题分析和实现
  6. C语言中#define的用法(转)
  7. smart700iev3 程序下载设置_分享一款Aira2下载工具
  8. unity改变图片像素大小_类动森像素画反向转换 (xBR)
  9. Linux进程全解1——程序的开始、结束
  10. 5G毫米波三大自然缺陷