上一讲我们讲到了Python 针对Excel 里面的特殊数据处理以及各种数据统计,本讲我们将引入Pandas 这个第三方库来实现数据的统计,只要一个方法就可以统计到上一讲的数据统计内容,本讲也会扩展讲讲Pandas所涉及到的相关使用方法。

统计输出

import pandas as pdpd1=pd.read_excel("test1.xls")pd2=pd.read_excel("test2.xls",skiprows=2) #skiprows=2表示忽略前几行,skip_footer用来省略尾部的行数#统计输出print(pd1.describe()) #数字类型的统计输出,它是DateFrame类型print(pd1.min()) #输出每一列里面最小值print(pd1.max())#输出每一列里面最大值print(pd1.sum()) #输出每一列的求和值print(pd1.mean()) #输出每一列的平均值print(pd1.median())#输出每一列的中位数

通用输出或格式化输出

#通用输出或格式化输出print(pd1.head()) #输出前五条数据,DateFrame类型的带有标签的数据print(pd1.tail()) #输出后五条数据,DateFrame类型的带有标签的数据print("获取到所有的值:\n{0}".format(pd1))#格式化输出所有数据print(pd1.values) #输出的是全部值的一个二维的ndarrayprint(pd1.dtypes) #输出每一列数据的数据类型,它是Series类型的数据print(pd1.columns) #输出序号的名字,它是Index类型的索引对象print(pd1.columns.values) #输出序号的名字,返回的是一个一维的ndarrayprint(pd1.shape) #输出

指定输出

#指定输出print(pd1.values[0]) #输出第一行的值print(pd1.values[0:2])#查看第一二行的值,返回的是一个二维的ndarrayprint(pd1[0:3]) #返回的是DateFrame类型的前三列数据,带有标签print(pd1[0:3].values) #返回的是ndarray类型的前三列数据的值,不带表头标签print(pd1.sample(2).values) #获取指定行数的值,它是一个二维的ndarrayprint(pd1['工号'].values) #查看某一列所有的值,返回的是一维的ndarray

转置输出

#转置输出print(pd1.T)#整个数据集的翻转展示print(pd1[0:3].T) #前三行数据翻转展示

排序输出

#排序输出print(pd1.sort_index(axis=1,ascending=False)) #axis等于1按列进行排序 如ABCDEFG 然后ascending倒叙进行显示print(pd1.sort_values(by="月工资"))#按值进行排序

常规操作

#常规操作pd1['job']=None #增加一列pd1.loc[1]=[1000,'林ok','男','哈尔滨','1978-05-28 00:00:00','2003-06-20 00:00:00',333,0.5,555.0,"tester"]#增加一行pd1.drop([1],axis=0,inplace=True) #删除指定行 axis=0 表示行,inplace=True表示在原有的数据上改变pd1.drop('job',axis=1,inplace=True)#删除指定列 axis=1 表示列pd1.to_excel('test1.xls',sheet_name='new sheet',index=False,header=True)#保存新增的内容,index表示是否增加索引,header表示是否加列表表头pd1.index=(pd1.index+100) #设置索引的值pd1.rename(columns={'工号':'num','姓名':'name'},inplace=True) #修改表头信息pd1.set_index("num",drop=True,inplace=True) #设置索引的值,drop默认True,普通列被用作索引后,原列删除pd1.reset_index(drop=False,inplace=True)#还原索引为普通列,重新变为默认的整型索引,drop=False 原有的索引不变,添加一列,列名index;pd.set_option('display.max_rows', 3,'display.max_columns', 3,"display.max_colwidth",3,'display.width',3) #设置显示print(pd1.head())print(pd1.index) #输出索引信息print(len(pd1.index)) #输出索引的长度

合并操作

#合并操作pd3=pd.concat([pd1,pd2],axis=0) #将两个excel数据进行合并操作,注意保持数据格式上的一致print(pd3)

缺失值处理

#缺失值处理print(pd2)print(pd2['job'].isna())#检测是否是Nanprint(pd2['job'].isnull())#检测是否是空值print(pd2['job'].notna())#检测是否是Nanprint(pd2['job'].notnull())#检测是否是空值print(pd2.loc[pd2['job'].notnull(),:]) #过滤出来job不为null的行print(pd2.drop([1],axis=0,inplace=True)) #删除指定行 axis=0 表示行,inplace=True表示在原有的数据上改变print("*"*100)
import numpy as np #这里是为了构建数据引入的,后面会有文章单独讲解df = pd.DataFrame([[np.nan, 2, np.nan, 0], [3, 4, np.nan, 1], [np.nan, np.nan, np.nan, np.nan], [np.nan, 3, np.nan, 4]], columns=list('ABCD'))print(df)print(df.fillna(100))#将为空的填充为100分print(df.fillna({"A":222},inplace=True))#将A列为nan的值设置为222print(df.dropna(axis="columns"))#删除有空值的列print(df.dropna(axis=1,how="all"))#删除掉全是空值的列print(df.dropna(axis=0,how="all"))#删除掉全是空值的行

这一讲就分享到这里,内容也不少需要多实践去了解它的使用技巧,以上更多的是print语句进行输出来检查每一个是否符合预期。

友情提示:“无量测试之道”原创著作,欢迎关注交流,禁止第三方不显示文章来源时转载。更多原创文章请扫码关注查看,交流与合作请联系:loadkernel@126.com。

QQ技术交流群:41564936

Python 实现Excel自动化办公《上》

Python 实现Excel自动化办公《中》

AirTest-selenium基于Web实现UI自动化测试

Python API自动化测试实操

Python 测试框架之 Unittest & Pytest

Python 爬虫之Scrapy《下》

Python 爬虫之Scrapy《中》

Python 爬虫之Scrapy《上》

Shell 编程核心技术《四》

Shell 编程核心技术《三》

Git 必知必会《上》

Git 必知必会《下》

python series转置储存到excel_Python 实现Excel自动化办公下相关推荐

  1. python series转置储存到excel_P9:pythonpandas玩转excel文件

    Python中pandas库的数据结构主要有两种:一个是Series ,一个是DataFrame. DataFrame是一种数据结构,类似excel,是一种二维表: series是一个一维数组,是基于 ...

  2. python办公自动化课程价格_python办公自动化视频教程excel自动化办公全套人工智能程序设计电子版 全部视频...

    权利声明: 京东上的所有商品信息.客户评价.商品咨询.网友讨论等内容,是京东重要的经营资源,未经许可,禁止非法转载使用. 注:本站商品信息均来自于合作方,其真实性.准确性和合法性由信息拥有者(合作方) ...

  3. Excel自动化办公(一) | 满足你对Excel数据的所有幻想,python-office一键生成模拟数据

    自从在官网发布了python-office这个专门用来自动化办公的库,后台经常收到提问:晚枫,什么时候开发Excel功能呀? 今天Excel自动化办公的第一个功能上线了:自动生成带有模拟数据的Exce ...

  4. python 如何自动生成exl_python如何做excel自动化

    python做excel自动化的方法:首先安装python工具包:然后从指定文件路径读取excel表格,进行一定操作:接着保存到另一个excel文件:最终调用[excel_update]方法即可. p ...

  5. 如何用Python操作Excel自动化办公?一个案例教会你openpyxl——读取数据

    欢迎大家关注我,我是拾陆,关注同名"二八Data" 数据分析工作最难搞的是处理数据的过程,不然不会有专门的ETL(数据抽取.转换.加载)工程师了.如果是企业级数据处理可能数据库直接 ...

  6. python自动化_Python 实现Excel自动化办公上

    今天的文章分享Python 如何轻松操作Excel 这款office 办公软件的,在Python 中你要针对某个对象进行操作,是需要安装与其对应的第三方库的,这里对于Excel 也不例外,它也有对应的 ...

  7. 如何用Python操作Excel自动化办公?一个案例教会你openpyxl——公式计算和数据处理

    术业有专攻,每一种工具每一种岗位都会有资深玩家,别说因为人人都会Excel就瞧不起Excel玩的溜的朋友.对于运营场景来说,能够和具体业务结合紧密,轻松实现目的,这就是很强大的玩家,但是如果精于提高技 ...

  8. 【PDF】超简单!用Python让Excel自动化办公

    Excel作为当今最流行的办公软件之一,在数据编辑.处理和分析方面的表现都非常出色.但是,即使有 Excel的帮助,在面对重复性.机械性的事务时仍然要花费大量时间. 所以今天了解一下这本<超简单 ...

  9. Python 高手都是怎么玩转 Excel 自动化的

    在日常的工作中,对 Excel 的操作必不可少,如果涉及到大量的 Excel 操作的话,手动处理效率还是比较低的,因此 Excel 自动话完全有必要,今天派森酱就和大家分享一下如何利用 Python ...

最新文章

  1. Golang之gjson
  2. 红茶一杯话Binder(传输机制篇_下)
  3. 状态机设计模式_设计模式-代理/状态机模式
  4. Eclipse 常用快捷键收集
  5. python的实例属性_python 实例属性和类属性
  6. 最简单的PHP MVC留言本实例(二)
  7. extremeComponents资料
  8. 2021年数字IC岗位职责及岗位要求
  9. MySQL基本操作四:数据的查询
  10. delphi开发小白盒接口实现扫码控制
  11. 概率论与数理统计 基本概念
  12. 艾伟_转载:[一步一步MVC]第四回:漫谈ActionLink,有时“胡搅蛮缠”
  13. UOS启用wayland
  14. SOLIDWORKS Electrical无缝集成电气和机械设计
  15. 1219_SCons的配置文件SConstruct
  16. 普通人如何通过积分落户北京? 2021北京积分落户分析必看
  17. VS2019安装和使用(C语言)
  18. ios和android游戏平台,iOS和Android平台上的10款益智游戏
  19. Python常用的12个GUI框架
  20. vscode主题颜色设置为light,代码颜色花里胡哨

热门文章

  1. java 三层架构 mvc_java三层架构与mvc
  2. 用ps出夜间无人驾驶汽车的教程
  3. 关于Cheat Enginee的详细使用指南
  4. STM32对接涂鸦MCU SDK实战教程
  5. 怎样清理苹果手机内存空间_苹果手机喇叭怎么清理
  6. linux下的mysql怎么导入数据,linux下mysql数据的导出和导入
  7. vue创建新项目遇到~/.vuerc may be outdated. Please delete it and re-run vue-cli in manual mode问题解决办法
  8. 锐龙r7 4800h相当于什么水平 r74800h属于哪个档次
  9. 铺铜的之后使过孔的联接不像热焊盘那样呈十字交叉状
  10. ctf misc 图片隐写(所见非真)