【Python自动化Excel】pandas处理Excel数据的基本流程
这里所说的pandas并不是大熊猫,而是Python的第三方库。这个库能干嘛呢?它在Python数据分析领域可是无人不知、无人不晓的。可以说是Python世界中的Excel。
pandas库处理数据相比于Excel,有一个极大的优点:数据
和处理逻辑
是分离的。基于这一点,便可以实现Excel数据处理的自动化,对于重复繁琐的数据分析,pandas一次编写脚本便“终身受益”。反观Excel,遇到重复的任务还得一遍一遍地输入公式、拖动填充柄。
pandas处理Excel数据的基本流程
从基本流程来看,这个数据处理过程,就是对原数据进行加工,生成新数据的过程。原始Excel文件
就像是原材料
,生成Excel文件
就像是新产品
。而pandas中就是这个加工厂,加工厂的处理逻辑就是根据具体需求来编写的代码。可以从下面的实例中来理解这过程。
实例演示
实例需求描述:
视频演示:
pandas中的常用方法简介
一、读取Excel文件
import pandas as pd
df = pd.read_excel(io,header=0)
常用参数介绍:
io
:需要传入Excel文件的路径。该参数没有默认值,不能为空header
:可以指定从Excel中的哪一行开始读取数据。默认为0,从第一行开始。
二、数据处理
DataFrame类型
DataFrame
是pandas
库中的重要数据类型,可以叫做:数据框,好比放数据的架子,由行和列组成。其实跟Excel工作的表很类似,都是二维的。
筛选
简单的数据筛选,只需要输入列名,也叫“键”
计算
按照年龄分类:cut()函数
三、写入Excel文件
df.to_excel("./生成的Excel文件名.xlsx")
- 第一个参数:生成的Excel文件路径。
df.to_excel("./生成的Excel文件名.xlsx")
第一个参数:生成的Excel文件路径。
index
:生成的Excel文件中是否需要index列,默认为True
【Python自动化Excel】pandas处理Excel数据的基本流程相关推荐
- 初学python,利用pandas读取excel出现乱码的问题
初学python,利用pandas读取excel出现乱码的问题 初学python,利用pandas读取excel文件时,出现中文乱码: 左侧出现中文乱码 解决过程: 初始判断是是pandas读取中文出 ...
- 【Python自动化办公】实现excel表中的数据批量导入到word指定位置(表格形式和下滑线形式)
文章目录 案例1--word模板为表格 案例2--word模板中带有下划线形式 python docx基本操作 回到需求 案例1--word模板为表格 目的就是把excel中的数据,填入word模板中 ...
- Python自动化复制整张Excel表的内容
现状描述: 因每天需要接收各个小组的工作日报,由我汇总到一个Excel里面,该Excel分成多个sheet展示.每个小组的日报复制粘贴容易出错,且重复性劳动,于是想用python来实现自动化拷贝. 需 ...
- python日记Day18——Pandas之Excel绘图
python日记--Pandas之Excel绘图 利用pandas和pyplot进行数据可视化,绘图过程中使用到的excel文件如下:excel文件,提取码:falj 柱图的绘制 1.柱状图: imp ...
- Python:使用pandas读取excel
使用新版本的excel,可以直接读取. 使用pandas读取excel指定sheet页: import numpy as np import pandas as pd# 默认首行会作为datafram ...
- 简单易学的python自动化办公教学视频-Python自动化办公之操作Excel文件
模块导入 import openpyxl 读取Excel文件 打开Excel文件 workbook = openpyxl.load_workbook("test.xlsx") 输出 ...
- python操作excel表格-Python自动化办公之操作Excel文件
模块导入 import openpyxl 读取Excel文件 打开Excel文件 workbook = openpyxl.load_workbook("test.xlsx") 输出 ...
- python自动化办公教程-Python自动化办公之操作Excel文件
模块导入 import openpyxl 读取Excel文件 打开Excel文件 workbook = openpyxl.load_workbook("test.xlsx") 输出 ...
- Python自动化办公实战,上万数据中统计断网次数并计算平均断网时间
文章目录 一.需求 二.python代码实现 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手. 很多已经做案例的人,却不知道如何去学习更 ...
- Python数据分析之Pandas读写外部数据文件
点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 阅读目录 1 引言 2 文本文件(txt.csv) 2.1 读取数据 2.2 写入数据 ...
最新文章
- Docker学习笔记_安装ActiveMQ
- Django博客系统(忘记密码)
- 邮件服务之Sendmail
- 【深度学习看手相】台湾学生获奖 AI 项目是科学还是伪科学? 搜狐科技 08-06 12:44 1新智元报道 来源: medium,facebook 编译:胡祥杰 张易 【新智元导读】本周日带来一个有
- 计算机网络工程实验分析与体会_《软件工程》面向对象分析实验
- 计算机硬件实验代码转换,计算机硬件实验指导书(17页)-原创力文档
- SpringBoot 配置文件bootstrap和application的区别
- Java四种引用包括强引用,软引用,弱引用,虚引用。
- 区块链入局,51小长假听歌、打游戏的姿势将被颠覆!
- insert执行成功 没有数据_Python—接口测试数据库封装实现原理
- Task Parallel Library
- YOLO算法v1-v3原理通俗理解
- c语言随机迷宫生成,程序自动生成迷宫
- dxdiag 的使用
- 音频声音太小怎么调大?
- boostrap安装和使用
- Codex Network经济模型篇 (PoA、PoV、CPoA)
- 《大上海》《血滴子》票房不佳很可能都赔钱
- 基于WT2003H语音芯片在GPS公交车自动报站系统的应用设计方案
- UMLet安装以及使用说明