python提取内容保存excel_Python操作Excel之数据提取
最近发现excel数据量极大,并且通过简单的数据操作不能提取到我需要的数据,如果单独操作,数据量太大耗时太长。
想着通过简单的方式,并且快速提取数据,就想到了Python。
python操作Excel使用的openyxl和pandas对Excel进行操作。
代码如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2020-02-24 下午 03:43
# @Author : Zhanxing
# @Site :
# @File : 提取字段.py
# @Software: PyCharm
import openpyxl
import pandas as pd
from xlutils.copy import copy
df=pd.read_excel('222.xlsx',sheet_name='XXX')
data=(df[['XXX','XXX']])
data.to_excel("new.xlsx", index=False)
class Excel:
def __init__(self, excel_file):
self.excel = openpyxl.load_workbook(excel_file)
self.sheet_name = self.excel.get_sheet_names()
self.sheet = self.excel.get_sheet_by_name(self.sheet_name[0])
def excel_read(self):
"""
返回excel每一行的生成器对象
:return:
"""
yield from self.sheet.iter_rows(min_row=2)
def run(excel_file, new_excel):
"""
:param excel_file: 要处理的excel的路径
:param new_excel: 处理后要保存的文件名
:return:
"""
excel = Excel(excel_file)
excel_line = [line for line in excel.excel_read()]
for line in excel_line:
for cell in line:
if isinstance(cell.value, int):
continue
people_name = cell.value.strip('[]').split(',')
for num in range(len(people_name)):
if 'XX' in people_name[num]:
excel.sheet.cell(row=cell.row, column=cell.column, value=people_name[num])
break
excel.excel.save(new_excel)
if __name__ == '__main__':
run('new.xlsx','11.xlsx')
python提取内容保存excel_Python操作Excel之数据提取相关推荐
- linux下python识别excel,Python操作Excel之数据提取
最近发现excel数据量极大,并且通过简单的数据操作不能提取到我需要的数据,如果单独操作,数据量太大耗时太长. 想着通过简单的方式,并且快速提取数据,就想到了Python. python操作Excel ...
- python提取excel-Python操作Excel之数据提取
最近发现excel数据量极大,并且通过简单的数据操作不能提取到我需要的数据,如果单独操作,数据量太大耗时太长. 想着通过简单的方式,并且快速提取数据,就想到了Python. python操作Excel ...
- Python入门到实战(五)自动化办公、pandas操作Excel、数据可视化、绘制柱状图、操作Word、数据报表生成、pip install国内镜像下载
Python入门到实战(五)conda使用.pandas操作Excel.数据可视化.绘制柱状图.操作Word.数据报表生成.pip install国内镜像下载 conda使用 常用操作 配置VS+Co ...
- 简单实现POI操作Excel生成数据透视图
简单实现POI操作Excel生成数据透视图 需求 思考 尝试 实现 搞完收工,去画模板了 需求 财务部门需要做一自动导出数据报表的功能,其中要有指定格式的数据透视图(柱状图.饼状图等等) 思考 正常来 ...
- [299]python实现批量解析PDF文件提取内容并写入到Excel中
摘要:最近需要将一批PDF文件中的某些数据整理到Excel中,因为文件数量接近20w+,手动更新几乎不现实,于是就提取关键词和内容动手写了个Python小工具,以实现自动完成上述目标. 要求: 读取P ...
- 怎么python编程excel_Python操作excel
python 读写 excel 有好多选择,但是,方便操作的库不多,在我尝试了几个库之后,我觉得两个比较方便的库分别是 xlrd/xlwt.openpyxl. 之所以推荐两个库是因为这两个库分别操作的 ...
- python 标准库 excel_Python 操作 Excel 的函数库
1. Python 操作 Excel 的函数库 我主要尝试了 3 种读写 Excel 的方法: 1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持,在任何操作系统上都 ...
- python替换excel指定内容_Python脚本操作Excel实现批量替换功能
大家好,给大家分享下如何使用Python脚本操作Excel实现批量替换. 使用的工具 Openpyxl,一个处理excel的python库,处理excel,其实针对的就是WorkBook,Sheet, ...
- fitz 将pdf裁剪成左中右三部分,并提取内容保存为excel
fitz介绍 fitz官网 fitz 是 PyMuPDF 库的一个封装,它是一个用于处理 PDF 文件的 Python 库.PyMuPDF 是一个强大而灵活的 PDF 处理库,而 fitz 则是对其进 ...
最新文章
- WebService(1)名词了解
- Ubuntu21.04开机自动挂载Windows硬盘分区
- 大厂提供什么样的软硬件来吸引人才?
- Python批量拆分Excel文件中已合并的单元格
- python中的super使用方法[探索4]
- 图解SQL的Join(转摘)
- wps下一步快捷键_WPS快捷键大全(最常用138个办公快捷键)
- android截屏方法是黑屏,Android截屏SurfaceView黑屏问题的解决办法
- 评论回复功能 asp.net_抖音蓝V企业号运营必备,用户管理功能技巧大揭秘!
- Angular6 + My97DatePicker时间选择器实现数据双向绑定
- Javascript实现秒杀倒计时(时间与服务器时间同步)
- 基于Python实现语法分析
- 【计算机网络】时延、发送时延、传输时延、处理时延、排队时延、时延带宽积
- 软键盘弹起后顶起EditText的完美解决方案
- Hive案例-学生成绩表综合案例
- ros与stm32串口通信
- PHP版]个人精美网站系统
- Android中TextView:的ellipsize属性
- 驱动开发(二)——最简单的驱动程序分析
- Git-Git里程碑