最近发现excel数据量极大,并且通过简单的数据操作不能提取到我需要的数据,如果单独操作,数据量太大耗时太长。

想着通过简单的方式,并且快速提取数据,就想到了Python。

python操作Excel使用的openyxl和pandas对Excel进行操作。

代码如下:

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# @Time : 2020-02-24 下午 03:43

# @Author : Zhanxing

# @Site :

# @File : 提取字段.py

# @Software: PyCharm

import openpyxl

import pandas as pd

from xlutils.copy import copy

df=pd.read_excel('222.xlsx',sheet_name='XXX')

data=(df[['XXX','XXX']])

data.to_excel("new.xlsx", index=False)

class Excel:

def __init__(self, excel_file):

self.excel = openpyxl.load_workbook(excel_file)

self.sheet_name = self.excel.get_sheet_names()

self.sheet = self.excel.get_sheet_by_name(self.sheet_name[0])

def excel_read(self):

"""

返回excel每一行的生成器对象

:return:

"""

yield from self.sheet.iter_rows(min_row=2)

def run(excel_file, new_excel):

"""

:param excel_file: 要处理的excel的路径

:param new_excel: 处理后要保存的文件名

:return:

"""

excel = Excel(excel_file)

excel_line = [line for line in excel.excel_read()]

for line in excel_line:

for cell in line:

if isinstance(cell.value, int):

continue

people_name = cell.value.strip('[]').split(',')

for num in range(len(people_name)):

if 'XX' in people_name[num]:

excel.sheet.cell(row=cell.row, column=cell.column, value=people_name[num])

break

excel.excel.save(new_excel)

if __name__ == '__main__':

run('new.xlsx','11.xlsx')

python提取内容保存excel_Python操作Excel之数据提取相关推荐

  1. linux下python识别excel,Python操作Excel之数据提取

    最近发现excel数据量极大,并且通过简单的数据操作不能提取到我需要的数据,如果单独操作,数据量太大耗时太长. 想着通过简单的方式,并且快速提取数据,就想到了Python. python操作Excel ...

  2. python提取excel-Python操作Excel之数据提取

    最近发现excel数据量极大,并且通过简单的数据操作不能提取到我需要的数据,如果单独操作,数据量太大耗时太长. 想着通过简单的方式,并且快速提取数据,就想到了Python. python操作Excel ...

  3. Python入门到实战(五)自动化办公、pandas操作Excel、数据可视化、绘制柱状图、操作Word、数据报表生成、pip install国内镜像下载

    Python入门到实战(五)conda使用.pandas操作Excel.数据可视化.绘制柱状图.操作Word.数据报表生成.pip install国内镜像下载 conda使用 常用操作 配置VS+Co ...

  4. 简单实现POI操作Excel生成数据透视图

    简单实现POI操作Excel生成数据透视图 需求 思考 尝试 实现 搞完收工,去画模板了 需求 财务部门需要做一自动导出数据报表的功能,其中要有指定格式的数据透视图(柱状图.饼状图等等) 思考 正常来 ...

  5. [299]python实现批量解析PDF文件提取内容并写入到Excel中

    摘要:最近需要将一批PDF文件中的某些数据整理到Excel中,因为文件数量接近20w+,手动更新几乎不现实,于是就提取关键词和内容动手写了个Python小工具,以实现自动完成上述目标. 要求: 读取P ...

  6. 怎么python编程excel_Python操作excel

    python 读写 excel 有好多选择,但是,方便操作的库不多,在我尝试了几个库之后,我觉得两个比较方便的库分别是 xlrd/xlwt.openpyxl. 之所以推荐两个库是因为这两个库分别操作的 ...

  7. python 标准库 excel_Python 操作 Excel 的函数库

    1. Python 操作 Excel 的函数库 我主要尝试了 3 种读写 Excel 的方法: 1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持,在任何操作系统上都 ...

  8. python替换excel指定内容_Python脚本操作Excel实现批量替换功能

    大家好,给大家分享下如何使用Python脚本操作Excel实现批量替换. 使用的工具 Openpyxl,一个处理excel的python库,处理excel,其实针对的就是WorkBook,Sheet, ...

  9. fitz 将pdf裁剪成左中右三部分,并提取内容保存为excel

    fitz介绍 fitz官网 fitz 是 PyMuPDF 库的一个封装,它是一个用于处理 PDF 文件的 Python 库.PyMuPDF 是一个强大而灵活的 PDF 处理库,而 fitz 则是对其进 ...

最新文章

  1. WebService(1)名词了解
  2. Ubuntu21.04开机自动挂载Windows硬盘分区
  3. 大厂提供什么样的软硬件来吸引人才?
  4. Python批量拆分Excel文件中已合并的单元格
  5. python中的super使用方法[探索4]
  6. 图解SQL的Join(转摘)
  7. wps下一步快捷键_WPS快捷键大全(最常用138个办公快捷键)
  8. android截屏方法是黑屏,Android截屏SurfaceView黑屏问题的解决办法
  9. 评论回复功能 asp.net_抖音蓝V企业号运营必备,用户管理功能技巧大揭秘!
  10. Angular6 + My97DatePicker时间选择器实现数据双向绑定
  11. Javascript实现秒杀倒计时(时间与服务器时间同步)
  12. 基于Python实现语法分析
  13. 【计算机网络】时延、发送时延、传输时延、处理时延、排队时延、时延带宽积
  14. 软键盘弹起后顶起EditText的完美解决方案
  15. Hive案例-学生成绩表综合案例
  16. ros与stm32串口通信
  17. PHP版]个人精美网站系统
  18. Android中TextView:的ellipsize属性
  19. 驱动开发(二)——最简单的驱动程序分析
  20. Git-Git里程碑

热门文章

  1. 正则表达式 Exel单元格
  2. Spring Boot (二)集成Mybatis、Druid
  3. 机器学习----决策树(一)
  4. GestureOverlayView
  5. mysql重新初始化
  6. 10004---简析TCP的三次握手与四次分手
  7. #离散#SSL 1231 VIJOS 1238 容易的网络游戏
  8. Python编程基础-函数
  9. 混合颜色带的应用(一)
  10. 《第五周RFID作业》物联112118 林家辉