0. 前言

从网页爬下来的大量数据需要清洗?

成堆的科学实验数据需要导入 Excel 进行分析?

有成堆的表格等待统计?

作为人生苦短的 Python 程序员,该如何优雅地操作 Excel?

得益于前人的辛勤劳作,Python 处理 Excel 已有很多现成的轮子,使用较多的有:

xlwings

openpyxl

pandas

win32com

xlsxwriter

DataNitro

xlutils

上次我们介绍了下 xlutils,不少读者留言表示有比它更好使的模块,于是我们又把另外几个都体验了一遍。

本文将从运行环境、文档操作、基本功能和性能等方面对以上模块进行一次粗浅的比较,供大家参考。

1. 环境配置

再好的模块,也需要在正确的 Python 版本以及 Excel 版本才可运行。

提醒及注意:

xlutils 仅支持 xls 文件,即2003以下版本;

win32com 与 DataNitro 仅支持 windows 系统;

xlwings 安装成功后,如果运行提示报错“ImportError: no module named win32api”,请再安装 pypiwin32 或者 pywin32 包;(pip install pypiwin32)

win32com 不是独立的扩展库,而是集成在其他库中,安装 pypiwin32 或者 pywin32 包即可使用;

DataNitro 是 Excel 的插件,安装需到官网下载。

2. 文档操作

虽然大家都是操作 Excel,但即使最基本的新建文件、修改文件、保存文件等功能,在不同的库中也存在差异。比如 xlsxwriter 并不支持打开或修改现有文件,xlwings 不支持对新建文件的命名,DataNitro 作为 Excel 插件需依托于软件本身,pandas 新建文档需要依赖其他库等等。

3. 基本功能

由于设计目的不同,每个模块通常着重于某一方面功能,各有所长。

xlwings

可结合 VBA 实现对 Excel 编程,强大的数据输入分析能力,同时拥有丰富的接口,结合 pandas/numpy/matplotlib 轻松应对 Excel 数据处理工作。

openpyxl

简单易用,功能广泛,单元格格式/图片/表格/公式/筛选/批注/文件保护等等功能应有尽有,图表功能是其一大亮点,缺点是对 VBA 支持的不够好。

pandas

数据处理是 pandas 的立身之本,Excel 作为 pandas 输入/输出数据的容器。

win32com

从命名上就可以看出,这是一个处理 windows 应用的扩展,Excel 只是该库能实现的一小部分功能。该库还支持 office 的众多操作。需要注意的是,该库不单独存在,可通过安装 pypiwin32 或者 pywin32 获取。

xlsxwriter

拥有丰富的特性,支持图片/表格/图表/筛选/格式/公式等,功能与openpyxl相似,优点是相比 openpyxl 还支持 VBA 文件导入,迷你图等功能,缺点是不能打开/修改已有文件,意味着使用 xlsxwriter 需要从零开始。

DataNitro

作为插件内嵌到 Excel 中,可完全替代 VBA,在 Excel 中使用 python 脚本。既然被称为 Excel 中的 python,协同其他 python 库亦是小事一桩。然而,这是付费插件...

xlutils

基于 xlrd/xlwt,老牌 python 包,算是该领域的先驱,功能特点中规中矩,比较大的缺点是仅支持 xls 文件。

4.性能

我们对几个库做了最基本的写入和读取测试,分别使用不同库进行添加及读取 1000行 * 700列 数据操作,得到所用时间,重复操作取平均值。另外在不同的电脑配置,不同的环境下结果肯定会有出入,数据仅供参考。

注:

xlutils 最多只能写入 256 列,即 1000*256,用时3.8秒,表现不错;

DataNitro 与 xlsxwriter 不能打开 Excel 文件。

5. 小结

通过以上的分析,相信大家对几个库都有了简单的了解。在编写文章的过程中,笔者也在思考各个库最适合的应用场景。

不想使用 GUI 而又希望赋予 Excel 更多的功能,openpyxl 与 xlsxwriter,你可二者选其一;

需要进行科学计算,处理大量数据,建议 pandas+xlsxwriter 或者 pandas+openpyxl;

想要写 Excel 脚本,会 Python 但不会 VBA 的同学,可考虑 xlwings 或 DataNitro;

至于 win32com,不管是功能还是性能都很强大,有 windows 编程经验的同学可以使用。不过它相当于是 windows COM 的封装,自身并没有很完善的文档,新手使用起来略有些痛苦。

你可根据自己的需求和生产环境,选择合适的 Python-Excel 模块。

6. 代码示例

最后,附上一些演示代码,大家可自行体会下不同模块的使用。

6.1 xlwings基本代码

import xlwings as xw#连接到excelworkbook = xw.Book(r'path/myexcel.xlsx')#连接excel文件#连接到指定单元格data_range = workbook.sheets('Sheet1').range('A1')#写入数据data_range.value = [1,2,3]#保存workbook.save()

6.2 xlsxwriter基本代码

import xlsxwriter as xw#新建excelworkbook = xw.Workbook('myexcel.xlsx')#新建工作薄worksheet = workbook.add_worksheet()#写入数据worksheet.wirte('A1',1)#关闭保存workbook.close()

6.3 xlutils基本代码import xlrd #读取数据

import xlwt #写入数据import xlutils #操作excel#----xlrd库#打开excel文件workbook = xlrd.open_workbook('myexcel.xls')#获取表单worksheet = workbook.sheet_by_index(0)#读取数据data = worksheet.cell_value(0,0)#----xlwt库#新建excelwb = xlwt.Workbook()#添加工作薄sh = wb.add_sheet('Sheet1')#写入数据sh.write(0,0,'data')#保存文件wb.save('myexcel.xls')#----xlutils库#打开excel文件book = xlrd.open_workbook('myexcel.xls')#复制一份new_book = xlutils.copy(book)#拿到工作薄worksheet = new_book.getsheet(0)#写入数据worksheet.write(0,0,'new data')#保存new_book.save()

6.4 win32com基本代码

import win32com.client as wc#启动Excel应用excel_app = wc.Dispatch('Excel.Application')#连接excelworkbook = excel_app.Workbooks.Open(r'e:/myexcel.xlsx' )#写入数据workbook.Worksheets('Sheet1').Cells(1,1).Value = 'data'#关闭并保存workbook.SaveAs('newexcel.xlsx')excel_app.Application.Quit()

6.5 openpyxl基本代码

import openpyxl# 新建文件workbook = openpyxl.Workbook()

# 写入文件sheet = workbook.activesheet['A1']='data'# 保存文件 workbook.save('test.xlsx')

6.6 DataNitro基本代码

#单一单元格赋值Cell('A1').value = 'data'#单元区域赋值CellRange('A1:B2').value = 'data'

python excel 模块 性能_【xlwings1】Python-Excel 模块哪家强相关推荐

  1. python测试代码性能_使用python timeit 模块检测代码性能

    使用Python 通常在乎的是它的开发效率,而不是运行性能. 但如果通过很简单的方法可以测试出n种不同的写法之间的性能差异,这个过程本身也是一种乐趣. python 自带了timeit 模块,可以在代 ...

  2. excel 重复方差分析_如何在Excel中运行方差方差分析的两种方法

    excel 重复方差分析 Recently, we looked at how to Perform a One-Way Analysis of Variance in Excel. In today ...

  3. python中csv库_关于python 自带csv库的使用心得 附带操作实例以及excel下乱码的解决...

    因为上次帮我们产品处理过一个文件,他想生成能excel处理操作的.但是上次由于时间非常紧张,所以并没有处理好. 正好无聊就来好好研究一下 ,找算法要了几个 csv文件.来好好玩一玩. 全篇使用了pyt ...

  4. python读取第二行_使用Python操作Excel(二):读取数据表

    上一节我们提到,使用openpyxl可以方便的对数据表进行操作,例如:抽象Excel数据并存入数据库 将数据库数据导出到Excel 给一个已存在的数据表追加信息 我们还介绍了一些Excel的基本术语, ...

  5. python 读plt文件_用python读Excel文件

    在IC设计.验证.后端中经常会用Excel来做配置文件.寄存器表.定义后端SDC参数等,不管Excel好不好用,但学习成本低啊. Excel文件的结构 Excel文件主要由工作簿(book).工作表( ...

  6. pandas整表写入excel指定位置_当Python遇到Excel,一个能打的都没有~

    几乎人人都在用Excel,这种极易上手的数据分析工具无处不在,一旦你掌握了窍门,它就变得非常强大.而Python通常被认为更具有挑战性,但能做的事也更多. 当Python遇到Excel会发生什么?本文 ...

  7. .bin 文件用excel文件打开_用python读Excel文件

    在IC设计.验证.后端中经常会用Excel来做配置文件.寄存器表.定义后端SDC参数等,不管Excel好不好用,但学习成本低啊. Excel文件的结构 Excel文件主要由工作簿(book).工作表( ...

  8. python合并excel工作簿_使用Python将多个excel的多个sheet页合并到一个excel

    使用Python将多个excel的多个sheet页合并到一个excel ##读取Excel文件 import xlrd ##将文本写入excel文件 import xlsxwriter ##读取exc ...

  9. 学python对excel有用吗_已经会Excel了还需要学python吗?

    作为一名现代职场人,相信Excel是我最熟悉不过的工具了.作为数据处理的日常办公软件,Excel以其优秀的数据分析处理功能,简单易用的操作成为大家的最爱.也许你不知道python是什么,但是一定知道E ...

最新文章

  1. verilog中有符号数运算
  2. 减少过敏反应的生活细节
  3. 【STM32】OLED 显示实验代码详解
  4. 1虚拟机下U盘或磁盘挂载,Ubuntu下的网络配置,图形化界面和命令界面之间的切换,软件源配置
  5. Lock同步锁--线程同步
  6. 常用的函数式接口_Consumer接口
  7. E - Code Parsing CodeForces - 255B(思维)
  8. 【ArcGIS风暴】ArcGIS10.6获取栅格影像边界范围的三种方法案例详解
  9. Cortex-M3 动态加载一(地址无关代码实现)
  10. Android学习小Demo(10)ToDoList的加强版
  11. 用python导出pptx中每一页的标题
  12. 如何解决SSM框架前台传参数到后台乱码的问题
  13. Oracle 定时任务详解(dbms_job)
  14. 洛谷 P2168 [NOI2015] 荷马史诗
  15. 教你如何在word中像LaTex那样打公式
  16. Error using symconvertChar (sym使用报错)
  17. python之 ffmpeg给mp4视频添加字幕
  18. 最牛散户最新版唐亮一年获利超3亿
  19. 银行计算机信息系统安全检查,银行网络安全自查报告.docx
  20. linux电视软件如何安装程序,在ubuntu 7.04中安装影视制作软件jahshaka

热门文章

  1. mysql maxtmptables_mysql的tmp_table_size和max_heap_table_size
  2. CSS样式为什么放在head中,而不放在body底部
  3. Java黑皮书课后题第6章:**6.22(数学:平方根的近似求法)实现Math类中dsqrt方法的技术:巴比伦法nextGuess = (lastGuess + n / lastGuess) / 2
  4. 1.编写程序,打印基本ASCII码表(可印刷32到126)。
  5. labview连接mysql数据库_labview使用DSN与数据库的连接包括access,mysql
  6. Web前端开发JavaScript基础(3)
  7. openwrt如何单独编译uboot
  8. django orm 操作符
  9. 第八周结对编程四则运算二
  10. 机器学习和深度学习资料整理