1. Python 操作 Excel 的函数库

我主要尝试了 3 种读写 Excel 的方法:

1> xlrd, xlwt, xlutils: 这三个库的好处是不需要其它支持,在任何操作系统上都可以使用。xlrd 可以读取 .xls, .xlsx 文件,非常好用;但因为 xlwt 不能直接修改 Excel 文档,必须得复制一份然后另存为其它文件,而且据说写复杂格式的 Excel 文件会出现问题,所以我没有选它来写 Excel 文件。

2> openpyxl: 这个库也是不需要其它支持的,而且据说对 Office 2007 格式支持得更好。遗憾地是,我经过测试,发现它加载 Excel 文件的效率比 xlrd 慢 3 倍以上,内存使用在 10 倍以上,于是就放弃了。

3> win32com: Python Win32 扩展,这个库需要运行环境为 Windows+Office 对应版本。由于 Python Win32 扩展只是把 COM 接口包装了一下,可以视为与 VBA 完全相同,不会有读写格式上的问题。尝试了一下用 win32com 读取 Excel 文件,效率还是比 xlrd 慢一些。

由于读取效率上 xlrd > win32com > openpyxl,所以我自然选择了 xlrd 用来读取统计报表;而最终输出的报表格式较复杂,所以选择了 win32com 直接操作 Excel 文件。

2. Python 里的关系型数据库

SQLite 是一个非常轻量级的关系型数据库,很多语言和平台都内置 SQLite 支持,也是 iOS 和 Android 上的默认数据库。Python 的标准库里也包含了 sqlite3 库,用起来非常方便。

3. 用 xlrd 读取 Excel 并插入数据库样例

如果数据量不大,直接用 Python 内部数据结构如 dict, list 就够了。但如果读取的几张表数据量都较大,增加个将数据插入数据库的预处理过程就有很大好处。一是避免每次调试都要进行耗时较长的 Excel 文件载入过程;二是能充分利用数据库的索引和 SQL 语句强大功能进行快速数据分析。

#!/usr/bin/python # -*- coding: gbk -*- import xlrd import sqlite3 # 打开数据库文件

device_city_db = sqlite3.connect('device_city.db') cursor = device_city_db.cursor() # 建表

cursor.execute('DROP TABLE IF EXISTS device_city')

cursor.execute('CREATE TABLE device_city (device_id char(16) PRIMARY KEY, city varchar(16))')

# 打开 device 相关输入 Excel 文件

device_workbook = xlrd.open_workbook('输入.xlsx')

device_sheet = device_workbook.sheet_by_name('设备表')

# 逐行读取 device-城市 映射文件,并将指定的列插入数据库 for row in range(1, device_sheet.nrows):

device_id = device_sheet.cell(row, 6).value    if len(device_id) > 16:

device_id = device_id[0:16]    if len(device_id) == 0:        continue

city = device_sheet.cell(row, 10).value    # 避免插入重复记录

cursor.execute('SELECT * FROM device_city WHERE device_id=?', (device_id,))    res = cursor.fetchone()    if res == None:

cursor.execute('INSERT INTO device_city (device_id, city) VALUES (?, ?)',                       (device_id, city))    else:

if res[1] != city:

print '%s, %s, %s, %s' % (device_id, city, res[0], res[1]) device_city_db.commit()

4. 将结果写入 Excel 文件样例

使用 win32com 写入 Excel 的时候要注意,一定要记得退出 Excel,否则下次运行会出错。这需要增加异常处理语句,我这里偷了个懒,出了异常后要手动杀死任务管理器中的 excel 进程。至于 win32com 中类的接口,可以从 MSDN 网站查阅。 import win32com.client as win32 import os

excel = win32.gencache.EnsureDispatch('Excel.Application') excel.Visible = False # 貌似这里只能接受全路径

workbook = excel.Workbooks.Open(os.path.join(os.getcwd(), '输出.xlsx')) month_sheet = workbook.Worksheets(1) # 计算文件中实际有内容的行数

nrows = month_sheet.Range('A65536').End(win32.constants.xlUp).Row # 操作 Excel 单元格的值

for row in range(5, nrows-4):

month_sheet.Cells(row, 1).Value += something # 保存工作簿

workbook.Save() # 退出 Excel

excel.Application.Quit()

python 标准库 excel_Python 操作 Excel 的函数库相关推荐

  1. python 折线图 excel_Python操作Excel,openpyxl模块,画折线图

    一.如图 30万数据,比较大,挤一起了 import sys import uuid import string import json import time import random impor ...

  2. 新技能 | 使用python代码来高效操作Excel表格 (文末赠书5本)

    新技能 | 使用python代码来高效操作Excel表格 (文末赠书5本) 在日常学习和工作中,少不了要跟Excel表格打交道.而我们作为程序猿,深知代码编程给人带来的便捷性,那我们怎么样使用代码来操 ...

  3. 【Python数据分析】Python3操作Excel(二) 一些问题的解决与优化

    [Python数据分析]Python3操作Excel(二) 一些问题的解决与优化 参考文章: (1)[Python数据分析]Python3操作Excel(二) 一些问题的解决与优化 (2)https: ...

  4. 关于操作Excel的各种库及方法

    删除Excel指定行或列 使用openpyxl库操作Excel,可以删除指定的列 import openpyxlfile_path = r"C:\Users\Desktop\test.xls ...

  5. python 字典处理_python numpy求解积分python中的字典操作及字典函数

    字典 dict_fruit = {'apple':'苹果','banana':'香蕉','cherry':'樱桃','avocado':'牛油果','watermelon':'西瓜'} 字典的操作 W ...

  6. 最新版本POI-5.2.0操作Excel本地导入库配置过程记录

    本文是一篇基于Java+Eclipse+POI操作Excel配置POI操作记录,希望能够帮助到用得上的朋友.Exce简单易学,作为一种轻量的数据管理工具,还是很受普通用户喜爱.专业的程序员怎样把数据库 ...

  7. python 通过openpyxl来操作Excel文件(一 ):读取Excel文件

    这篇文章讲python 通过openpyxl来读取Excel文件 不清楚怎么通过openpyxl来写入Excel文件的小伙伴可以看我另一篇文章 传送门python 通过openpyxl来操作Excel ...

  8. python win32com + VBA宏 操作Excel,清除Excel中的公式

    python win32com + VBA宏 操作Excel,清除Excel中的公式 最近有个需求是自动化清楚excel中的公式,尝试了使用openpyxl读取的时候不加载公式,但这样的结果是使用了公 ...

  9. python 通过openpyxl来操作Excel文件(二 ):写入Excel文件

    这篇文章讲python 通过openpyxl来写入Excel文件,不清楚python怎么读取Excel文件的小伙伴可以去看下我的另一篇文章 传送门https://blog.csdn.net/i_cof ...

最新文章

  1. 硬核!30 张图解 HTTP 常见的面试题
  2. SQL Server中遍历表中记录的方法
  3. __len__的作用
  4. sas宏中如何跳出%do循环
  5. Find All Numbers Disappeared in an Array
  6. mysql命令书写顺序_MySQL SQL语句书写顺序和执行顺序
  7. matlab 数字调制函数,matlab用于数字调制,几个函数的使用问题
  8. oracle定时清理回收站,电脑设置定时清理回收站的操作方法
  9. rk3128-android7.1 wifi拓展小功能
  10. 二进制与格雷码相互转换
  11. 摩尔庄园不同服务器账号互通吗,摩尔庄园手游服务器互通吗?摩尔庄园手游不同区可以一起玩吗?...
  12. 用makedown写一份简约大方的简历
  13. jQuery boxy弹出层对话框插件中文演示及讲解
  14. 免费的API-手机号码归属地接口
  15. 软件工程硕士研究生论文撰写事项
  16. P5149 会议座位 归并
  17. Android原生图表库调研
  18. 危险化学品题库及答案
  19. 2.天猫商品数据爬虫(已模拟登录)
  20. 完美解决django 在迁移数据库的时候出现的1146错误

热门文章

  1. 图像处理四:霍夫变换
  2. intel 酷睿core系列cpu的类型:U M H HQ MQ
  3. jmeter配置元件之计数器
  4. Java泛型、反射、集合、多线程
  5. Python爬虫解析htm时lxml的HtmlElement对象获取和设置inner html方法
  6. spring源码之bean加载(bean解析下篇)
  7. 《微服务设计》(一)---- 微服务
  8. 2016届毕业生-毕业设计的相关事项
  9. BZOJ 1571: [Usaco2009 Open]滑雪课Ski
  10. Deploy Oracle 10.2.0.5 on Red Hat Enterprise Linux 6.4