点击上方『早起Python』关注并星标公众号

第一时间接收最新Python干货!

前言

在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算、整理数据并写入Word中,其实并不难,主要就是以下两步:openpyxl读取Excel获取内容

docx读写Word文件

那我们开始吧!

需求确认

首先来看下我们需要处理的Excel部分数据,因涉及隐私已经将数据皮卡丘化

可以看到数据非常多,并且还存在重复数据。而我们要做的就是对每一列的数据按照一定的规则进行计算、整理并使用Python自动填入到Word中,大致的要求如下

上面仅是部分要求,真实需要填入word中的数据要更多!

除了对按照格式进行处理并存入Word中指定位置之外,还有一个需求:最终输出的word文件名还需要按照一定规则生成:

OK,需求分析完毕,接下来看Python如何解决!

Python实现

首先我们使用Python对该Excel进行解析from openpyxl import load_workbook

import os

# 获取桌面的路径

def GetDesktopPath():

return os.path.join(os.path.expanduser("~"), 'Desktop')

path = GetDesktopPath() + '/资料/' # 形成文件夹的路径便后续重复使用

workbook = load_workbook(filename=path + '数据.xlsx')

sheet = workbook.active # 获取当前页

# 可以用代码获取数据范围,如果要批处理循环迭代也方便

# 获取有数据范围

print(sheet.dimensions)

# A1:W10

利用openpyxl读取单元格有以下几种用法cells = sheet['A1:A4'] # 返回A1-A4的4个单元格

cells = sheet['A'] # 获取A列

cells = sheet['A:C'] # 获取A-C列

cells = sheet[5] # 获取第5行

# 注意如果是上述用cells获取返回的是嵌套元祖

for cell in cells:

print(cell[0].value) # 遍历cells依然需要取出元祖中元素才可以获取值

# 获取一个范围的所有cell

# 也可以用iter_col返回列

for row in sheet.iter_rows(min_row=1, max_row=3,min_col=2, max_col=4):

for cell in row:

print(cell.value)

明白了原理我们就可以解析获取Excel中的数据了# SQE

SQE = sheet['Q2'].value

# 供应商&制造商

supplier = sheet['G2'].value

# 采购单号

C2_10 = sheet['C2:C10'] # 返回cell.tuple对象

# 利用列表推导式后面同理

vC2_10 = [str(cell[0].value) for cell in C2_10]

# 用set简易去重后用,连接,填word表用

order_num = ','.join(set(vC2_10))

# 用set简易去重后用&连接,word文件名命名使用

order_num_title = '&'.join(set(vC2_10))

# 产品型号

T2_10 = sheet['T2:T10']

vT2_10 = [str(cell[0].value) for cell in T2_10]

ptype = ','.join(set(vT2_10))

# 产品描述

P2_10 = sheet['P2:P10']

vP2_10 = [str(cell[0].value) for cell in P2_10]

info = ','.join(set(vP2_10))

info_title = '&'.join(set(vP2_10))

# 日期

# 用datetime库获取今日时间以及相应格式化

import datetime

today = datetime.datetime.today()

time = today.strftime('%Y年%m月%d日')

# 验货数量

V2_10 = sheet['V2:V10']

vV2_10 = [int(cell[0].value) for cell in V2_10]

total_num = sum(vV2_10) # 计算总数量

# 验货箱数

W2_10 = sheet['W2:W10']

vW2_10 = [int(cell[0].value) for cell in W2_10]

box_num = sum(vW2_10)

# 生成最终需要的word文件名

title = f'{order_num_title}-{supplier}-{total_num}-{info_title}-{time}-验货报告'

print(title)

通过上面的代码,我们就成功的从Excel中提取出来数据,这样Excel部分就结束了,接下来进行word的填表啦,由于这里我们默认读取的word是.docx格式的,实际上读者的需求是.doc格式文件,所以windows用户可以用如下代码批量转化doc,前提是安装好win32com# pip install pypiwin32

from win32com import client

docx_path = path + '模板.docx'

# doc转docx的函数

def doc2docx(doc_path,docx_path):

word = client.Dispatch("Word.Application")

doc = word.Documents.Open(doc_path)

doc.SaveAs(docx_path, 16)

doc.Close()

word.Quit()

print(' doc文件已转换为docx ')

if not os.path.exists(docx_path):

doc2docx(docx_path[:-1], docx_path)

不过在Mac下暂时没有好的解决策略,如果有思路欢迎交流,好了有docx格式文件后我们继续操作Word部分docx_path = path + '模板.docx'

from docx import Document

# 实例化

document = Document(docx_path)

# 读取word中的所有表格

tables = document.tables

# print(len(tables))

# 15

确定好每个表格数后即可进行相应的填报操作,table的用法和openpyxl中非常类似,注意索引和原生python一样都是从0开始tables[0].cell(1, 1).text = SQE

tables[1].cell(1, 1).text = supplier

tables[1].cell(2, 1).text = supplier

tables[1].cell(3, 1).text = ptype

tables[1].cell(4, 1).text = info

tables[1].cell(5, 1).text = order_num

tables[1].cell(7, 1).text = time

上面代码完成Word中这一部分表格

我们继续用Python填写下一个表格for i in range(2, 11):

tables[6].cell(i, 0).text = str(sheet[f'T{i}'].value)

tables[6].cell(i, 1).text = str(sheet[f'P{i}'].value)

tables[6].cell(i, 2).text = str(sheet[f'C{i}'].value)

tables[6].cell(i, 4).text = str(sheet[f'V{i}'].value)

tables[6].cell(i, 5).text = str(sheet[f'V{i}'].value)

tables[6].cell(i, 6).text = '0'

tables[6].cell(i, 7).text = str(sheet[f'W{i}'].value)

tables[6].cell(i, 8).text = '0'

tables[6].cell(12, 4).text = str(total_num)

tables[6].cell(12, 5).text = str(total_num)

tables[6].cell(12, 7).text = str(box_num)

这里需要注意两个细节:word写入的数据需是字符串,所以从Excel获取的数据需要用str格式化

表格可能存在合并等其他情况,因此你看到的行数和列数可能不是真实的,需要用代码不断测试。

按照上面的办法,将之前从Excel中取出来的数据一一填充到Word中对应位置就大功告成!最后保存一下即可。document.save(path + f'{title}.docx')

print(' 文件已生成')

结束语

回顾上面的过程,其实从需求和文件格式上看,这次文件的读写解析任务较复杂,码代码和思考时间会较久,所以当我们在考虑使用Python进行办公自动化之前需要想清楚这个问题:这次需要完成的任务是否工作量很多,或者以后长期需要进行,用Python是否可以解放双手?如果不是,实际上手动就可以完成,那么就失去了自动化办公的意义!

往期精选(?猛戳可查看)

python 办公自动化-Python办公自动化|从Excel到Word相关推荐

  1. 基于Visual C++2010 与office2010开发办公自动化(2)-自动生成excel与word并打开

    VS2010是新一代全新开发工具 属于全新的系统构架 VS2010旗舰版功能全景 Office 2010,是微软推出新一代办公软件,开发代号为Office 14,实际是第12个发行版.该软件共有6个版 ...

  2. 基于Visual C++2010 与office2010开发办公自动化 2 -自动生成excel与word并打开

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! VS20 ...

  3. 学Python划重点 五 (处理Excel、Word、PDF实例)

    一.Python 处理Excel Python 实现对excel 文件的读写功能主要有三个模块:xlwt .xlrd 和openpyxl . 这里用openpyxl模块. Python 没有自带ope ...

  4. Python办公自动化(二)|从Excel到Word

    前言 在前几天的文章中我们讲解了如何从Word表格中提取指定数据并按照格式保存到Excel中,今天我们将再次以一位读者提出的真实需求来讲解如何使用Python从Excel中计算.整理数据并写入Word ...

  5. Python办公自动化(一):从Word到Excel

    有这样一份Word(由于涉及文件私密所以文中的具体内容已做修改) 一共有近2600条类似格式的表格细栏,每个栏目包括的信息有: 日期 发文单位 文号 标题 签收栏 需要提取其中加粗的这三项内容到Exc ...

  6. python办公自动化之批量生成docx——根据excel生成word、根据word生成excel

    python办公自动化之批量生成docx--根据excel生成word 系列文章 本文目录 一.从excel读取 二.写入docx 三.批量生成docx 四.反向操作,根据word生成excel 系列 ...

  7. Python办公自动化之Excel转Word

    在日常工作中,Python在办公自动化领域应用非常广泛,如批量将多个Excel中的数据进行计算并生成图表,批量将多个Excel按固定格式转换成Word,或者定时生成文件并发送邮件等场景.本文主要以一个 ...

  8. Python零基础速成班-第14讲-Python处理Excel和Word,使用openpyxl和docx包详解,图表入门

    Python零基础速成班-第14讲-Python处理Excel和Word,使用openpyxl和docx包详解,图表入门 学习目标 Python处理Excel(使用openpyxl包).图表入门\ P ...

  9. 【Python自动化办公】实现excel表中的数据批量导入到word指定位置(表格形式和下滑线形式)

    文章目录 案例1--word模板为表格 案例2--word模板中带有下划线形式 python docx基本操作 回到需求 案例1--word模板为表格 目的就是把excel中的数据,填入word模板中 ...

  10. python爬虫和办公自动化培训班

    Python这几年都挺火的,比如说应用于数据分析.机器学习.自动化办公.写爬虫采集数据等等--因为我之前发过几篇和python有关的推文,所以不止一个朋友加私信问我说,你是怎么学的,能不能谈一谈学习的 ...

最新文章

  1. 推荐:一款Java开源的Springboot 即时通讯 IM 聊天系统
  2. 机器学习:选对时机直线超车
  3. EOS入门指南PART6——别忙着开发,先来看看智能合约数据是怎么存的
  4. xcart-子分类/语言不显示
  5. iptables详解以及企业常用案例
  6. 微软Kubernetes服务AKS开发正式版空间服务
  7. vue——单文件组件
  8. Jupyter notebook基础教程(启动,汉化,操作)
  9. OpenCV-Python实战(番外篇)——利用增强现实制作美颜挂件,让你的照片与众不同
  10. 还怕Web 安全编程学不会?来这里,准没错!
  11. 小D课堂-SpringBoot 2.x微信支付在线教育网站项目实战_3-4.动态Sql语句Mybaties SqlProvider...
  12. DSP 程序远程升级 / Bootloader设计指南(一)—— 初识Bootloader/DSP引导流程
  13. nagios——短讯报警
  14. 微信公众号如何上传文档附件_公众号添加Excel、PDF、PPT等附件教程
  15. C++STL常用算法adjacent_find
  16. 宝塔自助建站程序源码 网站建设公司必备程序
  17. MSDC 4.3 接口规范(18)
  18. 适合编程初学者的开源博客系统(Python版)
  19. arm oe linux gnueabi 系统,[MDM9X07] ME3610/3630开发环境快速搭建
  20. 【服务器搭建个人网站】教程二:快速搭建我们服务器 进来看

热门文章

  1. POJ - 3070 Fibonacci
  2. win10x64下的redis安装与使用
  3. [c/c++] programming之路(28)、结构体存储和内存对齐+枚举类型+typedef+深拷贝和浅拷贝...
  4. double类型数值计算出现误差的解决办法
  5. Poj 1112 Team Them Up!
  6. c# 对文件流的读写
  7. 计算机文件系统小结,文件系统总结.doc
  8. python100行代码程序-100行python代码,轻松完成贪吃蛇小游戏
  9. 用python画简单的四叶草-使用 python 操作 redis
  10. python可以做什么系统-用python做推荐系统(一)