公众号: 早起Python

作者:刘早起

大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进行分析。

那么你知道如何使用Python读取Excel中的图片?又如何使用Python直接往Excel中写入图片?甚至使用Python制作一个Excel可视化大屏?

因为图片的存储格式与数字数据格式不一样,所以实现起来稍显复杂,本文就将对以下两个部分进行深入讲解:

Python读取Excel图片Python写入Excel图片

涉及的Python模块有以下几个

PIL

win32

os

zipfile

numpy

xlsxwriter

一、准备

由于此次包比较多,我们需要在命令行中使用

pip

进行安装

pip install pillow #这是对模块PTL的安装pip install pypiwin32 #这是对win32的安装pip install os pip install zipfilepip install numpypip install xlsxwriter

在下载的过程中,有些包是比较大的,会出现超时

time out

的报错现象。这里介绍几个国内的镜像,大家可以尝试其中一个,速度会比单纯的pip快10倍不止。地址如下:

http://pypi.douban.com/simple/ 豆瓣http://mirrors.aliyun.com/pypi/simple/ 阿里http://pypi.hustunique.com/simple/ 华中理工大学http://pypi.sdutlinux.org/simple/ 山东理工大学http://pypi.mirrors.ustc.edu.cn/simple/ 中国科学技术大学https://pypi.tuna.tsinghua.edu.cn/simple 清华

代码如下:

pip install 模块名 -i 网址

以清华镜像举例

pip install pillow -i https://pypi.tuna.tsinghua.edu.cn/simple

注意:如果是原生态的cmd窗口安装的,会提示加个--user命令,读者按照指示即可。

二、Python读取Excel图片

上面说过,Python读取Excel图片有两种方法。

“第一种:将xlsx后缀名改为zip形式,即进行压缩。而后读取里面存储图片的文件,将里面的图片取出来。第二种:用提取到粘贴板中的方法将图片保存到JPG、PNG等格式中”

两种方法各有缺点和优点,第一种方法缺点是代码量比较长,优点是万能,Excel的所有格式都可以运用。

第二种的优点是代码量少,缺点是对于一些

xlsx

的文件运用不了。

首先我们先讲解第一种方法,之后在讲解第二种方法时,大家可以进行对比!

讲解之前我们用的是以下的

example.xlsx

文件,里面有四个工作表,每个工作表都有一张数据可视化图。例如工作表3中的气泡图如下:

2.1 方法一

和之前的文章一样,我们先给出全部代码与效果图之后再进行讲解

import osimport zipfileimport osfrom PIL import Imageimport numpy as np path = r'D:'count = 1for file in os.listdir(path):new_file = file.replace(".xlsx",".zip") os.rename(os.path.join(path,file),os.path.join(path,new_file)) count+=1print('总共有'+str(count)+'个文件夹')number = 0craterDir = "D:/" # 存放zip文件的文件夹路径saveDir = "D:/" # 存放图片的路径 list_dir = os.listdir(craterDir) for i in range(len(list_dir)): if 'zip' not in list_dir[i]: list_dir[i] = ''while '' in list_dir: list_dir.remove('') for zip_name in list_dir: print(zip_name) azip = zipfile.ZipFile(craterDir + zip_name) namelist = (azip.namelist()) for idx in range(0,len(namelist)): if namelist[idx][:9] == 'xl/media/':#图片是在这个路径下 img_name = saveDir + str(number)+'.jpg' f = azip.open(namelist[idx]) img = Image.open(f) img = img.convert("RGB") img.save(img_name,"JPEG") number += 1azip.close() #关闭文件,必须有,释放内存

效果展现如下:

可以看到

example.xlsx

里面的四张工作表里的图片都提取出来,保存在本地。

现在我们进行代码解析,首先,引入相关包

import osimport zipfilefrom PIL import Imageimport numpy as np

其次,就是将

xlsx

格式结尾的文件夹进行压缩,转化成

zip

结尾的文件

path = r'D:' #excel文件位置count = 1for file in os.listdir(path):new_file = file.replace(".xlsx",".zip") os.rename(os.path.join(path,file),os.path.join(path,new_file)) count+=1

这里首先设置了

example.xlsx

的文件位置,在D盘的根目录,读者需要做调整的话在path那行代码修改即可。

其次用

os

模块的

listdir

函数用于返回指定的文件夹包含的文件或文件夹的名字的列表。再用for循环遍历这个列表,将

.xlsx

结尾的改为

.zip

结尾。

同时再用

os.rename()

函数重命名对应的文件夹。count是用来告诉用户这个文件夹有多少个文件的,用于检验。

最后,就是在这些压缩过后的文件中,提取图片。代码如下

number = 0craterDir = "D:/" # 存放zip文件的文件夹路径saveDir = "D:/" # 存放图片的路径 list_dir = os.listdir(craterDir) # 获取所有的文件名for i in range(len(list_dir)):if 'zip' not in list_dir[i]: list_dir[i] = ''while '' in list_dir: list_dir.remove('')

下面是代码解析:

首先,

number=0

是用来最后命名图片的。

craterDir

是指存放zip的文件夹路径,saveDir指存放提取后的图片的指定路径。用

os.listdir()

函数来获取在这个路径下的所有文件名字。

这里强调下,本章代码采用的路径,除了上面讲过的path外,其他都用绝对路径,因为如os模块和zipfile模块,这些模块用绝对路径更不会报错。

下面用一个for循环加个while循环的用途是剔除不是

.zip

结尾的文件夹。这时有读者会问,用for循环加个列表

del

函数不香吗?

其实是不行的,大家可以去尝试一下。原因是,你每次del广域网一个列表的元素,列表的数量值会一直在变而不是固定的,这样就会导致超出索引的错误。

for zip_name in list_dir:print(zip_name) # 默认模式r,读 azip = zipfile.ZipFile(craterDir + zip_name) # 返回所有文件夹和文件 namelist = (azip.namelist()) for idx in range(0,len(namelist)): if namelist[idx][:9] == 'xl/media/':#图片是在这个路径下 img_name = saveDir + str(number)+'.jpg' f = azip.open(namelist[idx]) img = Image.open(f) img = img.convert("RGB") img.save(img_name,"JPEG") number += 1azip.close() #关闭文件,必须有,释放内存

最后就是读取zip文件中的图片。用for循环遍历我们已经处理过的

list——dir

列表,得到zip文件名,再用

zipfile.ZipFile()

函数来打开我们zip文件。其中

azip.namelist()

函数是用来装zip文件里面所有文件的文件名列表。

接下来可以进入到zip文件中仔细观察,可以发现我们所需要的图片在

'xl/media/'

这个路径下,有了这个目标后,我们再用for循环遍历zip文件里的所有文件,找到路径下的图片。

第二个for循环需要注意几点:

“azip.open()是zipfile模块里的打开命令。相对应的,就有azip.close()这个命令,这个命令再整个程序运行完后必须运训,因为不仅可以清理所占空间,而且如果你需要还原xlsx文件格式的话,你就必须得关闭,不然会报错。Image.open()是模块Pillow模块的读取图片函数,也算是我们本章最重要的函数之一了,与其搭配的是Image.save()函数,是用来存储的。中间插着一段代码img.convert("RGB"),这个一般都是要用到的,我们存储的图片大多数是有色的,也就是RGB图像,如果是黑白的话就要调一下参数。有兴趣的读者可以自行查阅文献。”

2.2 方法二

接下来讲解第二种方法,先上代码

from PIL import ImageGrabimport win32com.client as win32excel = win32.gencache.EnsureDispatch('Excel.Application')workbook = excel.Workbooks.Open(r'D:\example.xlsx')num = 1for sheet in workbook.Worksheets:for i, shape in enumerate(sheet.Shapes): if shape.Name.startswith('Picture'): shape.Copy() image = ImageGrab.grabclipboard() image.convert('RGB').save(r'D:\{}.jpg'.format(num), 'jpeg') num+=1excel.Quit()

效果呈现:

从上图可以看到,与方法一的效果相比,基本一致,除了没有进行压缩,下面简单说一下代码

from PIL import ImageGrabimport win32com.client as win32excel = win32.gencache.EnsureDispatch('Excel.Application')workbook = excel.Workbooks.Open(r'D:\example.xlsx')

首先先引入方法二相关的模块,第三行代码是引入模块

win32

中对Excel中的运用程序。第四行和方法一一样是读取D盘根目录下的

example.xlsx

文件。

num = 1for sheet in workbook.Worksheets:for i, shape in enumerate(sheet.Shapes): if shape.Name.startswith('Picture'): shape.Copy() image = ImageGrab.grabclipboard() image.convert('RGB').save(r'D:\{}.jpg'.format(num), 'jpeg') num+=1excel.Quit()

第一行

num=1

,是用来为下面存储图片的图片命名的

接下来就是进行for嵌套for,第一个for循环的目的是遍历所选Excel文件中的工作表,我们有四张图片放在

example.xlsx

的四个不同的工作表里。第二个for循环是用来遍历每个工作表中的图片并复制到粘贴板中的。

其中,

enumerate()

函数是用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。这里的意思就是存放每张图片数据信息的索引。i是数据下标,shape是数据

“shape.Name.startswith('Picture')是判断获到的shape里面名字信息中的开头是否符合'pitcure',如果是,则返回True。shape.Copy()函数是对一个一个字典的浅复制(拷贝)。简单来说就是只在程序中的复制。ImageGrab.grabclipboard()函数是方法二的精髓,这个函数是抓取当前剪贴板的快照,返回一个模式为“RGB”的图像或者文件名称的列表。如果剪贴板不包括图像数据,这个函数返回空。读者可以使用函数isinstance()来检查该函数返回的是一个有效图像对象或者其他数据。image.convert('RGB').save(r'D:\{}.jpg'.format(num), 'jpeg')这段语句,是将得到的image以jpg的格式存储。这里的jpeg其实就是jpg,只不过模块里以jpeg代替jpg。”

注意,这里必须用

convert('RGB')

,如果不使用

.convert('RGB')

进行转换的话,读出来的图像是RGBA四通道的,A通道为透明通道,运出来是没有图像显示的。因此使用

convert('RGB')

进行通道转换。

至此,我们就讲完了使用Python提取Excel中图片的两种方法,大家可以根据自己的情况来选择如恶化提取Excel中的图片。

二、Python写入Excel图片

在讲完如何用Python提取Excel中图片之后,下面我们将讲解如何用Python将图片写入到Excel文件中。

我们常用的模块是

xlsxwriter

。这里先介绍这个模块的常用插入图片函数

worksheet.insert_image(row,col,image[,options]

:在工作表单元格中插入一张图片

参数介绍如下:

“row(int) - 单元格所在的行(从0开始)col(int) - 单元格所在的列(从0开始)image(string) - 图片文件名(含路径)options(dict) - 可选的图片位置,缩放,url参数”

同时

insert_image()

方法接受字典形式的可选参数来定位和缩放图片。默认值为

{'x_offset': 0, #以像素为单位,可以大于每个单元格的宽度和高度 'y_offset': 0, 'x_scale': 1, 'y_scale': 1, 'url': None, 'tip': None, 'image_data': None, 'positioning': None,}

上面几个参数主要作用如下:

“x_scale和y_scale参数可以用于水平及垂直的缩放图片。url参数可以为图片添加超链接/url,tip参数为含有超链接的图片提供可选的鼠标悬停时的提示信息image_data参数用于在io.BytesIO中添加内存中的字节流,一般不用positioning参数可以用来控制图片对象的位置”

接下来会做一个简单的程序来演示:

这里用一份数据简单的画出一个折线图,数据是一份广汇汽车的股票数据,从8月底到10月底的数据。以收盘价和时间画一个简单的折线图.

代码如下:

import pandas as pdimport matplotlib.pyplot as pltimport matplotlib.style as pslimport xlsxwriterfig = plt.figure()df = pd.read_excel(r'D:\数据.xlsx')title = ['日期','收盘价']df = df[title]plt.plot(df['日期'],df['收盘价'])plt.gcf().autofmt_xdate()#自动调整角度plt.savefig(r'D:\数据折线图.jpg')

Python画出的图如下:

现在我们要将其插入到一份名为

数据image.xlsx

的excel文件中,来看看代码怎么写

首先使用

xlswriter

创建一个新Excel文件并添加一个工作表。

workbook = xlsxwriter.Workbook(r'D:\数据images.xlsx')worksheet = workbook.add_worksheet()

下面使用

.insert_image

插入图片。

worksheet.write('A2', '插入第一张图片:')worksheet.insert_image('B2', r'D:\数据折线图.jpg')worksheet.write('A12', '插入第二张即位偏移图片:')worksheet.insert_image('B12', r'D:\数据折线图.jpg', {'x_offset': 15, 'y_offset': 10})# 插入一张缩放了的图片。worksheet.write('A23', '插入第三张缩放了的图片:')worksheet.insert_image('B23', r'D:\数据折线图.jpg', {'x_scale': 0.5, 'y_scale': 0.5})workbook.close()

最后要注意一定要用

workbook.close()

才能生成,效果呈现如下

可以看到,我们使用Matplotlib生成的折线图被插入到我们预定的指定位置中!

至此,本文就结束了,相信你已经学会如何使用Python与Excel图片之间的交互,并能够结合具体的需求进行批量操作!

怎么用python读取excel图_如何用Python读取Excel中图片?相关推荐

  1. python代码做图_如何用Python代码制作图

    Python是一种跨平台的计算机程序设计语言.是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的.大型项目的开发. 图是一 ...

  2. python k线图_如何用python画K线图(成交量+MACD+KDJ)

    最近一直在研究股票的形态,一些量化的东西,虽然量化听起来很高大上,通寻找到一个策略,通过程序的手段去找到这样一批股票,避免了人为的因素在其中.这样有个问题就是,程序选出来的股票太机械了,某个参数或条件 ...

  3. 用python处理excel表格_如何用python处理excel数据 | 用python处理excel表格数据类型

    python 读取EXCEL文件中的数据格式 扩展库 xlrd 读excle xlwt 写excle 直上搜就能下载 下载后使用 import xlrd 就可以读excle了 打开文件: xls = ...

  4. python打开excel表_如何用python打开excel

    最近看到好几次群里有人问xlwt.wlrd的问题,怎么说呢,如果是office2007刚出来,大家用xlsx文件用不习惯,还可以理解,这都10年过去了喂,就算没有进化到office2016,还在用of ...

  5. python word模板 图_科学网—Python绘制可插入Word的高清矢量图(SVG转EMF) - 任晓东的博文...

    Python具有强大的绘图功能.在科学论文中通常需要矢量图,而且如果能方便的插入到word中更好.Python中自带的绘图库matplotlib可以将图保存成svg格式,但是我通常喜欢使用emf的矢量 ...

  6. python画矢量图_科学网—Python绘制可插入Word的高清矢量图(SVG转EMF) - 任晓东的博文...

    Python具有强大的绘图功能.在科学论文中通常需要矢量图,而且如果能方便的插入到word中更好.Python中自带的绘图库matplotlib可以将图保存成svg格式,但是我通常喜欢使用emf的矢量 ...

  7. python怎么导出数据_如何用python将数据导出

    Python的一大应用就是数据分析了,而数据分析中,经常碰到需要处理Excel数据的情况.这里做一个Python处理Excel数据的总结,基 本受用大部分情况.相信以后用Python处理Excel数据 ...

  8. python 登陆淘宝_如何用 Python 自动登录淘宝并保存登录信息?

    原标题:如何用 Python 自动登录淘宝并保存登录信息? 作者 | 猪哥 责编 | 伍杏玲 前段时间时间为大家讲解了如何使用requests库模拟登录淘宝,而今天我们将对该功能进行丰富.所以我们把之 ...

  9. python 矩阵运算 for循环_如何用 Python 科学计算中的矩阵替代循环

    展开全部 因为在Mathematica中使用循环确实是低效的.32313133353236313431303231363533e78988e69d8331333361313961..... 深层次的原 ...

最新文章

  1. Tether销毁5亿USDT;BCH将于11月15日硬分叉,SV-Pool已向普通矿工开放
  2. OpenCV计算机视觉编程攻略之用色调、饱和度和亮度表示颜色
  3. oracle数据库缓存 c,Oracle 19c数据库体系结构-2
  4. ModbusPoll及ModbusSlave安装及使用指南
  5. 数据分析实战-PUBG数据集EDA
  6. 玩 vmx ( by vision.ai ) 的过程记录
  7. 北上广深杭程序员买房姿势图鉴
  8. 汇编语言 第一单元 整理(补充)
  9. c++ string
  10. 设置pyspark 启动时所使用的python版本
  11. 中缀表达式、前缀表达式、后缀表达式
  12. Android+FFmpeg音视频学习笔记
  13. 图解设计模式:空对象模式
  14. 如何修改ssh端口号
  15. C语言编程基础— 一维数组 (编程实现从键盘输入20个整数,统计非负数个数,并计算非负数之和。)
  16. linux 服务 ddns,Linux DDNS配置
  17. 可汗学院公开课: 统计学_1 统计学基本知识、二项及泊松分布
  18. 可验证随机函数VRF
  19. nexus上传jar总是读条而上传不成功的问题
  20. 【ZJOI2017】仙人掌 题解

热门文章

  1. BeyondCompare4使用脚本,每月一次
  2. 星号下三角形python答案_Python利用for循环打印星号三角形的案例
  3. Ceph之RBD恢复的几种方式与原理
  4. STA series --- 6 .Crosstalk and Noise
  5. 用Python+小程序实现诗词大会的飞花令 !
  6. 高性能服务器架构(High-Performance Server Architecture)
  7. 恋人日记服务器维护中,知乐日记:恋人不会在最终相遇 因为他们本来就一直在一起...
  8. 特殊符号,emoji表情,四字节去除问题
  9. 基于MATLAB-GUI数字图像的水果边缘检测
  10. notability整理归档_ipad记手写笔记软件 Notability的使用方法图解教程