前言

咱们在工作中应该多多少少会遇到这样的情况,就算随便下载一两个表情包上面都带有水印,看起来很不舒服。更别说需要借鉴别人的文档或者图片,给自己的工作带了一丝便利了!今天就讲一下如何去除最简单,也是最常见的水印文档吧!

看一下原图

​​即上图中的①类水印,这种水印存在白色背景上的文档里,水印是灰色,需要保留的文字是黑色。

这种通常可以进行简单的亮度/对比度转换,直到水印消失并降低亮度以进行补偿[1]。参考别人的方法,我发现可以用多种方法去除水印。大致原理比较相似,下面先讲OpenCV的方法。

​​

OpenCV + Numpy

本方法需要使用的库:cv2、numpy。cv2是基于OpenCV的图像处理库,可以对图像进行腐蚀,膨胀等操作;Numpy这是一个强大的处理矩阵和维度运算的库。

函数简介

介绍一下cv2的三个基本函数:使用cv2.imread()cv2.imshow()cv2.imwrite()分别可以读取、显示和保存图像。

img = cv2.imread('test.png')cv2.imshow('test.png',img)
cv2.waitKey(0)cv2.imwrite('test_2.png', img)

对于Numpy呢,则要用到np.clip(),它是一个截取函数,用于截取数组中小于或者大于某值的部分,并使得被截取部分等于固定值。

np.clip(a, a_min, a_max, out=None):

具体用法:

可以看到,数组x中的所有数限定到范围0和5之间。为啥要介绍这些函数呢,接着往下看。

色彩转换

回到本文一开始,我们想去除文档图片中的水印。

​​

上图中我选取了三个点,这三个像素点分别对应背景白色、黑色字体以及灰色的水印。

我们现在要做的事,就是想办法把水印转换成白色背景。换言之,就是把图片中[217,217,217]的像素点转换成[255,255,255]。

当然这个[217,217,217]也不是固定的,只是一个范围。为了方便调整,我选取了一些像素点,做了一个线性回归。

希望把图片整体的像素颜色做一个改变,原有黑色字体尽量跟原来一致,而水印部分则一定要≥255,然后就可以通过np.clip()限定区间,使之都变成[255,255,255]。

​说干就干

import cv2
import numpy as npimg = cv2.imread('test.png')new = np.clip(1.4057577998008846*img-38.33089999653017, 0, 255).astype(np.uint8)cv2.imwrite('removed.png', new)

下面我们看看调整后的效果(左侧是转换前,右侧是转换后)。

处理效果还是不错的,说明对于这类文档图片水印,通过几行Python代码就可以轻松去除水印。

不过通过线性回归改变整体图片颜色,也会影响原有的黑色文本,导致其颜色发生了微微变化。

那我们能不能简单粗暴一点!只改变水印的颜色呢?

也可以试试。

PIL + itertools

PIL也是一个Python 图像处理库,其中Image模块是在Python PIL图像处理中常见的模块,对图像进行基础操作的功能基本都包含于此模块内。

itertools 之前更是被我们称为一个 零差评的 Python 内置库。其中itertools.product用来产生多个列表和迭代器的(积)。

还是跟之前一个原理,我们希望将图片中[217,217,217]的像素点转换成[255,255,255]。

那就简单粗暴一点,也就是像素值相加大概600(217+217+217)以上的像素点,都改成[255,255,255]就好了。

from itertools import product
from PIL import Imageimg = Image.open('test.png')
width, height = img.size
for pos in product(range(width), range(height)):if sum(img.getpixel(pos)[:3]) > 600:img.putpixel(pos, (255,255,255))
img.save('removed_1.png')

运行结果,对比一下。

与第一种方法对比,肉眼也没看出来太明显差别。

那大家就喜欢那种方法就用哪个吧!

还是非常的简单的,两种方法都有源代码,需要的话点这里:源码

文档,图片有水印很让人头痛!处理起来很麻烦?用Python三秒搞定!相关推荐

  1. Java为图片、PDF等文档添加自定义文字水印,亲测好用

    随着大数据时代的来临,数据安全逐渐被提上日程,今天我给大家分享的是Java中图片添加自定义水印.PDF.Word等文档添加自定义水印. 我这边不废话,直接上代码,粘贴到你的项目即可使用,若是缺少依赖引 ...

  2. python docx 合并文档 图片_不再为处理PDF烦恼,python处理操作PDF全攻略

    本篇聊下Python对pdf的各种操作,包含pdf转word,pdf转图片,pdf翻转,加密,加水印等. pdf转换word文档 保留格式 pdf转换为word文档,被大众经常使用的是纯Python库 ...

  3. python docx 合并文档 图片_python玩转pdf全攻略

    本篇说点轻松的,聊下Python对pdf的各种操作,包含pdf转word,pdf转图片等. pdf转换word文档 保留格式 pdf转换为word文档,被大众经常使用的是纯Python库pdfmine ...

  4. GUI实战|Python做一个文档图片提取软件

    大家好,本文将进一步讲解如何用Python提取PDF与Word中图片,并结合之前讲解过的GUI框架PysimpleGUI,做一个多文件图片提取软件,效果如下: 本文主要将分为以下部分讲解: PDF.W ...

  5. word加水印铺满java,Word 2010文档中让水印铺满整个页面的设置方法

    在Word 2010中,通过简单的鼠标单击即可为文档添加水印,但这样只能在每一个文档页面内添加一个水印,这个在前面的文章已经有所介绍,具体请见:Word文档添加内置水印.个性化图片及文字水印的方法,但 ...

  6. 怎么从扫描的PDF文档/图片里提取文字

    时间浪费在打字上可不好! 关于"怎么从扫描的PDF文档/图片里提取文字",我集思广益,得到如下结果: 首先是这里的一篇文章:http://hi.baidu.com/d_zzn047 ...

  7. 关于有道云笔记md文档图片不显示的解决方案

    关于有道云笔记md文档图片不显示的解决方案 1.存在问题 将Typora写好的文章(包含图片)在有道云文档中做备份,发现图片(图床上的图片)无法加载 2.思路与解决方案 将文章发表到CSDN或者掘金等 ...

  8. 如何评价文档图片的相似度

    背景介绍 给出一张文档材料,如何在一大堆的材料中做文档图片的比对呢? 给出这个问题的同时,我想到了各种图像相似度计算方法, 各种距离方法.然而,我忽略了文档图像的本质. 什么是文档图片 文档图片也就是 ...

  9. Typora编辑MD文档图片失效的问题解决

    Typora编辑MD文档图片失效的问题解决 Markdown是一款很流行的文档编辑器,可以用于文档总结,博客编辑等等.我使用了Typora来进行MD的编辑,当然VS CODE也可以,其他的软件也可以. ...

最新文章

  1. python【Pandas科学计算库】连女朋友都会用的Pandas(真の能看懂~!)
  2. VC2019 使用GDI+ 显示PNG图片
  3. SSM 框架 Maven项目整合实例
  4. 洛谷3224 【HAOI2012】永无乡(线段树合并)
  5. centos下cmake安装
  6. python 爬虫001-http请求过程
  7. waitpid最后以一个参数设为0_变频器用远传压力表控制恒压供水参数设置
  8. endnote 参考文献加序号_EndNote插入文献序号排序混乱怎么破 | 科研动力
  9. linux unison数据同步,linux下unison双向数据实时同步
  10. 2017-11-3 白银分析
  11. nginx中的sub_filter
  12. C语言消消乐游戏代码
  13. mysql order by empty_MySQL随笔一
  14. Hive面试题考点-整理
  15. ROS学习系列(一):ubuntu16.04下安装 ROS IDE RoboWare Studio 教程
  16. 无人洗车小程序源码开发
  17. 心电电路算法滤波_一种新型心电信号滤波电路的制作方法
  18. 关于Python choice() 函数介绍
  19. 计算机基础知识视频 银行考试,银行考试计算机基础知识试题及答案
  20. AC_AttitudeControl_Heli.cpp的AC_PosControl::set_dt函数代码分析

热门文章

  1. Delphi的原子世界
  2. office2010工具栏隐藏解决方法
  3. 安全的随想经典病毒和著名事件
  4. 22春天津大学《国际经济法学》在线作业一
  5. 将一组数组中具有相同的某个属性的项提取出来,组成新数组的一项
  6. RHSA系列压电水听器使用说明及注意事项
  7. JavaFX鼠标拖拽移动图片
  8. PhoneGap(Cordova)通过插件读取android配置信息
  9. Tower of Hay
  10. 基于频谱分析的倾斜干涉条纹的解调