用Python对PDF文字颜色加深
情景:找了本电子书《PYTHON面向对象编程指南 [(美)STEVEN F.LOTT著;张心韬,兰亮译][人民邮电出版.pdf》想要啃一下,
发现电子书里字是灰色的,看起来累眼睛,重新找没有找到更清晰的版本,决定自己修改字体颜色。
1. 首先想要直接用Adobe Acrobat DC直接修改颜色,但这个软件的处理是先识别文字,后更改颜色,速度比较。
2. 电子书不是彩色的,就两种颜色,灰色和白色,所以想到了把所有的灰色改为黑色,百度了一下发现像素值这个东西:0为黑色,256为白色。用Adobe Acrobat DC将PDF转为.jpg图片,直接操作图片,再将图片合并为PDF。
转换成图片就不说了,用Adobe Acrobat DC将PDF导出为图片即可,以下是Python转换代码:
import os
from PIL import Image
dirs = input('请输入文件路径:')
filenames = os.listdir(dirs)
boundary_value = 230 #设置色素边界值,可以试几次,找到合适值,如果这个值太大,字体会有黑色阴影
for filename in filenames:
image = Image.open(dirs+"\\"+ filename)
photo = image.convert('L') #将彩色图像转换为灰度(模式“ L”),P为调色板模式
photo.save(dirs+"\\"+ filename)
list = []
for i in range(256):
if i < boundary_value: #如果图片中某个像素点的像素小于边界值,设置为黑色
list.append(0)
else:
list.append(1) #大于边界值,设置为白色
photo_new = photo.point(list,'1') #将list[]的像素值映射到图像中,形成新的图片
photo_new.save(dirs+"\\"+ filename)
备注:解释photo.point()
此处的’1‘如果不写,和源图片的convert(mode)的mode一致,灰度转换中为L,则无亮度波动,全黑。转换灰度(“ L”)或“ RGB”的默认方法图像转换为双层图像(模式“ 1”)使用Floyd-Steinberg抖动以近似原始图像的亮度水平。如果抖动为“无”,所有大于128的值均设置为255(白色),所有其他值都设为0(黑色)。要使用其他阈值,请使用 #PIL.Image.Image.point`方法。
转换之后的图片:
最后利用Adobe Acrobat DC,创建--将文件合并为单个PDF--全选图片--合并--另存为,即可
用Python对PDF文字颜色加深相关推荐
- python 生成pdf 文字和图片_Python系列—PDF文本与图片抽取
PDF是人们日常使用最多的跨平台文档.其是一种用独立于应用程序.硬件.操作系统的方式呈现文档的文件格式.每个PDF文件包含固定布局的平面文档的完整描述,包括文本.字形.图形及其他需要显示的信息.具有良 ...
- python提取pdf文字,python 提取pdf文字
安装pdfminer 库 windows 下安装pdfminer3k pip install pdfminer3k Liunx 下安装pdfminer pip install pdfminer 代码 ...
- python提取pdf文字_python基于pdfminer库提取pdf文字代码实例
安装pdfminer 库 windows 下安装pdfminer3k pip install pdfminer3k Liunx 下安装pdfminer pip install pdfminer 代码 ...
- python识别pdf文字_Python 神工具包!翻译、文字识别、语音转文字统统搞定
今天给大家介绍一款 Python 制作的实用工具包,包含多种功能: 音频转文字 文字转语音 截图 OCR文字识别 复制翻译 举个例子,比如截图 OCR 文字识别就有很多实用场景. 常会遇到有些 PDF ...
- python+opencv实现文字颜色识别与标定
最近接了一个比较简单的图像处理的单子,花了一点时间随便写了一下: 数据集客户没有是自己随便创建的: 程序如下: """Code creation time:Septemb ...
- Adobe Acrobat DC 扫描图片 文字颜色加深
Adobe Acrobat DC版本"工具"→"印刷制作"→"转换颜色" 只需把"转换配置文件"改为"Dot ...
- Python自动化办公系列之Python操作PDF
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 输 作者介绍: 大家可以叫我黄同学(博客名:Huang Supre ...
- nsga2代码解读python_python自动化办公系列 | python操作pdf—— PyPDF2 和 pdfplumber模块(1)...
看了好多代码,目前为止都是散乱的分享,接下来将整理作为专题,进行系统化的一个分享整理,也是我自己学习的过程.第一个的系统化的分享专题--python办公自动化.代码后面的#所表示的是注释,对本行代码进 ...
- python自动化pdf报告_[Python] 自动化办公 PDF提取文字、表格、图片
转载请注明:陈熹 chenx6542@foxmail.com (简书号:半为花间酒) 若公众号内转载请联系公众号:早起Python 本例可以学到的知识点: 使用 pdfplumber 提取 PDF 中 ...
- pdf exe如何提取pdf文件_python应用:如何用python提取pdf文件中的文字
从pdf中提取文字,相信很多人都干过这事,怎么在python中实现呢,今天带大家看看. 第一步导入库 import PyPDF2 第二步导入pdf文件 pdf_file =open('dataset/ ...
最新文章
- c语言编程学生管理系统的代码,C语言学生管理系统源代码.doc
- PHP算法向数组的头插入带键的元素
- Android常用开源框架
- 华为手机安装系统能换鸿蒙,华为鸿蒙将全面上线,安卓系统或将被彻底替换
- html5 密码框明文,elementUI的密码框的密文和明文
- 新年春节海报素材精品,再也不怕老板催稿!
- 马来西亚 IT 决策者正转向开源来最大化 IT 功能
- python 的基础 学习 第四天 基础数据类型
- MFC格式转换 UTF8 ANSI UNICODE
- linux c语言 修改mac地址,C语言根据MAC地址查找网卡并修改IP地址
- 3d游戏设计读书笔记三
- 斩断***黑手:如何使用IceSword冰刃
- python独立样本t检验 图_SPSS实操两个独立样本均数比较的t检验
- Ubuntu 分区挂载后无权限
- HDU 2370 Convert Kilometers to Miles
- 毕业五年后,我决定再去读个名校计算机硕士学位
- SQL数据库根据指定字段去重
- 线性二次型调节器LQR/LQC算法解析及求解器代码(matlab)
- Opencv+Zbar二维码识别(标准条形码/二维码识别)
- .3000米长的绳子,每天减一半。问多少天这个绳子会小于5米?不考虑小数。