情景:找了本电子书《PYTHON面向对象编程指南 [(美)STEVEN F.LOTT著;张心韬,兰亮译][人民邮电出版.pdf》想要啃一下,

发现电子书里字是灰色的,看起来累眼睛,重新找没有找到更清晰的版本,决定自己修改字体颜色。

1. 首先想要直接用Adobe Acrobat DC直接修改颜色,但这个软件的处理是先识别文字,后更改颜色,速度比较。

2. 电子书不是彩色的,就两种颜色,灰色和白色,所以想到了把所有的灰色改为黑色,百度了一下发现像素值这个东西:0为黑色,256为白色。用Adobe Acrobat DC将PDF转为.jpg图片,直接操作图片,再将图片合并为PDF。

转换成图片就不说了,用Adobe Acrobat DC将PDF导出为图片即可,以下是Python转换代码:

import os
from PIL import Image
dirs = input('请输入文件路径:')
filenames = os.listdir(dirs)
boundary_value = 230        #设置色素边界值,可以试几次,找到合适值,如果这个值太大,字体会有黑色阴影
for filename in filenames:
  image = Image.open(dirs+"\\"+ filename)
  photo = image.convert('L')    #将彩色图像转换为灰度(模式 L),P为调色板模式
 
photo.save(dirs+"\\"+ filename)
  list = []
  for i in range(256):
    if i < boundary_value:      #如果图片中某个像素点的像素小于边界值,设置为黑色
     
list.append(0)
    else:
      list.append(1)            #大于边界值,设置为白色
 
 
photo_new = photo.point(list,'1')        #将list[]的像素值映射到图像中,形成新的图片
 
photo_new.save(dirs+"\\"+ filename)

备注:解释photo.point()

此处的’1‘如果不写,和源图片的convert(mode)的mode一致,灰度转换中为L,则无亮度波动,全黑。转换灰度(“ L”)或“ RGB”的默认方法图像转换为双层图像(模式“ 1”)使用Floyd-Steinberg抖动以近似原始图像的亮度水平。如果抖动为“无”,所有大于128的值均设置为255(白色),所有其他值都设为0(黑色)。要使用其他阈值,请使用   #PIL.Image.Image.point`方法。

转换之后的图片:

最后利用Adobe Acrobat DC,创建--将文件合并为单个PDF--全选图片--合并--另存为,即可

用Python对PDF文字颜色加深相关推荐

  1. python 生成pdf 文字和图片_Python系列—PDF文本与图片抽取

    PDF是人们日常使用最多的跨平台文档.其是一种用独立于应用程序.硬件.操作系统的方式呈现文档的文件格式.每个PDF文件包含固定布局的平面文档的完整描述,包括文本.字形.图形及其他需要显示的信息.具有良 ...

  2. python提取pdf文字,python 提取pdf文字

    安装pdfminer 库 windows 下安装pdfminer3k pip install pdfminer3k Liunx 下安装pdfminer pip install pdfminer 代码 ...

  3. python提取pdf文字_python基于pdfminer库提取pdf文字代码实例

    安装pdfminer 库 windows 下安装pdfminer3k pip install pdfminer3k Liunx 下安装pdfminer pip install pdfminer 代码 ...

  4. python识别pdf文字_Python 神工具包!翻译、文字识别、语音转文字统统搞定

    今天给大家介绍一款 Python 制作的实用工具包,包含多种功能: 音频转文字 文字转语音 截图 OCR文字识别 复制翻译 举个例子,比如截图 OCR 文字识别就有很多实用场景. 常会遇到有些 PDF ...

  5. python+opencv实现文字颜色识别与标定

    最近接了一个比较简单的图像处理的单子,花了一点时间随便写了一下: 数据集客户没有是自己随便创建的: 程序如下: """Code creation time:Septemb ...

  6. Adobe Acrobat DC 扫描图片 文字颜色加深

    Adobe Acrobat DC版本"工具"→"印刷制作"→"转换颜色" 只需把"转换配置文件"改为"Dot ...

  7. Python自动化办公系列之Python操作PDF

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 输 作者介绍: 大家可以叫我黄同学(博客名:Huang Supre ...

  8. nsga2代码解读python_python自动化办公系列 | python操作pdf—— PyPDF2 和 pdfplumber模块(1)...

    看了好多代码,目前为止都是散乱的分享,接下来将整理作为专题,进行系统化的一个分享整理,也是我自己学习的过程.第一个的系统化的分享专题--python办公自动化.代码后面的#所表示的是注释,对本行代码进 ...

  9. python自动化pdf报告_[Python] 自动化办公 PDF提取文字、表格、图片

    转载请注明:陈熹 chenx6542@foxmail.com (简书号:半为花间酒) 若公众号内转载请联系公众号:早起Python 本例可以学到的知识点: 使用 pdfplumber 提取 PDF 中 ...

  10. pdf exe如何提取pdf文件_python应用:如何用python提取pdf文件中的文字

    从pdf中提取文字,相信很多人都干过这事,怎么在python中实现呢,今天带大家看看. 第一步导入库 import PyPDF2 第二步导入pdf文件 pdf_file =open('dataset/ ...

最新文章

  1. c语言编程学生管理系统的代码,C语言学生管理系统源代码.doc
  2. PHP算法向数组的头插入带键的元素
  3. Android常用开源框架
  4. 华为手机安装系统能换鸿蒙,华为鸿蒙将全面上线,安卓系统或将被彻底替换
  5. html5 密码框明文,elementUI的密码框的密文和明文
  6. 新年春节海报素材精品,再也不怕老板催稿!
  7. 马来西亚 IT 决策者正转向开源来最大化 IT 功能
  8. python 的基础 学习 第四天 基础数据类型
  9. MFC格式转换 UTF8 ANSI UNICODE
  10. linux c语言 修改mac地址,C语言根据MAC地址查找网卡并修改IP地址
  11. 3d游戏设计读书笔记三
  12. 斩断***黑手:如何使用IceSword冰刃
  13. python独立样本t检验 图_SPSS实操两个独立样本均数比较的t检验
  14. Ubuntu 分区挂载后无权限
  15. HDU 2370 Convert Kilometers to Miles
  16. 毕业五年后,我决定再去读个名校计算机硕士学位
  17. SQL数据库根据指定字段去重
  18. 线性二次型调节器LQR/LQC算法解析及求解器代码(matlab)
  19. Opencv+Zbar二维码识别(标准条形码/二维码识别)
  20. .3000米长的绳子,每天减一半。问多少天这个绳子会小于5米?不考虑小数。

热门文章

  1. matlab 仿真短路故障设置,基于MatlabSimulink的电力系统故障仿真与
  2. GoLang基础知识(1)
  3. IDEA2017.2汉化
  4. bandzip屏蔽广告
  5. MATLAB立体椭球,matlab拟合三维椭球
  6. 【神经网络】一文带你轻松解析神经网络(附实例恶搞女友)
  7. linux如何禁用独立显卡驱动,Ubuntu中独立显卡不好用如何关闭独立显卡
  8. 光纤跳线接口_光纤认证测试——光纤跳线设置基准(一跳线法)
  9. matlab 深度网络,深度信念网络matlab代码
  10. 括号匹配(POJ2955)题解