通过apose进行pdf文字内容替换
import com.aspose.pdf.*;
import java.io.InputStream;
public class ChangePDF {
private static String srcPath = "E:\\demo\\TNBZQSC01.pdf"; // 源文件路径
private static String targetPath = "E:\\\\demo\\\\TNBZQSC01_2.pdf"; // 输入文件路径
private static String srcText = "ABCDEFGHIJKLNMOPQRSTUVWXYZ"; // 需要替换的文本TNBBFZ.pdf / TNBZQSC.pdf
//private static String targetText = " 糖尿病早期风险评估报告 "; // 替换的目标文本,糖尿病并发症 / 糖尿病早期筛查
private static String targetText = " 糖尿病并发症风险评估报告 ";
public static void main(String[] args) {
InputStream license = ChangePDF.class.getClassLoader().getResourceAsStream("\\license.xml");
try {
new License().setLicense(license);
} catch (Exception e) {
e.printStackTrace();
}
Document pdfDoc = new Document(srcPath);
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber(srcText);
PageCollection pages = pdfDoc.getPages();
System.out.println("文档总页码数:" + pages.size());
pages.accept(textFragmentAbsorber);
int i = 0;
for (TextFragment textFragment : (Iterable<TextFragment>)textFragmentAbsorber.getTextFragments()) {
textFragment.setText(targetText);
//textFragment.getTextState().setBackgroundColor(com.aspose.pdf.Color.getRed()); // 添加红色背景
System.out.println(++i);
}
pdfDoc.save(targetPath);
System.out.println("总共替换" + i + "处");
System.out.println("OK");
}
}
注意:license.xml需要放在根目录下(src或者resources)
licenes.xml内容如下:
<License>
<Data>
<Products>
<Product>Aspose.Total for Java</Product>
<Product>Aspose.Pdf for Java</Product>
</Products>
<EditionType>Enterprise</EditionType>
<SubscriptionExpiry>20991231</SubscriptionExpiry>
<LicenseExpiry>20991231</LicenseExpiry>
<SerialNumber>8bfe198c-7f0c-4ef8-8ff0-acc3237bf0d7</SerialNumber>
</Data>
<Signature>sNLLKGMUdF0r8O1kKilWAGdgfs2BvJb/2Xp8p5iuDVfZXmhppo+d0Ran1P9TKdjV4ABwAgKXxJ3jcQTqE/2IRfqwnPf8itN8aFZlV3TJPYeD3yWE7IT55Gz6EijUpC7aKeoohTb4w2fpox58wWoF3SNp6sK6jDfiAUGEHYJ9pjU=</Signature>
</License>
通过apose进行pdf文字内容替换相关推荐
- python程序30行_Python30行代码实现对pdf文字内容的提取
网上有各种软件处理pdf,但是这些软件在处理pdf的效果上并不是尽如人意,本人利用Python的一个库 PyPDF2实现了对pdf文字内容的提取,至于图片提取日后再说,废话不多说,直接上代码: fro ...
- Java识别PDF文字内容的方法
方法一:PDFBox (一个BSD许可下的源码开放项目)是一个为开发人员读取和创建PDF文档而准备的纯Java类库.它提供如下特性: 提取文本,包括Unicode字符.和Jakarta Lucene等 ...
- php读取pdf文字内容
安装第三方库 composer require smalot/pdfparser 如果没有安装composer可以在GitHub下载 下载地址https://github.com/smalot/pdf ...
- Python实现文字内容替换
小明正在做语文作业,但她一个不注意,把"关羽"错写成"项羽"了.我们结合 for 循环和字符串方法,将 homework 中的 项羽 全部改正为 关羽 . ho ...
- python替换word中的文字内容
摘要:这篇文章介绍了如何使用python[3.6版本]把pdf文件转换为word文档并替换word文档中的文字内容,这里替换的规则是中英转换或者其它自定义规则 pdf转换为word pdf文件由于很难 ...
- 怎么在pdf上编辑文字内容
pdf文件是我们办公中很常见的一种文件格式,我们有时候会需要修改pdf文件里的内容,但并不是所有的小伙伴都知道应该如何修改.所以,今天给大家带来了几个pdf编辑文字内容的方法,小伙伴们可以根据自己的喜 ...
- JAVA替换PDF文字
前言: 以下是通过网上查阅资料,东拼西凑实现的一个使用java替换pdf文字的功能.使用的是itextpdf.jar 参考: https://blog.csdn.net/sdizoea/article ...
- flowable 中文文档_取出word文档文字内容生成加了目录、标号和页码的PDF文件
word文档内的一页: 将文本取出来,生成自定义格式的PDF文件: 从word取出文本时标题的标号和页码是取不出来的,要自己加.另外就是目录也要自己生成和添加: 代码和解释如下: from repor ...
- 怎么用迅捷PDF转换器在线为PDF文件添加文字内容
电子文档的广泛应用导致PDF格式文件成为办公中少不了的一部分,在日常工作中,我们经常需要在PDF文档中添加文字,例如签名.批注或补充说明等.那么如何才能快速在PDF文件添加文字内容?有什么文档编辑工具 ...
最新文章
- 华为5G首席科学家童文 | 5G:万物连接平台 智能世界基石
- Aspose.Cells设置单元格格式
- react开发教程(十)redux结合react
- c 语言乘法代码,C++实现大数乘法算法代码
- Sersync实现触发式文件同步
- Ubuntu中安装和卸载apache2
- Adobe illustrator 调整对象大小 - 连载 11
- pb中建立人员信息表_根据部门名称,从Excel人员花名册表格中快速调取所有员工信息...
- 535. TinyURL 的加密与解密
- CCNA学习指南-----1-3章笔记
- 工业机器人电路图讲解话术_智能对话机器人系统及其实现智能对话的方法与流程...
- appfuse mysql_AppFuse 2.1的安装运行步骤
- 解决:Access denied for user ‘root‘@‘192.168.120.1‘ (using password: YES)
- B-JUI 实践 之 带搜索与编辑的Datagrid
- 下面程序段中带下划线的语句的执行次数的数量级是( )
- C语言可变参数问题(va_list,va_start,va_arg,va_end用法及定义)
- 我不小心删除了dwm.exe。就是桌面窗口管理器的那个程序哈哈
- APC计算机大赛,2019全国职业院校技能大赛计算机网络应用赛项题库C卷 2c.docx
- Vue 微商城项目(一)
- Windows Phone 7芒果更新
热门文章
- 生活需要仪式感,让你的生活更加丰富多彩
- 论ChatGPT的优势及劣势
- 计算机应用软件安装不了,win101903安装不了应用软件程序的解决方法 - 系统家园...
- 撤回(撤消)已发送的QQ和163 电子邮件
- word可以画神经网络图吗,怎么画神经网络结构图
- php现word公式保存为图片,word2007中使用mathtype输入公式保存后变成图片
- 计算机应用研究投稿后多久收到回信,SCI投稿后,如何答复审稿人的回信技巧总结...
- 18年上半年读书清单一览
- ime-mode:disabled是什么?
- Spring从0到1,彻底学会Spring思想