通过apose进行pdf文字内容替换

import com.aspose.pdf.*;
import java.io.InputStream;

public class ChangePDF {
private static String srcPath = "E:\\demo\\TNBZQSC01.pdf"; // 源文件路径
private static String targetPath = "E:\\\\demo\\\\TNBZQSC01_2.pdf"; // 输入文件路径

private static String srcText = "ABCDEFGHIJKLNMOPQRSTUVWXYZ"; // 需要替换的文本TNBBFZ.pdf / TNBZQSC.pdf
//private static String targetText = " 糖尿病早期风险评估报告 "; // 替换的目标文本,糖尿病并发症 / 糖尿病早期筛查
private static String targetText = " 糖尿病并发症风险评估报告 ";
public static void main(String[] args) {
InputStream license = ChangePDF.class.getClassLoader().getResourceAsStream("\\license.xml");
try {
new License().setLicense(license);
} catch (Exception e) {
e.printStackTrace();
}

Document pdfDoc = new Document(srcPath);
TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber(srcText);
PageCollection pages = pdfDoc.getPages();
System.out.println("文档总页码数：" + pages.size());
pages.accept(textFragmentAbsorber);
int i = 0;
for (TextFragment textFragment : (Iterable<TextFragment>)textFragmentAbsorber.getTextFragments()) {
textFragment.setText(targetText);
//textFragment.getTextState().setBackgroundColor(com.aspose.pdf.Color.getRed()); // 添加红色背景
System.out.println(++i);
}
pdfDoc.save(targetPath);
System.out.println("总共替换" + i + "处");
System.out.println("OK");
}

}

注意：license.xml需要放在根目录下（src或者resources）

licenes.xml内容如下：

<License>
<Data>
<Products>
<Product>Aspose.Total for Java</Product>
<Product>Aspose.Pdf for Java</Product>
</Products>
<EditionType>Enterprise</EditionType>
<SubscriptionExpiry>20991231</SubscriptionExpiry>
<LicenseExpiry>20991231</LicenseExpiry>
<SerialNumber>8bfe198c-7f0c-4ef8-8ff0-acc3237bf0d7</SerialNumber>
</Data>
<Signature>sNLLKGMUdF0r8O1kKilWAGdgfs2BvJb/2Xp8p5iuDVfZXmhppo+d0Ran1P9TKdjV4ABwAgKXxJ3jcQTqE/2IRfqwnPf8itN8aFZlV3TJPYeD3yWE7IT55Gz6EijUpC7aKeoohTb4w2fpox58wWoF3SNp6sK6jDfiAUGEHYJ9pjU=</Signature>
</License>

通过apose进行pdf文字内容替换相关推荐

python程序30行_Python30行代码实现对pdf文字内容的提取
网上有各种软件处理pdf,但是这些软件在处理pdf的效果上并不是尽如人意,本人利用Python的一个库 PyPDF2实现了对pdf文字内容的提取,至于图片提取日后再说,废话不多说,直接上代码: fro ...
Java识别PDF文字内容的方法
方法一:PDFBox (一个BSD许可下的源码开放项目)是一个为开发人员读取和创建PDF文档而准备的纯Java类库.它提供如下特性: 提取文本,包括Unicode字符.和Jakarta Lucene等 ...
php读取pdf文字内容
安装第三方库 composer require smalot/pdfparser 如果没有安装composer可以在GitHub下载下载地址https://github.com/smalot/pdf ...
Python实现文字内容替换
小明正在做语文作业,但她一个不注意,把"关羽"错写成"项羽"了.我们结合 for 循环和字符串方法,将 homework 中的项羽全部改正为关羽 . ho ...
python替换word中的文字内容
摘要:这篇文章介绍了如何使用python[3.6版本]把pdf文件转换为word文档并替换word文档中的文字内容,这里替换的规则是中英转换或者其它自定义规则 pdf转换为word pdf文件由于很难 ...
怎么在pdf上编辑文字内容
pdf文件是我们办公中很常见的一种文件格式,我们有时候会需要修改pdf文件里的内容,但并不是所有的小伙伴都知道应该如何修改.所以,今天给大家带来了几个pdf编辑文字内容的方法,小伙伴们可以根据自己的喜 ...
JAVA替换PDF文字
前言: 以下是通过网上查阅资料,东拼西凑实现的一个使用java替换pdf文字的功能.使用的是itextpdf.jar 参考: https://blog.csdn.net/sdizoea/article ...
flowable 中文文档_取出word文档文字内容生成加了目录、标号和页码的PDF文件
word文档内的一页: 将文本取出来,生成自定义格式的PDF文件: 从word取出文本时标题的标号和页码是取不出来的,要自己加.另外就是目录也要自己生成和添加: 代码和解释如下: from repor ...
怎么用迅捷PDF转换器在线为PDF文件添加文字内容
电子文档的广泛应用导致PDF格式文件成为办公中少不了的一部分,在日常工作中,我们经常需要在PDF文档中添加文字,例如签名.批注或补充说明等.那么如何才能快速在PDF文件添加文字内容?有什么文档编辑工具 ...

通过apose进行pdf文字内容替换

通过apose进行pdf文字内容替换相关推荐

最新文章

热门文章