import com.aspose.pdf.*;
import java.io.InputStream;

public class ChangePDF {
    private static String srcPath = "E:\\demo\\TNBZQSC01.pdf"; // 源文件路径
    private static String targetPath = "E:\\\\demo\\\\TNBZQSC01_2.pdf"; // 输入文件路径

private static String srcText = "ABCDEFGHIJKLNMOPQRSTUVWXYZ"; // 需要替换的文本TNBBFZ.pdf /  TNBZQSC.pdf
    //private static String targetText = "            糖尿病早期风险评估报告 "; // 替换的目标文本,糖尿病并发症 / 糖尿病早期筛查
    private static String targetText = "           糖尿病并发症风险评估报告 "; 
    public static void main(String[] args) {
        InputStream license = ChangePDF.class.getClassLoader().getResourceAsStream("\\license.xml");
        try {
            new License().setLicense(license);
        } catch (Exception e) {
            e.printStackTrace();
        }

Document pdfDoc = new Document(srcPath);
        TextFragmentAbsorber textFragmentAbsorber = new TextFragmentAbsorber(srcText);
        PageCollection pages = pdfDoc.getPages();
        System.out.println("文档总页码数:" + pages.size());
        pages.accept(textFragmentAbsorber);
        int i = 0;
        for (TextFragment textFragment : (Iterable<TextFragment>)textFragmentAbsorber.getTextFragments()) {
            textFragment.setText(targetText);
            //textFragment.getTextState().setBackgroundColor(com.aspose.pdf.Color.getRed()); // 添加红色背景
            System.out.println(++i);
        }
        pdfDoc.save(targetPath);
        System.out.println("总共替换" + i + "处");
        System.out.println("OK");
    }

}

注意:license.xml需要放在根目录下(src或者resources)

licenes.xml内容如下:

<License>
  <Data>
    <Products>
      <Product>Aspose.Total for Java</Product>
      <Product>Aspose.Pdf for Java</Product>
    </Products>
    <EditionType>Enterprise</EditionType>
    <SubscriptionExpiry>20991231</SubscriptionExpiry>
    <LicenseExpiry>20991231</LicenseExpiry>
    <SerialNumber>8bfe198c-7f0c-4ef8-8ff0-acc3237bf0d7</SerialNumber>
  </Data>
  <Signature>sNLLKGMUdF0r8O1kKilWAGdgfs2BvJb/2Xp8p5iuDVfZXmhppo+d0Ran1P9TKdjV4ABwAgKXxJ3jcQTqE/2IRfqwnPf8itN8aFZlV3TJPYeD3yWE7IT55Gz6EijUpC7aKeoohTb4w2fpox58wWoF3SNp6sK6jDfiAUGEHYJ9pjU=</Signature>
</License>

通过apose进行pdf文字内容替换相关推荐

  1. python程序30行_Python30行代码实现对pdf文字内容的提取

    网上有各种软件处理pdf,但是这些软件在处理pdf的效果上并不是尽如人意,本人利用Python的一个库 PyPDF2实现了对pdf文字内容的提取,至于图片提取日后再说,废话不多说,直接上代码: fro ...

  2. Java识别PDF文字内容的方法

    方法一:PDFBox (一个BSD许可下的源码开放项目)是一个为开发人员读取和创建PDF文档而准备的纯Java类库.它提供如下特性: 提取文本,包括Unicode字符.和Jakarta Lucene等 ...

  3. php读取pdf文字内容

    安装第三方库 composer require smalot/pdfparser 如果没有安装composer可以在GitHub下载 下载地址https://github.com/smalot/pdf ...

  4. Python实现文字内容替换

    小明正在做语文作业,但她一个不注意,把"关羽"错写成"项羽"了.我们结合 for 循环和字符串方法,将 homework 中的 项羽 全部改正为 关羽 . ho ...

  5. python替换word中的文字内容

    摘要:这篇文章介绍了如何使用python[3.6版本]把pdf文件转换为word文档并替换word文档中的文字内容,这里替换的规则是中英转换或者其它自定义规则 pdf转换为word pdf文件由于很难 ...

  6. 怎么在pdf上编辑文字内容

    pdf文件是我们办公中很常见的一种文件格式,我们有时候会需要修改pdf文件里的内容,但并不是所有的小伙伴都知道应该如何修改.所以,今天给大家带来了几个pdf编辑文字内容的方法,小伙伴们可以根据自己的喜 ...

  7. JAVA替换PDF文字

    前言: 以下是通过网上查阅资料,东拼西凑实现的一个使用java替换pdf文字的功能.使用的是itextpdf.jar 参考: https://blog.csdn.net/sdizoea/article ...

  8. flowable 中文文档_取出word文档文字内容生成加了目录、标号和页码的PDF文件

    word文档内的一页: 将文本取出来,生成自定义格式的PDF文件: 从word取出文本时标题的标号和页码是取不出来的,要自己加.另外就是目录也要自己生成和添加: 代码和解释如下: from repor ...

  9. 怎么用迅捷PDF转换器在线为PDF文件添加文字内容

    电子文档的广泛应用导致PDF格式文件成为办公中少不了的一部分,在日常工作中,我们经常需要在PDF文档中添加文字,例如签名.批注或补充说明等.那么如何才能快速在PDF文件添加文字内容?有什么文档编辑工具 ...

最新文章

  1. 华为5G首席科学家童文 | 5G:万物连接平台 智能世界基石
  2. Aspose.Cells设置单元格格式
  3. react开发教程(十)redux结合react
  4. c 语言乘法代码,C++实现大数乘法算法代码
  5. Sersync实现触发式文件同步
  6. Ubuntu中安装和卸载apache2
  7. Adobe illustrator 调整对象大小 - 连载 11
  8. pb中建立人员信息表_根据部门名称,从Excel人员花名册表格中快速调取所有员工信息...
  9. 535. TinyURL 的加密与解密
  10. CCNA学习指南-----1-3章笔记
  11. 工业机器人电路图讲解话术_智能对话机器人系统及其实现智能对话的方法与流程...
  12. appfuse mysql_AppFuse 2.1的安装运行步骤
  13. 解决:Access denied for user ‘root‘@‘192.168.120.1‘ (using password: YES)
  14. B-JUI 实践 之 带搜索与编辑的Datagrid
  15. 下面程序段中带下划线的语句的执行次数的数量级是( )
  16. C语言可变参数问题(va_list,va_start,va_arg,va_end用法及定义)
  17. 我不小心删除了dwm.exe。就是桌面窗口管理器的那个程序哈哈
  18. APC计算机大赛,2019全国职业院校技能大赛计算机网络应用赛项题库C卷 2c.docx
  19. Vue 微商城项目(一)
  20. Windows Phone 7芒果更新

热门文章

  1. 生活需要仪式感,让你的生活更加丰富多彩
  2. 论ChatGPT的优势及劣势
  3. 计算机应用软件安装不了,win101903安装不了应用软件程序的解决方法 - 系统家园...
  4. 撤回(撤消)已发送的QQ和163 电子邮件
  5. word可以画神经网络图吗,怎么画神经网络结构图
  6. php现word公式保存为图片,word2007中使用mathtype输入公式保存后变成图片
  7. 计算机应用研究投稿后多久收到回信,SCI投稿后,如何答复审稿人的回信技巧总结...
  8. 18年上半年读书清单一览
  9. ime-mode:disabled是什么?
  10. Spring从0到1,彻底学会Spring思想