Apache PDFBox 库是一个开源、用于操作 PDF 文档的 Java 工具库。PDFBox 允许创建新的 PDF 文档、操作现有文档,以及从文档中提取内容。

获取 Apache PDFBox 下载地址,目前版本 2.0.25,核心 jar 是 pdfbox-2.0.25.jar,其他还有几个 jar 可以根据需要进行导入。

这里 jar包下载与源码学习可以下载全部的 jar 和一些命令行工具,下载 pdfbox-2.0.25-src.zip 源码可以看到文件夹 examples 里面有不少例子进行了示范。

所需jar包下载 无需积分
pdf实现图片与pdf互相转换以及pdf的拆分与合并
代码下载,如果懒得下载jar包的话
如果帮助到你了麻烦点个赞或收藏哦,会不断更新的

pdf转换为word

package pdfUtity;import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;import java.io.*;/*** @author: Serendipity* Date: 2022/3/17 10:58* Description:*/
public class pdfToWord {public static void main(String[] args) {try {//输入pdf的路径String pdfFile = "d://desktopfile//pdfs//1.pdf";//将pdf加载到对象中去PDDocument doc = PDDocument.load(new File(pdfFile));//得到pdf的页数int pagenumber = doc.getNumberOfPages();//设置转换后的名字
//            pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf("."));
//            String fileName = pdfFile + ".doc";String fileName="word.doc";File file = new File(fileName);if (!file.exists()) {file.createNewFile();}FileOutputStream fos = new FileOutputStream(fileName);//设置输出字符集为UTF-8 因此该word应该使用UTF-8格式打开 如果你出现乱码那么你可以自己修改一下这里的格式Writer writer = new OutputStreamWriter(fos, "UTF-8");PDFTextStripper stripper = new PDFTextStripper();stripper.setSortByPosition(true);// 排序stripper.setStartPage(1);// 设置转换的开始页stripper.setEndPage(pagenumber);// 设置转换的结束页stripper.writeText(doc, writer);writer.close();doc.close();System.out.println("pdf转换word成功!");} catch (IOException e) {e.printStackTrace();}}
}

通过Apache PDFBox将pdf转换为word相关推荐

  1. Ubuntu下Java使用pdfbox将pdf转换为图片的方法及问题

    Ubuntu下Java使用pdfbox将pdf转换为图片的方法及问题 使用pdfbox-2.0.3和fontbox-2.0.3,实现pdf转图片功能. 官方手册链接: http://pdfbox.ap ...

  2. pdf 加深 扫描件_为什么PDF文档不能像Word文档一样随便编辑?如何免费将PDF转换为Word?...

    PDF文档是一种非常难编辑的文档,有时候我们需要编辑或者复制PDF文档里面的内容,把PDF文档转换为Word就是我们最佳的选择.为什么PDF文档这么难编辑?我们怎么免费把PDF文档转换为Word文档? ...

  3. pdf转换为word问题

    pdf转换为word 用word打开,只是表面的转换 用网上在线工具转换才是深层次的转换

  4. 苹果手机怎么编辑word文档_原创首发:编辑和修改PDF文档,将PDF转换为WORD技巧...

    在之前的文章中介绍了如何将图片合成为PDF文档,今天将为大家介绍下如何编辑和修改PDF文档,以及将PDF转换为WORD的技巧. 使用到工具Adobe Acrobat 编辑和修改PDF 文档 方法1.使 ...

  5. pdf转换为word小工具,挺好

    这个工具不错啊,曾经我一直想找一个pdf转换为word的,但是一直不怎么合心意.感觉转换的格式都不是非常好,但是这个工具转换出来的东西和原来的pdf差点儿相同.是个好东西. 链接 下载链接 只是要注冊 ...

  6. 怎么把pdf格式转成word文档?如何将 PDF 转换为 Word

    怎么把pdf格式转成word文档?PDF是运用得很广泛地的办公文档,但是不能编辑,为了方便编辑,需要将PDF转换为word,那么,如何将 PDF 转换为 Word,下面,易我小编会讲解实用的pdf转w ...

  7. 在 Mac 上将 PDF 转换为 Word 的 5 种简单方法

    当谈到将PDF格式转换为Word格式时,用户可能会从互联网上搜索并尝试在线将PDF转换为Word.如果是这样,您可能会得到不好的结果并冒着文件本身的风险.在线 PDF 到 Word 转换器工具可能会产 ...

  8. 如何在 Mac 上将 PDF 转换为 Word [6 种免费方法]

    我们出于各种原因使用 PDF.我们可以将它们用于学校作业,以打印出谱,或离线阅读文章.我们经常想弄清楚如何在 Mac 上将 Word 文档另存为 PDF.但是,如果我们需要对 PDF 进行更改怎么办? ...

  9. 如何使用Python将PDF转换为Word文档?

    PDF是一种常用的文件格式,用于共享和打印文档.但是,在某些情况下,PDF 文件会转换为 Word DOCX或DOC格式以解析文本或使文档可编辑.对于此类场景,本文介绍了如何使用 Python 将 P ...

最新文章

  1. leetcode--括号生成--python
  2. SpringBoot+Mybatis+Swagger2环境搭建
  3. python导出csv不带引号的句子_不带双引号写入CSV文件
  4. PyQT4编程实例之小财务软件
  5. Linux DHCP原理与配置
  6. Batch Normalization的作用及原理
  7. Android小测验感受
  8. 关于安卓listview获得item中的控件问题
  9. vt linux tty中文,Linux输入子系统和tty关系影述
  10. 【渝粤教育】国家开放大学2019年春季 690化工原理及实验 参考试题
  11. 基于Pytorch版yolov5的滑块验证码破解思路
  12. CTF gopher协议
  13. 3d建模软件安装教程,游戏建模必备软件推荐(收藏)
  14. 互联网江湖“黑话”一览——狼厂、猫厂、鹅厂、狗厂……
  15. 传统运动物体检测方法的Python实现
  16. dubbo源码分析总结
  17. 基础版微信模板消息开发详解,附代码PHP
  18. 这篇能让你搞懂股票买卖系列问题
  19. 2021爱智先行者—数量遗传学 第一章 数量遗传学概论
  20. Docker多主机管理Docker Machine

热门文章

  1. 人工智能和神经网络区别,人工神经网络有哪几种
  2. 怎样下载土豆、六间房等视频网站的在线视频
  3. C++反射机制的实现
  4. STM32F1_HAL库用户使用手册UM1850
  5. 计算机屏幕自己动,电脑显示器老是自动调整怎么办
  6. mysql 公历变农历_SQLServer公历转农历函数(1900年-2049年)
  7. 研究生的压力应对与心理健康(雨课堂)研究生 全部答案
  8. mongodb和mysql中自动增长id_如何在java中维护MongoDB的_id字段的自动增长
  9. 安卓版讯飞配音生成的配音的位置的解决方法
  10. 白话自然语言处理(1)之概述