通过Apache PDFBox将pdf转换为word
Apache PDFBox 库是一个开源、用于操作 PDF 文档的 Java 工具库。PDFBox 允许创建新的 PDF 文档、操作现有文档,以及从文档中提取内容。
获取 Apache PDFBox 下载地址,目前版本 2.0.25,核心 jar 是 pdfbox-2.0.25.jar,其他还有几个 jar 可以根据需要进行导入。
这里 jar包下载与源码学习可以下载全部的 jar 和一些命令行工具,下载 pdfbox-2.0.25-src.zip 源码可以看到文件夹 examples 里面有不少例子进行了示范。
所需jar包下载 无需积分
pdf实现图片与pdf互相转换以及pdf的拆分与合并
代码下载,如果懒得下载jar包的话
如果帮助到你了麻烦点个赞或收藏哦,会不断更新的
pdf转换为word
package pdfUtity;import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;import java.io.*;/*** @author: Serendipity* Date: 2022/3/17 10:58* Description:*/
public class pdfToWord {public static void main(String[] args) {try {//输入pdf的路径String pdfFile = "d://desktopfile//pdfs//1.pdf";//将pdf加载到对象中去PDDocument doc = PDDocument.load(new File(pdfFile));//得到pdf的页数int pagenumber = doc.getNumberOfPages();//设置转换后的名字
// pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf("."));
// String fileName = pdfFile + ".doc";String fileName="word.doc";File file = new File(fileName);if (!file.exists()) {file.createNewFile();}FileOutputStream fos = new FileOutputStream(fileName);//设置输出字符集为UTF-8 因此该word应该使用UTF-8格式打开 如果你出现乱码那么你可以自己修改一下这里的格式Writer writer = new OutputStreamWriter(fos, "UTF-8");PDFTextStripper stripper = new PDFTextStripper();stripper.setSortByPosition(true);// 排序stripper.setStartPage(1);// 设置转换的开始页stripper.setEndPage(pagenumber);// 设置转换的结束页stripper.writeText(doc, writer);writer.close();doc.close();System.out.println("pdf转换word成功!");} catch (IOException e) {e.printStackTrace();}}
}
通过Apache PDFBox将pdf转换为word相关推荐
- Ubuntu下Java使用pdfbox将pdf转换为图片的方法及问题
Ubuntu下Java使用pdfbox将pdf转换为图片的方法及问题 使用pdfbox-2.0.3和fontbox-2.0.3,实现pdf转图片功能. 官方手册链接: http://pdfbox.ap ...
- pdf 加深 扫描件_为什么PDF文档不能像Word文档一样随便编辑?如何免费将PDF转换为Word?...
PDF文档是一种非常难编辑的文档,有时候我们需要编辑或者复制PDF文档里面的内容,把PDF文档转换为Word就是我们最佳的选择.为什么PDF文档这么难编辑?我们怎么免费把PDF文档转换为Word文档? ...
- pdf转换为word问题
pdf转换为word 用word打开,只是表面的转换 用网上在线工具转换才是深层次的转换
- 苹果手机怎么编辑word文档_原创首发:编辑和修改PDF文档,将PDF转换为WORD技巧...
在之前的文章中介绍了如何将图片合成为PDF文档,今天将为大家介绍下如何编辑和修改PDF文档,以及将PDF转换为WORD的技巧. 使用到工具Adobe Acrobat 编辑和修改PDF 文档 方法1.使 ...
- pdf转换为word小工具,挺好
这个工具不错啊,曾经我一直想找一个pdf转换为word的,但是一直不怎么合心意.感觉转换的格式都不是非常好,但是这个工具转换出来的东西和原来的pdf差点儿相同.是个好东西. 链接 下载链接 只是要注冊 ...
- 怎么把pdf格式转成word文档?如何将 PDF 转换为 Word
怎么把pdf格式转成word文档?PDF是运用得很广泛地的办公文档,但是不能编辑,为了方便编辑,需要将PDF转换为word,那么,如何将 PDF 转换为 Word,下面,易我小编会讲解实用的pdf转w ...
- 在 Mac 上将 PDF 转换为 Word 的 5 种简单方法
当谈到将PDF格式转换为Word格式时,用户可能会从互联网上搜索并尝试在线将PDF转换为Word.如果是这样,您可能会得到不好的结果并冒着文件本身的风险.在线 PDF 到 Word 转换器工具可能会产 ...
- 如何在 Mac 上将 PDF 转换为 Word [6 种免费方法]
我们出于各种原因使用 PDF.我们可以将它们用于学校作业,以打印出谱,或离线阅读文章.我们经常想弄清楚如何在 Mac 上将 Word 文档另存为 PDF.但是,如果我们需要对 PDF 进行更改怎么办? ...
- 如何使用Python将PDF转换为Word文档?
PDF是一种常用的文件格式,用于共享和打印文档.但是,在某些情况下,PDF 文件会转换为 Word DOCX或DOC格式以解析文本或使文档可编辑.对于此类场景,本文介绍了如何使用 Python 将 P ...
最新文章
- leetcode--括号生成--python
- SpringBoot+Mybatis+Swagger2环境搭建
- python导出csv不带引号的句子_不带双引号写入CSV文件
- PyQT4编程实例之小财务软件
- Linux DHCP原理与配置
- Batch Normalization的作用及原理
- Android小测验感受
- 关于安卓listview获得item中的控件问题
- vt linux tty中文,Linux输入子系统和tty关系影述
- 【渝粤教育】国家开放大学2019年春季 690化工原理及实验 参考试题
- 基于Pytorch版yolov5的滑块验证码破解思路
- CTF gopher协议
- 3d建模软件安装教程,游戏建模必备软件推荐(收藏)
- 互联网江湖“黑话”一览——狼厂、猫厂、鹅厂、狗厂……
- 传统运动物体检测方法的Python实现
- dubbo源码分析总结
- 基础版微信模板消息开发详解,附代码PHP
- 这篇能让你搞懂股票买卖系列问题
- 2021爱智先行者—数量遗传学 第一章 数量遗传学概论
- Docker多主机管理Docker Machine
热门文章
- 人工智能和神经网络区别,人工神经网络有哪几种
- 怎样下载土豆、六间房等视频网站的在线视频
- C++反射机制的实现
- STM32F1_HAL库用户使用手册UM1850
- 计算机屏幕自己动,电脑显示器老是自动调整怎么办
- mysql 公历变农历_SQLServer公历转农历函数(1900年-2049年)
- 研究生的压力应对与心理健康(雨课堂)研究生 全部答案
- mongodb和mysql中自动增长id_如何在java中维护MongoDB的_id字段的自动增长
- 安卓版讯飞配音生成的配音的位置的解决方法
- 白话自然语言处理(1)之概述