Aspose.PDF for Java系列5-转化PDF文档为Word
Aspose.PDF for Java系列5-转化PDF文档
DocFormat枚举类提供了DOCX格式的文件输出格式选项。如果你想要将PDF转化为DOCX格式,请参考本文下面的内容。
PDF转化为DOCX
步骤:
- 创建一个加载了PDF文档的Document对象。
- 使用Document.save()方法转化成SaveFormat.DocX格式。
具体代码如下:
public static void ConvertPDFtoWord_DOCX_Format() {// Open the source PDF documentDocument pdfDocument = new Document(_dataDir + "PDFToDOC.pdf");// Save the resultant DOC filepdfDocument.save(_dataDir + "saveOptionsOutput_out.doc", SaveFormat.DocX);}
DocSaveOptions类有个Format属性,它提供了文档格式(DOC、DOCX)的功能。要将PDF转化成为DOCX格式,需要设置DocSaveOptions为DocFormat.DOCX.
具体代码如下:
public static void ConvertPDFtoWord_Advanced_DOCX_Format(){ // Open the source PDF documentDocument pdfDocument = new Document(_dataDir + "PDFToDOC.pdf");// Instantiate DocSaveOptions objectDocSaveOptions saveOptions = new DocSaveOptions();// Specify the output format as DOCXsaveOptions.setFormat(DocSaveOptions.DocFormat.DocX);// Set other DocSaveOptions params// ....// Save document in docx formatpdfDocument.save("ConvertToDOCX_out.docx", saveOptions);}
PDF转化为DOC
步骤:
- 创建一个加载了PDF文档的Document对象。
- 使用Document.save()方法转化成SaveFormat.Doc格式。
代码如下:
public static void main(String[] args) throws IOException {ConvertPDFtoWord();ConvertPDFtoWordDocAdvanced();}public static void ConvertPDFtoWord() {// Open the source PDF documentDocument pdfDocument = new Document(_dataDir + "PDFToDOC.pdf");// Save the file into MS document formatpdfDocument.save(_dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);}
使用DocSaveOptions进行转化
public static void ConvertPDFtoWordDocAdvanced(){Path pdfFile = Paths.get(_dataDir.toString(), "PDF-to-DOC.pdf");Path docFile = Paths.get(_dataDir.toString(), "PDF-to-DOC.doc");Document pdfDocument = new Document(pdfFile.toString()); DocSaveOptions saveOptions = new DocSaveOptions();// Specify the output format as DOCsaveOptions.setFormat(DocSaveOptions.DocFormat.Doc);// Set the recognition mode as FlowsaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);// Set the Horizontal proximity as 2.5saveOptions.setRelativeHorizontalProximity(2.5f);// Enable the value to recognize bullets during conversion processsaveOptions.setRecognizeBullets(true);pdfDocument.save(docFile.toString(), saveOptions);}
关于DocSaveOptions类
DocSaveOptions类提供了许多属性,方便设置将PDF转化为DOC格式的过程。可以通过设置Mode属性来指定PDF内容识别模式,Mode的取值来自RecognitionMode枚举类。
- Textbox mode是最快速的,但是转化完成的DOC文档编辑性较差。原本的PDF文档中每个都被视为文本块进行了转化。这样可以最大程序保持原本PDF文档的样子,输出的文档高度相似,唯一不好的就是编辑起来比较麻烦。
- Flow mode模式引擎执行分组和多级分析,尽量还原PDF文档,但是易于编辑。
- RelativeHorizontalProximity属性可用于控制文本元素之间的相对接近度(字间距、字体大小)。指定字体大小的相似百分比。
- RecognitionBullets用来设置转化过程的快速识别。
Aspose.PDF for Java系列5-转化PDF文档为Word相关推荐
- Java自动生成数据库设计文档(Word)
一.前言 在日常的开发工作中,偶尔会遇到项目收尾需要提供数据库设计文档的情况.对这个文档的编写目前应该已经基本没有问题了,如果你还不知道如何编写该文档,可以参考如下文章. https://blog.c ...
- Aspose.PDF for Java系列8-转化HTML为PDF
Aspose.PDF for Java系列8-转化HTML为PDF 转化HTML为PDF 主要分为以下步骤: 创建一个HtmlLoadOptions类. 实例化Document对象. 调用Docume ...
- Aspose.PDF for Java系列4-基本操作
Aspose.PDF for Java系列4-基本操作 一.创建PDF文档 如何用Java创建PDF文件? 参考以下步骤: 初始化Document对象. 添加Page到Document对象. 创建Te ...
- Java使用jacob完成office文档pdf转换
Java使用jacob完成office文档pdf转换 #简单介绍jacob jacob是java使用微软工具的一个工具 下载地址 http://sourceforge.net/projects/jac ...
- java给多个不同文档(doc,docx,jpg,png,tif)合并成一个pdf文档 并添加设置页面权限,和水印
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 对pdf文档的合并转换 加水印等 多个文件转pdf 还有改变图片的尺寸大小 依赖包可以自己去找下 代码 package com. ...
- 编辑PDF文档,Word 2013可以是您的选择
题外话:记得刚进公司的时候,几乎所有的培训文档都是PDF.标准文档,公司使用的软件是Adobe Acrobat 5.0(不知道多少钱,呵呵),软件当然是购买正版的:去年,公司购买了新版本的Adobe ...
- 苹果手机html转pdf文件怎么打开吗,今天才知道,苹果手机打开这个功能,可以将纸质文档转为Word...
很多人都会选择苹果手机,如果你只会用来打游戏,那就太浪费了,在苹果手机上有一个非常厉害的功能,可以将纸质文档转换为Word,下面一起来看看吧. 一.提取电子文档 1.苹果手机上都会自带一个[备忘录], ...
- 大学“电路分析基础”试题合集第六章(文末附PDF文档与Word文档)
大学"电路分析基础"试题合集第一章 大学"电路分析基础"试题合集第二章 大学"电路分析基础"试题合集第三章 大学"电路分析基础&q ...
- 不知道怎么把PDF文档转Word?来看看这几个好用的PDF转Word软件
在日常工作中,我们经常需要复制PDF文件中的内容.可是由于PDF文档属性是不可编辑的,我们很难复制或者拷贝其内容.如果可以把PDF文档转为Word,我们就能快速完成复制粘贴的操作.那你们知道好用的PD ...
最新文章
- 自己对有上下界的网络流的理解
- VS2008 在IE中 调试 ActiveX控件
- GDCM:gdcm::Printer的测试程序
- 西瓜书学习记录-决策树(第四章)
- express怎么读取html,Express 配置HTML页面访问的实现
- Binder内存拷贝的本质和变迁
- iOS -[JYBDScanCardManage configIDScan] in JYBDScanCardManage.o等静态库问题
- 过VMP加壳程序的自效验
- C语言与或非应用案例,与或非(生活中与或非例子)
- 计算机画图虚线,天正建筑怎么把直线变成虚线
- Septentrio板卡接收机连接方式
- 解决Hadoop Browse Directory Couldn‘t upload the file 错误.无法上传文件
- 关于VM开启黑屏的解决方法
- 推荐10款社群运营必备工具
- 【好文推荐】mysql的优点和缺点
- nginx多域名配置
- fastunit中使用MapList一个注意例子
- 执着的数字思想者——Pascal之父(转贴)
- Python tkinter库之Canvas 直线等分圆弧(割圆术)
- opencv快速入门—键盘响应操作