Aspose.PDF for Java系列5-转化PDF文档

DocFormat枚举类提供了DOCX格式的文件输出格式选项。如果你想要将PDF转化为DOCX格式,请参考本文下面的内容。

PDF转化为DOCX

步骤:

  1. 创建一个加载了PDF文档的Document对象。
  2. 使用Document.save()方法转化成SaveFormat.DocX格式。

具体代码如下:

    public static void ConvertPDFtoWord_DOCX_Format() {// Open the source PDF documentDocument pdfDocument = new Document(_dataDir + "PDFToDOC.pdf");// Save the resultant DOC filepdfDocument.save(_dataDir + "saveOptionsOutput_out.doc", SaveFormat.DocX);}

DocSaveOptions类有个Format属性,它提供了文档格式(DOC、DOCX)的功能。要将PDF转化成为DOCX格式,需要设置DocSaveOptions为DocFormat.DOCX.

具体代码如下:

    public static void ConvertPDFtoWord_Advanced_DOCX_Format(){        // Open the source PDF documentDocument pdfDocument = new Document(_dataDir + "PDFToDOC.pdf");// Instantiate DocSaveOptions objectDocSaveOptions saveOptions = new DocSaveOptions();// Specify the output format as DOCXsaveOptions.setFormat(DocSaveOptions.DocFormat.DocX);// Set other DocSaveOptions params// ....// Save document in docx formatpdfDocument.save("ConvertToDOCX_out.docx", saveOptions);}

PDF转化为DOC

步骤:

  1. 创建一个加载了PDF文档的Document对象。
  2. 使用Document.save()方法转化成SaveFormat.Doc格式。

代码如下:

    public static void main(String[] args) throws IOException {ConvertPDFtoWord();ConvertPDFtoWordDocAdvanced();}public static void ConvertPDFtoWord() {// Open the source PDF documentDocument pdfDocument = new Document(_dataDir + "PDFToDOC.pdf");// Save the file into MS document formatpdfDocument.save(_dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);}

使用DocSaveOptions进行转化

    public static void ConvertPDFtoWordDocAdvanced(){Path pdfFile = Paths.get(_dataDir.toString(), "PDF-to-DOC.pdf");Path docFile = Paths.get(_dataDir.toString(), "PDF-to-DOC.doc");Document pdfDocument = new Document(pdfFile.toString());        DocSaveOptions saveOptions = new DocSaveOptions();// Specify the output format as DOCsaveOptions.setFormat(DocSaveOptions.DocFormat.Doc);// Set the recognition mode as FlowsaveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);// Set the Horizontal proximity as 2.5saveOptions.setRelativeHorizontalProximity(2.5f);// Enable the value to recognize bullets during conversion processsaveOptions.setRecognizeBullets(true);pdfDocument.save(docFile.toString(), saveOptions);}

关于DocSaveOptions类

DocSaveOptions类提供了许多属性,方便设置将PDF转化为DOC格式的过程。可以通过设置Mode属性来指定PDF内容识别模式,Mode的取值来自RecognitionMode枚举类。

  • Textbox mode是最快速的,但是转化完成的DOC文档编辑性较差。原本的PDF文档中每个都被视为文本块进行了转化。这样可以最大程序保持原本PDF文档的样子,输出的文档高度相似,唯一不好的就是编辑起来比较麻烦。
  • Flow mode模式引擎执行分组和多级分析,尽量还原PDF文档,但是易于编辑。
  • RelativeHorizontalProximity属性可用于控制文本元素之间的相对接近度(字间距、字体大小)。指定字体大小的相似百分比。
  • RecognitionBullets用来设置转化过程的快速识别。

Aspose.PDF for Java系列5-转化PDF文档为Word相关推荐

  1. Java自动生成数据库设计文档(Word)

    一.前言 在日常的开发工作中,偶尔会遇到项目收尾需要提供数据库设计文档的情况.对这个文档的编写目前应该已经基本没有问题了,如果你还不知道如何编写该文档,可以参考如下文章. https://blog.c ...

  2. Aspose.PDF for Java系列8-转化HTML为PDF

    Aspose.PDF for Java系列8-转化HTML为PDF 转化HTML为PDF 主要分为以下步骤: 创建一个HtmlLoadOptions类. 实例化Document对象. 调用Docume ...

  3. Aspose.PDF for Java系列4-基本操作

    Aspose.PDF for Java系列4-基本操作 一.创建PDF文档 如何用Java创建PDF文件? 参考以下步骤: 初始化Document对象. 添加Page到Document对象. 创建Te ...

  4. Java使用jacob完成office文档pdf转换

    Java使用jacob完成office文档pdf转换 #简单介绍jacob jacob是java使用微软工具的一个工具 下载地址 http://sourceforge.net/projects/jac ...

  5. java给多个不同文档(doc,docx,jpg,png,tif)合并成一个pdf文档 并添加设置页面权限,和水印

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 对pdf文档的合并转换 加水印等 多个文件转pdf 还有改变图片的尺寸大小 依赖包可以自己去找下 代码 package com. ...

  6. 编辑PDF文档,Word 2013可以是您的选择

    题外话:记得刚进公司的时候,几乎所有的培训文档都是PDF.标准文档,公司使用的软件是Adobe Acrobat 5.0(不知道多少钱,呵呵),软件当然是购买正版的:去年,公司购买了新版本的Adobe ...

  7. 苹果手机html转pdf文件怎么打开吗,今天才知道,苹果手机打开这个功能,可以将纸质文档转为Word...

    很多人都会选择苹果手机,如果你只会用来打游戏,那就太浪费了,在苹果手机上有一个非常厉害的功能,可以将纸质文档转换为Word,下面一起来看看吧. 一.提取电子文档 1.苹果手机上都会自带一个[备忘录], ...

  8. 大学“电路分析基础”试题合集第六章(文末附PDF文档与Word文档)

    大学"电路分析基础"试题合集第一章 大学"电路分析基础"试题合集第二章 大学"电路分析基础"试题合集第三章 大学"电路分析基础&q ...

  9. 不知道怎么把PDF文档转Word?来看看这几个好用的PDF转Word软件

    在日常工作中,我们经常需要复制PDF文件中的内容.可是由于PDF文档属性是不可编辑的,我们很难复制或者拷贝其内容.如果可以把PDF文档转为Word,我们就能快速完成复制粘贴的操作.那你们知道好用的PD ...

最新文章

  1. 自己对有上下界的网络流的理解
  2. VS2008 在IE中 调试 ActiveX控件
  3. GDCM:gdcm::Printer的测试程序
  4. 西瓜书学习记录-决策树(第四章)
  5. express怎么读取html,Express 配置HTML页面访问的实现
  6. Binder内存拷贝的本质和变迁
  7. iOS -[JYBDScanCardManage configIDScan] in JYBDScanCardManage.o等静态库问题
  8. 过VMP加壳程序的自效验
  9. C语言与或非应用案例,与或非(生活中与或非例子)
  10. 计算机画图虚线,天正建筑怎么把直线变成虚线
  11. Septentrio板卡接收机连接方式
  12. 解决Hadoop Browse Directory Couldn‘t upload the file 错误.无法上传文件
  13. 关于VM开启黑屏的解决方法
  14. 推荐10款社群运营必备工具
  15. 【好文推荐】mysql的优点和缺点
  16. nginx多域名配置
  17. fastunit中使用MapList一个注意例子
  18. 执着的数字思想者——Pascal之父(转贴)
  19. Python tkinter库之Canvas 直线等分圆弧(割圆术)
  20. opencv快速入门—键盘响应操作

热门文章

  1. [转]敏感信息识别方法探究
  2. 《人人都是项目经理V2.0》读书笔记——第3章 需求管理——筛选干系人的需求
  3. 31-scrapy框架爬虫【简单应用】-3个例子
  4. 【Unity】InputSystem
  5. Linux shell脚本语言必看书籍推荐
  6. QT5.4 计算器程序 打包发布,解决dll的最新解决方案
  7. 802.11n-技术概览
  8. Windows10,没有网络图标,连不上网
  9. ArcMap实现CAD图的空间配准
  10. 不能直接打开excel文件的原因