目录

1       转换为Html文件

2       转换为Xml文件

3       转换为Text文件

在POI中还存在有针对于word doc文件进行格式转换的功能。我们可以将word的内容转换为对应的Html文件,也可以把它转换为底层用来描述doc文档的xml文件,还可以把它转换为底层用来描述doc文档的xml格式的text文件。这些格式转换都是通过AbstractWordConverter特定的子类来完成的。

1       转换为Html文件

将doc文档转换为对应的Html文档是通过WordToHtmlConverter类进行的。它会尽量的利用Html的方式来呈现原文档的样式。示例代码:

Java代码

/**

* Word转换为Html

* @throws Exception

*/

@Test

public void testWordToHtml() throws Exception {

InputStream is = new FileInputStream("D:\\test.doc");

HWPFDocument wordDocument = new HWPFDocument(is);

WordToHtmlConverter converter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());

//对HWPFDocument进行转换

converter.processDocument(wordDocument);

Writer writer = new FileWriter(new File("D:\\converter.html"));

Transformer transformer = TransformerFactory.newInstance().newTransformer();

transformer.setOutputProperty( OutputKeys.ENCODING, "utf-8" );

//是否添加空格

transformer.setOutputProperty( OutputKeys.INDENT, "yes" );

transformer.setOutputProperty( OutputKeys.METHOD, "html" );

transformer.transform(

new DOMSource(converter.getDocument() ),

new StreamResult( writer ) );

}

2       转换为Xml文件

将doc文档转换为对应的Xml文件是通过WordToFoConverter类进行的。它可以把doc文档转换为底层用来描述doc文档的Xml文档。示例代码:

Java代码

/**

* Word转Fo

* @throws Exception

*/

@Test

public void testWordToFo() throws Exception {

InputStream is = new FileInputStream("D:\\test.doc");

HWPFDocument wordDocument = new HWPFDocument(is);

WordToFoConverter converter = new WordToFoConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());

//对HWPFDocument进行转换

converter.processDocument(wordDocument);

Writer writer = new FileWriter(new File("D:\\converter.xml"));

Transformer transformer = TransformerFactory.newInstance().newTransformer();

transformer.setOutputProperty( OutputKeys.ENCODING, "utf-8" );

//是否添加空格

transformer.setOutputProperty( OutputKeys.INDENT, "yes" );

//     transformer.setOutputProperty( OutputKeys.METHOD, "html" );

transformer.transform(

new DOMSource(converter.getDocument() ),

new StreamResult( writer ) );

}

3       转换为Text文件

将doc文档转换为text文档是通过WordToTextConverter来进行的。它可以把doc文档转换为底层用于描述doc文档的Xml格式的text文档。示例代码:

Java代码

/**

* Word转换为Text

* @throws Exception

*/

@Test

public void testWordToText() throws Exception {

InputStream is = new FileInputStream("D:\\test.doc");

HWPFDocument wordDocument = new HWPFDocument(is);

WordToTextConverter converter = new WordToTextConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());

//对HWPFDocument进行转换

converter.processDocument(wordDocument);

Writer writer = new FileWriter(new File("D:\\converter.txt"));

Transformer transformer = TransformerFactory.newInstance().newTransformer();

transformer.setOutputProperty( OutputKeys.ENCODING, "utf-8" );

//是否添加空格

transformer.setOutputProperty( OutputKeys.INDENT, "yes" );

transformer.setOutputProperty( OutputKeys.METHOD, "text" );

transformer.transform(

new DOMSource(converter.getDocument() ),

new StreamResult( writer ) );

}

(注:本文是基于poi3.9所写)

java poi xml转word文档_使用POI转换word doc文件相关推荐

  1. 苹果手机怎么编辑word文档_可以一键导入word图文的微信编辑软件有什么?编辑器怎么使用?...

    工作效率的提高除了因为熟练之外,还因为各种工具的辅助.自古以来都有工欲善其事必先利其器的教诲,好的工具能让我们工作时事半功倍.今天我们来聊聊什么工具可以提高公众号运营效率?什么微信编辑器可以讲word ...

  2. js创建word文档写入文本并保存为doc文件

    var doc = new ActiveXObject("Word.application");//激活ActiveXObject的Word对象 doc.visible = tru ...

  3. 计算机网络校园局域网课题,毕业论文基于VLAN技术的校园局域网建设word文档_全文免费在线阅读(推荐阅读)...

    <[毕业论文]基于VLAN技术的校园局域网建设.doc>由会员分享,可免费在线阅读全文,更多与<[毕业论文]基于VLAN技术的校园局域网建设(word文档)_全文免费在线阅读> ...

  4. python怎么查找word文档_教你怎么使用Python对word文档进行操作

    使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...

  5. python命令打印word文档_使用DOS命令如何打印Word文档

    打印Word文档,使用窗口菜单即可打印,为什么还来个多余的招数?首先澄清一下,这不是没事找事做,而是一招防患于未然的绝招! 什么情况下我们使用到这招呢? 当你倒霉到极点.走路都会被石头扳倒的时候就用得 ...

  6. 用pageOffice控件实现 office word文档 强制留痕编辑Word

    OA办公中,业务需要多人编辑word文档,需要强制留痕功能,用来查看文档编辑过程中的具体修改痕迹. 怎么实现word文档的强制留痕呢? 1 实现方法 通过pageOffice实现简单的在线打开编辑wo ...

  7. html中只能上传文件word,HTML文件表单,接受Word文档(HTML file form, accept Word documents)...

    HTML文件表单,接受Word文档(HTML file form, accept Word documents) 我在这里遇到了一个奇怪的问题. (不管怎样,或者我只是忽略了一些非常简单的东西.) 我 ...

  8. Word文档怎么删除html标签,word怎么清除所有格式

    在 Word 中,选择性粘贴有三种格式 分别为保留原格式.合并格式和保留原文本,另外,还可以选择"HTML 格式.无格式文本.无格式的 Unicode 文本.带格式文本(RTF)和图片(增强 ...

  9. word计算机桌面加密,word文档加密,怎么让word自动加密 -电脑资料

    Word提供了加密的功能,但不能自动给文档加密, 第一步:在"工具"菜单中选择"宏"选项卡,单击"宏"命令,键入宏的名称"AllA ...

  10. word怎么显示计算机数字,如何使word文档自动显示字数统计 Word自动统计文档字数在哪里...

    如何使word文档自动显示字数统计 Word自动统计文档字数在哪里 Word中有一个非常实用的字数统计功能,如要统计一个文档中的字数,直接在菜单栏中单击"审阅→字数统计",便可得到 ...

最新文章

  1. matlab2014仿真pid程序,先进 PID 控制及其 MATLAB 仿真 (PDF+程序)
  2. 世界杯十六强合影壁纸
  3. 丰农控股 CIO 王轶枭:万亿级农资市场,神策数据助力大丰收筑就数据驱动核心竞争力...
  4. 三十二、电子商务服务推荐模型构建
  5. 五一好礼70份免费送:示波器、开发板、焊台等!
  6. mysql和mdy_Liunx下安装MySql
  7. pc网站支付html,jsp 支付宝pc网页支付
  8. C# Webservice
  9. MVC案例之删除以及其中遇到的问题,附源代码
  10. 289页初中级前端题助你拿下Offer,附面试题答案
  11. 22考研各科标准答题卡(附高清PDF版)
  12. Ubuntu 截图工具
  13. sop流程图模板_这是一份标准作业流程SOP详解,附流程图绘制规范,不愁不会画!...
  14. ORA-00932: 数据类型不一致: 应为 -,但却获得 -
  15. unity android gyro,Unity - 陀螺仪 - 仅绕一轴旋转
  16. 医学与计算机领域融合的发展前景,浅谈对超声医学的发展现状与前景之探究
  17. 汇总病毒样本的常用反调试技术、反分析技巧(持续更新)
  18. PHPMyWind5.4存储XSS(CVE-2017-12984)
  19. BSCI社会责任验厂对员工考勤和工资的标准和要求
  20. ifft2 二维快速傅里叶逆变换(Matlab)

热门文章

  1. SourceInsight查看java源代码
  2. Excel函数实战技巧精粹(四)常用函数之COUNTIF和SUMIF详解
  3. CSS opacity - 实现图片半透明效果
  4. 泛微oa部署linux步骤,泛微oa部署微搜功能手册
  5. 《高性能mysql第三版》
  6. 网络克隆安装linux系统下载安装,pxe网刻工具_诚龙网刻教程_网络克隆安装windows7...
  7. 手机无线上网何时进入战国时代?
  8. Itext7 jar 下载 链接
  9. 超级好用的TXT分本分割工具
  10. 黑色背景的DW代码配色方案 Colors.xml