java poi xml转word文档_使用POI转换word doc文件
目录
1 转换为Html文件
2 转换为Xml文件
3 转换为Text文件
在POI中还存在有针对于word doc文件进行格式转换的功能。我们可以将word的内容转换为对应的Html文件,也可以把它转换为底层用来描述doc文档的xml文件,还可以把它转换为底层用来描述doc文档的xml格式的text文件。这些格式转换都是通过AbstractWordConverter特定的子类来完成的。
1 转换为Html文件
将doc文档转换为对应的Html文档是通过WordToHtmlConverter类进行的。它会尽量的利用Html的方式来呈现原文档的样式。示例代码:
Java代码
/**
* Word转换为Html
* @throws Exception
*/
@Test
public void testWordToHtml() throws Exception {
InputStream is = new FileInputStream("D:\\test.doc");
HWPFDocument wordDocument = new HWPFDocument(is);
WordToHtmlConverter converter = new WordToHtmlConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
//对HWPFDocument进行转换
converter.processDocument(wordDocument);
Writer writer = new FileWriter(new File("D:\\converter.html"));
Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty( OutputKeys.ENCODING, "utf-8" );
//是否添加空格
transformer.setOutputProperty( OutputKeys.INDENT, "yes" );
transformer.setOutputProperty( OutputKeys.METHOD, "html" );
transformer.transform(
new DOMSource(converter.getDocument() ),
new StreamResult( writer ) );
}
2 转换为Xml文件
将doc文档转换为对应的Xml文件是通过WordToFoConverter类进行的。它可以把doc文档转换为底层用来描述doc文档的Xml文档。示例代码:
Java代码
/**
* Word转Fo
* @throws Exception
*/
@Test
public void testWordToFo() throws Exception {
InputStream is = new FileInputStream("D:\\test.doc");
HWPFDocument wordDocument = new HWPFDocument(is);
WordToFoConverter converter = new WordToFoConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
//对HWPFDocument进行转换
converter.processDocument(wordDocument);
Writer writer = new FileWriter(new File("D:\\converter.xml"));
Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty( OutputKeys.ENCODING, "utf-8" );
//是否添加空格
transformer.setOutputProperty( OutputKeys.INDENT, "yes" );
// transformer.setOutputProperty( OutputKeys.METHOD, "html" );
transformer.transform(
new DOMSource(converter.getDocument() ),
new StreamResult( writer ) );
}
3 转换为Text文件
将doc文档转换为text文档是通过WordToTextConverter来进行的。它可以把doc文档转换为底层用于描述doc文档的Xml格式的text文档。示例代码:
Java代码
/**
* Word转换为Text
* @throws Exception
*/
@Test
public void testWordToText() throws Exception {
InputStream is = new FileInputStream("D:\\test.doc");
HWPFDocument wordDocument = new HWPFDocument(is);
WordToTextConverter converter = new WordToTextConverter(DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument());
//对HWPFDocument进行转换
converter.processDocument(wordDocument);
Writer writer = new FileWriter(new File("D:\\converter.txt"));
Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty( OutputKeys.ENCODING, "utf-8" );
//是否添加空格
transformer.setOutputProperty( OutputKeys.INDENT, "yes" );
transformer.setOutputProperty( OutputKeys.METHOD, "text" );
transformer.transform(
new DOMSource(converter.getDocument() ),
new StreamResult( writer ) );
}
(注:本文是基于poi3.9所写)
java poi xml转word文档_使用POI转换word doc文件相关推荐
- 苹果手机怎么编辑word文档_可以一键导入word图文的微信编辑软件有什么?编辑器怎么使用?...
工作效率的提高除了因为熟练之外,还因为各种工具的辅助.自古以来都有工欲善其事必先利其器的教诲,好的工具能让我们工作时事半功倍.今天我们来聊聊什么工具可以提高公众号运营效率?什么微信编辑器可以讲word ...
- js创建word文档写入文本并保存为doc文件
var doc = new ActiveXObject("Word.application");//激活ActiveXObject的Word对象 doc.visible = tru ...
- 计算机网络校园局域网课题,毕业论文基于VLAN技术的校园局域网建设word文档_全文免费在线阅读(推荐阅读)...
<[毕业论文]基于VLAN技术的校园局域网建设.doc>由会员分享,可免费在线阅读全文,更多与<[毕业论文]基于VLAN技术的校园局域网建设(word文档)_全文免费在线阅读> ...
- python怎么查找word文档_教你怎么使用Python对word文档进行操作
使用Python对word文档进行操作 一.安装Python-docx Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件.说白了,python就相当于wi ...
- python命令打印word文档_使用DOS命令如何打印Word文档
打印Word文档,使用窗口菜单即可打印,为什么还来个多余的招数?首先澄清一下,这不是没事找事做,而是一招防患于未然的绝招! 什么情况下我们使用到这招呢? 当你倒霉到极点.走路都会被石头扳倒的时候就用得 ...
- 用pageOffice控件实现 office word文档 强制留痕编辑Word
OA办公中,业务需要多人编辑word文档,需要强制留痕功能,用来查看文档编辑过程中的具体修改痕迹. 怎么实现word文档的强制留痕呢? 1 实现方法 通过pageOffice实现简单的在线打开编辑wo ...
- html中只能上传文件word,HTML文件表单,接受Word文档(HTML file form, accept Word documents)...
HTML文件表单,接受Word文档(HTML file form, accept Word documents) 我在这里遇到了一个奇怪的问题. (不管怎样,或者我只是忽略了一些非常简单的东西.) 我 ...
- Word文档怎么删除html标签,word怎么清除所有格式
在 Word 中,选择性粘贴有三种格式 分别为保留原格式.合并格式和保留原文本,另外,还可以选择"HTML 格式.无格式文本.无格式的 Unicode 文本.带格式文本(RTF)和图片(增强 ...
- word计算机桌面加密,word文档加密,怎么让word自动加密 -电脑资料
Word提供了加密的功能,但不能自动给文档加密, 第一步:在"工具"菜单中选择"宏"选项卡,单击"宏"命令,键入宏的名称"AllA ...
- word怎么显示计算机数字,如何使word文档自动显示字数统计 Word自动统计文档字数在哪里...
如何使word文档自动显示字数统计 Word自动统计文档字数在哪里 Word中有一个非常实用的字数统计功能,如要统计一个文档中的字数,直接在菜单栏中单击"审阅→字数统计",便可得到 ...
最新文章
- matlab2014仿真pid程序,先进 PID 控制及其 MATLAB 仿真 (PDF+程序)
- 世界杯十六强合影壁纸
- 丰农控股 CIO 王轶枭:万亿级农资市场,神策数据助力大丰收筑就数据驱动核心竞争力...
- 三十二、电子商务服务推荐模型构建
- 五一好礼70份免费送:示波器、开发板、焊台等!
- mysql和mdy_Liunx下安装MySql
- pc网站支付html,jsp 支付宝pc网页支付
- C# Webservice
- MVC案例之删除以及其中遇到的问题,附源代码
- 289页初中级前端题助你拿下Offer,附面试题答案
- 22考研各科标准答题卡(附高清PDF版)
- Ubuntu 截图工具
- sop流程图模板_这是一份标准作业流程SOP详解,附流程图绘制规范,不愁不会画!...
- ORA-00932: 数据类型不一致: 应为 -,但却获得 -
- unity android gyro,Unity - 陀螺仪 - 仅绕一轴旋转
- 医学与计算机领域融合的发展前景,浅谈对超声医学的发展现状与前景之探究
- 汇总病毒样本的常用反调试技术、反分析技巧(持续更新)
- PHPMyWind5.4存储XSS(CVE-2017-12984)
- BSCI社会责任验厂对员工考勤和工资的标准和要求
- ifft2 二维快速傅里叶逆变换(Matlab)
热门文章
- SourceInsight查看java源代码
- Excel函数实战技巧精粹(四)常用函数之COUNTIF和SUMIF详解
- CSS opacity - 实现图片半透明效果
- 泛微oa部署linux步骤,泛微oa部署微搜功能手册
- 《高性能mysql第三版》
- 网络克隆安装linux系统下载安装,pxe网刻工具_诚龙网刻教程_网络克隆安装windows7...
- 手机无线上网何时进入战国时代?
- Itext7 jar 下载 链接
- 超级好用的TXT分本分割工具
- 黑色背景的DW代码配色方案 Colors.xml