Java版Word开发工具Aspose.Words功能解析:将Word文档(DOC / DOCX)转换为HTML
Microsoft Word文件格式DOC / DOCX很著名,因为文字处理器支持多种功能来组织和解释信息。同样,HTML文件格式有助于在Web应用程序中显示信息。
在本文中,我们将学习使用Java将Word文件(DOC / DOCX)转换为HTML。aspose.words最新下载(技术交楼群 761297826)https://www.evget.com/product/4116/download下载最新版试用。
- 使用Java将Word(DOC / DOCX)转换为HTML
- 使用Java将DOCX转换为HTML5
- 使用Java将受密码保护的Word文件转换为HTML
- 使用Java将Word转换为MHTML
①使用Java将Word(DOC / DOCX)转换为HTML
可以按照以下步骤将Word转换为HTML:
- 加载带有DOC或DOCX扩展名的源Word文件
- 将文件另存为输出HTML
下面的代码示例显示了如何使用Java将DOCX转换为HTML:
// Load the document from disk. Document doc = new Document(dataDir + "TestFile.docx"); // Save the document into HTML. doc.save(dataDir + "Document_out.html", SaveFormat.HTML);
输入DOCX文件预览
输出HTML文件预览
②使用Java将DOCX转换为HTML5
HTML5是HTML的最新版本。我们注意到在Aspose.Words API中对支持HTML5的重复请求。因此,支持DOCX到HTML的转换,可以通过以下步骤转换文件:
- 加载输入的DOCX文件
- 设置SaveFormat时设置HtmlSaveOptions
- 设置HtmlVersion.HTML_5的枚举值
- 保存输出文件
下面的代码段显示了如何在Java中将DOCX转换为HTML5:
// Load the document from disk. Document doc = new Document(dataDir + "TestFile.docx"); HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML); opts.setHtmlVersion(HtmlVersion.HTML_5); opts.setExportImagesAsBase64(true); opts.setExportPageMargins(true); doc.save(dataDir + "TestFile.html", opts);
③使用Java将受密码保护的Word文件转换为HTML
DOC或DOCX文件有时受密码保护或使用密码加密。也可以将此类文件转换为HTML。但是,在加载Word文件时需要密码。可以按照以下步骤将DOCX转换为HTML:
- 初始化LoadOptions类的对象
- 设定密码
- 加载加密的DOCX文件
- 将DOCX转换为HTML
同样,以下代码示例显示了如何使用Java将受密码保护的DOCX文件转换为HTML:
LoadOptions options = new LoadOptions(); options.setPassword("aspose"); // Load the document from disk. Document doc = new Document(dataDir + "TestFile.docx" , options); //Save the document in HTML format. doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);
④使用Java将Word转换为MHTML
MHTML文件是包含嵌入式内容和媒体的单个文件。您可以按照以下步骤将Word文件(DOC / DOCX)转换为MHTML:
- 加载输入的DOCX文件
- 使用SaveFormat.MHTML保存输出MHTML文件
下面的代码段基于此步骤。因此,它显示了如何使用Java将DOCX转换为MHML:
// Load word document from disk. Document doc = new Document(dataDir + "TestFile.docx"); // Save the document into MHTML. doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);
Java版Word开发工具Aspose.Words功能解析:将Word文档(DOC / DOCX)转换为HTML相关推荐
- Java版Word开发工具Aspose.Words功能解析:查找和替换Word文档中的文本
MS Word提供了一种简单的方法来查找和替换文档中的文本.查找和替换文本的一种流行用例之一可能是在文档之间的敏感信息在各个实体之间共享之前,对其进行删除或替换.但是,手动过程可能需要您安装MS Wo ...
- Java版Word开发工具Aspose.Words功能解析:在Word(DOCX / DOC)中插入或删除注释
注释用于Word文档DOCX或DOC中,以建议改进和修改.让我们探讨如何使用Java以编程方式插入注释以及删除或删除注释.您可以根据需要添加作者姓名,缩写,注释文本,日期和时间. 在本文中,将学习以下 ...
- Word开发工具Aspose.Words功能演示:使用C ++分割MS Word文档
MS Word是用于存储和共享信息的流行格式.在某些情况下,想将Word文档拆分为多个文件.例如,文档可能包含需要与不同人员共享的不同部分,或者包含一些需要分开的机密信息.在这种情况下,拆分Word文 ...
- Word开发工具Aspose.Words功能演示:在C ++中以编程方式在Word文档中添加或删除页眉和页脚
Word文档中的页眉和页脚用于格式化和显示重要信息,例如主题,章节,页码,Copywrite等.以编程方式使用Word文档时,可能需要添加或删除页眉和页脚.为此,本文将教您如何使用C ++在Word文 ...
- Word开发工具Aspose.Words功能演示:使用C ++在Word文档中使用目录
目录(TOC)是Word文档的重要组成部分.它提供了文档内容的概述,并允许您快速导航到所需的部分.您可能会遇到需要以编程方式从Word文档中添加,提取,更新或删除目录的情况.为此,本文将教您如何使用C ...
- Java版Word开发工具Aspose.Words基础转换指南:将Word文档和图像转换为PDF
Aspose.Words for Java是功能丰富的文字处理API,开发人员可以在自己的Java应用程序中嵌入生成,修改,转换,呈现和打印Microsoft Word支持的所有格式的功能.它不依赖于 ...
- Word处理控件Aspose.Words功能演示:使用 C++ 创建 MS Word 文档 (DOC/DOCX)
Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...
- Java操作word文档将docx转换为pdf格式
Java操作word文档将docx转换为pdf格式 一.整体说明 在上传 Office 课件时,格式有:doc,docx,xls,xlsx,ppt,pptx,程序需要将其 转换成 pdf 格式, 才能 ...
- Java版Word开发工具Aspose.Words基础教程:创建或加载文档
Aspose.Words for Java是功能丰富的文字处理API,开发人员可以在自己的Java应用程序中嵌入生成,修改,转换,呈现和打印Microsoft Word支持的所有格式的功能.它不依赖于 ...
最新文章
- iOS tableviewcell重用机制避免重复显示
- groovy怎样从sql语句中截取表名_SQL基础教程学习笔记
- vaadin_Vaadin提示:延迟加载和商品标识
- synchronized 中的 4 个优化,你知道几个?
- 天天爱跑步——树上差分
- PostgreSQL 12 的同步流复制搭建及主库hang问题处理与分析
- 许昌往事之压力无处不在
- Hexo+next的侧边栏背景与字体颜色设置方法
- mysql(指RDS)验证pureftpd登录
- visual studio 2010 c++ 打印 Hello world
- JQuery CSS 基本选择器 详解
- mysql外键英文_MySQL开发中的外键(foreign key)与参照完整性(Referential integrity) [中英文转载]...
- DVWA全级别通关教程
- 基于docker搭建单机版ELK日志采集系统
- 如何画出一张合格的技术架构图?
- 【Matlab 六自由度机器人】运动学逆解(附MATLAB机器人逆解代码)
- mydisktest测试软件,MyDiskTest
- 大数据HBase(十五):HBase的Bulk Load批量加载操作
- vbs进阶——实用函数之msgbox篇
- 小米手机显示无法连接服务器错误代码,来电转接出现连接问题或MMI码无效的解决方法...