Aspose.Words 将Word(DOC / DOCX)转换为HTML教程
Microsoft Word文件格式DOC / DOCX很著名,因为文字处理器支持多种功能来组织和解释信息。同样,HTML文件格式有助于在Web应用程序中显示信息。
- 使用Java将Word(DOC / DOCX)转换为HTML
- 使用Java将DOCX转换为HTML5
- 使用Java将受密码保护的Word文件转换为HTML
- 使用Java将Word转换为MHTML
①使用Java将Word(DOC / DOCX)转换为HTML
可以按照以下步骤将Word转换为HTML:
- 加载带有DOC或DOCX扩展名的源Word文件
- 将文件另存为输出HTML
下面的代码示例显示了如何使用Java将DOCX转换为HTML:
// Load the document from disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Save the document into HTML.
doc.save(dataDir + "Document_out.html", SaveFormat.HTML);
②使用Java将DOCX转换为HTML5
HTML5是HTML的最新版本。我们注意到在Aspose.Words API中对支持HTML5的重复请求。因此,支持DOCX到HTML的转换,可以通过以下步骤转换文件:
- 加载输入的DOCX文件
- 设置SaveFormat时设置HtmlSaveOptions
- 设置HtmlVersion.HTML_5的枚举值
- 保存输出文件
下面的代码段显示了如何在Java中将DOCX转换为HTML5:
// Load the document from disk.
Document doc = new Document(dataDir + "TestFile.docx");
HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
opts.setHtmlVersion(HtmlVersion.HTML_5);
opts.setExportImagesAsBase64(true);
opts.setExportPageMargins(true);
doc.save(dataDir + "TestFile.html", opts);
③使用Java将受密码保护的Word文件转换为HTML
DOC或DOCX文件有时受密码保护或使用密码加密。也可以将此类文件转换为HTML。但是,在加载Word文件时需要密码。可以按照以下步骤将DOCX转换为HTML:
- 初始化LoadOptions类的对象
- 设定密码
- 加载加密的DOCX文件
- 将DOCX转换为HTML
同样,以下代码示例显示了如何使用Java将受密码保护的DOCX文件转换为HTML:
LoadOptions options = new LoadOptions();
options.setPassword("aspose");
// Load the document from disk.
Document doc = new Document(dataDir + "TestFile.docx" , options);
//Save the document in HTML format.
doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);
④使用Java将Word转换为MHTML
MHTML文件是包含嵌入式内容和媒体的单个文件。您可以按照以下步骤将Word文件(DOC / DOCX)转换为MHTML:
- 加载输入的DOCX文件
- 使用SaveFormat.MHTML保存输出MHTML文件
下面的代码段基于此步骤。因此,它显示了如何使用Java将DOCX转换为MHML:
// Load word document from disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Save the document into MHTML.
doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);
Aspose.Words 将Word(DOC / DOCX)转换为HTML教程相关推荐
- Word处理控件Aspose.Words功能演示:在 Java 中将 Word DOC/DOCX 转换为 PDF
Aspose.Words是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word. A ...
- html转换docx,word(doc,docx)转换为HTML
maven org.apache.poi poi 3.12 org.apache.poi poi-ooxml 3.12 org.apache.poi poi-ooxml-schemas 3.12 or ...
- Word处理控件Aspose.Words功能演示:在 C# .NET 中将 DOC/DOCX 转换为 PNG
Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...
- Word处理控件Aspose.Words功能演示:使用 C++ 在 Word (DOC/DOCX) 中添加或删除水印
Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...
- Java web/springboot上传word/doc/docx文档(含图片)与HTML富文本导入/导出互相转换解析!附项目源码
测试效果 先看下效果 文档内容如下: 上传 上传docx文档 查看解析内容 <html><head><style>p{margin-top:0pt;margin-b ...
- Java word(doc/docx)转pdf 无水印/免费
最近项目有个需求需要将word转为pdf. 网络上有好多种方案:spire,aspose,jacob等,由于jacob需要在jdk添加dll文件,有点束缚,所以在这里就不讲这个方案了 一.spire. ...
- java使用freemark实现word(.doc/.docx)/pdf生成和导出(附源码和模板文件)
freemark生成word/pdf 一. 背景 二.实现的技术选型以及遇到的坑 三.最终的效果 2.1 `.doc` word效果展示 2.1 `.docx` word效果展示 2.2 docx w ...
- Apache POI 实现word(doc/docx)浏览器预览
一.环境准备 1.jdk:1.8 2.maven:3.6 3.springboot:2.2.2 二.maven主要依赖 <dependency><groupId>org.apa ...
- java 转换word doc docx 等office文档 为pdf,无需破解 aspose ,无水印
我的目标:在浏览器页面上直接预览word,excel,pdf 等 为何会有该需求? 踩过的坑: 解决思路1: 用收费版的aspose或者 spire doc 转换后,再去除水印 优化完后的代码,`TO ...
- Word doc/docx 格式文件转换为 MarkDown
异想之旅:本人原创博客完全手敲,绝对非搬运,全网不可能有重复:本人无团队,仅为技术爱好者进行分享,所有内容不牵扯广告.本人所有文章仅在CSDN.掘金和个人博客(一定是异想之旅域名)发布,除此之外全部是 ...
最新文章
- 网络工程师_记录的一些真题_2005上半年上午
- java 反序列化 ysoserial exploit/JRMPClient 原理剖析
- 用批处理编译*.sln工程(转)
- 第一次做开源项目,和做SAP标准开发不同的感受
- 个人博客前端模板_腾讯前端开发工程师,教你极速搭建一个个人博客网站
- 使用Docker Swarm搭建分布式爬虫集群
- Gartner:阿里云蝉联全球第三、亚太第一
- FL Studio常见问题之通道窗口和步进音序器的设置
- c语言多线程的建立视频,如何用C语言实现多线程
- CCF201709-1 打酱油(100分)
- Layui-select 修复搜索之后上下键的bug
- Java实现最简单局域网QQ
- bootstrap 二级下拉菜单
- 电脑开机显示器黑屏是什么原因,电脑显示器黑屏怎么办
- scrapy 爬取大型图片网站(http://5442.com/)
- 浅析游戏音乐的风格特点—欧美风
- 张俊芳电机学12章计算题以及答案
- ArcEngine导出地图
- NYOJ82-迷宫寻宝(一)
- 网址URL转义,特殊字符编码HTTP URL编码表
热门文章
- 华为服务器操作系统筹备开源社区,华为开源服务器操作系统EulerOS 开源社区年内上线...
- Word设置每章不同的页眉
- 【研一小白论文精读】《Big Self-Supervised Models are Strong Semi-Supervised Learners》
- 概率论基础 —— 3.离散型、连续型概率模型,及其概率密度与概率分布函数
- V831——车牌识别
- 查看患者信息java_Java通过反射查看类的信息示例
- 办公室装修设计6大规范示意
- C语言利用图的邻接矩阵的存储方式实现拓扑排序
- 30 个案例教你用纯 CSS 实现常见的几何图形
- 30亿流量!梨视频靠什么拍出个“短视频世界杯元年”