Microsoft Word文件格式DOC / DOCX很著名,因为文字处理器支持多种功能来组织和解释信息。同样,HTML文件格式有助于在Web应用程序中显示信息。

  • 使用Java将Word(DOC / DOCX)转换为HTML
  • 使用Java将DOCX转换为HTML5
  • 使用Java将受密码保护的Word文件转换为HTML
  • 使用Java将Word转换为MHTML

①使用Java将Word(DOC / DOCX)转换为HTML

可以按照以下步骤将Word转换为HTML:

  • 加载带有DOC或DOCX扩展名的源Word文件
  • 将文件另存为输出HTML

下面的代码示例显示了如何使用Java将DOCX转换为HTML:

// Load the document from disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Save the document into HTML.
doc.save(dataDir + "Document_out.html", SaveFormat.HTML);

②使用Java将DOCX转换为HTML5

HTML5是HTML的最新版本。我们注意到在Aspose.Words API中对支持HTML5的重复请求。因此,支持DOCX到HTML的转换,可以通过以下步骤转换文件:

  • 加载输入的DOCX文件
  • 设置SaveFormat时设置HtmlSaveOptions
  • 设置HtmlVersion.HTML_5的枚举值
  • 保存输出文件

下面的代码段显示了如何在Java中将DOCX转换为HTML5:

// Load the document from disk.
Document doc = new Document(dataDir + "TestFile.docx");
HtmlSaveOptions opts = new HtmlSaveOptions(SaveFormat.HTML);
opts.setHtmlVersion(HtmlVersion.HTML_5);
opts.setExportImagesAsBase64(true);
opts.setExportPageMargins(true);
doc.save(dataDir + "TestFile.html", opts);

③使用Java将受密码保护的Word文件转换为HTML

DOC或DOCX文件有时受密码保护或使用密码加密。也可以将此类文件转换为HTML。但是,在加载Word文件时需要密码。可以按照以下步骤将DOCX转换为HTML:

  • 初始化LoadOptions类的对象
  • 设定密码
  • 加载加密的DOCX文件
  • 将DOCX转换为HTML

同样,以下代码示例显示了如何使用Java将受密码保护的DOCX文件转换为HTML:

LoadOptions options = new LoadOptions();
options.setPassword("aspose");
// Load the document from disk.
Document doc = new Document(dataDir + "TestFile.docx" , options);
//Save the document in HTML format.
doc.save(dataDir + "DocxToHTML.html",SaveFormat.HTML);

④使用Java将Word转换为MHTML

MHTML文件是包含嵌入式内容和媒体的单个文件。您可以按照以下步骤将Word文件(DOC / DOCX)转换为MHTML:

  • 加载输入的DOCX文件
  • 使用SaveFormat.MHTML保存输出MHTML文件

下面的代码段基于此步骤。因此,它显示了如何使用Java将DOCX转换为MHML:

// Load word document from disk.
Document doc = new Document(dataDir + "TestFile.docx");
// Save the document into MHTML.
doc.save(dataDir + "Document.mhtml", SaveFormat.MHTML);

Aspose.Words 将Word(DOC / DOCX)转换为HTML教程相关推荐

  1. Word处理控件Aspose.Words功能演示:在 Java 中将 Word DOC/DOCX 转换为 PDF

    Aspose.Words是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word. A ...

  2. html转换docx,word(doc,docx)转换为HTML

    maven org.apache.poi poi 3.12 org.apache.poi poi-ooxml 3.12 org.apache.poi poi-ooxml-schemas 3.12 or ...

  3. Word处理控件Aspose.Words功能演示:在 C# .NET 中将 DOC/DOCX 转换为 PNG

    Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...

  4. Word处理控件Aspose.Words功能演示:使用 C++ 在 Word (DOC/DOCX) 中添加或删除水印

    Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...

  5. Java web/springboot上传word/doc/docx文档(含图片)与HTML富文本导入/导出互相转换解析!附项目源码

    测试效果 先看下效果 文档内容如下: 上传 上传docx文档 查看解析内容 <html><head><style>p{margin-top:0pt;margin-b ...

  6. Java word(doc/docx)转pdf 无水印/免费

    最近项目有个需求需要将word转为pdf. 网络上有好多种方案:spire,aspose,jacob等,由于jacob需要在jdk添加dll文件,有点束缚,所以在这里就不讲这个方案了 一.spire. ...

  7. java使用freemark实现word(.doc/.docx)/pdf生成和导出(附源码和模板文件)

    freemark生成word/pdf 一. 背景 二.实现的技术选型以及遇到的坑 三.最终的效果 2.1 `.doc` word效果展示 2.1 `.docx` word效果展示 2.2 docx w ...

  8. Apache POI 实现word(doc/docx)浏览器预览

    一.环境准备 1.jdk:1.8 2.maven:3.6 3.springboot:2.2.2 二.maven主要依赖 <dependency><groupId>org.apa ...

  9. java 转换word doc docx 等office文档 为pdf,无需破解 aspose ,无水印

    我的目标:在浏览器页面上直接预览word,excel,pdf 等 为何会有该需求? 踩过的坑: 解决思路1: 用收费版的aspose或者 spire doc 转换后,再去除水印 优化完后的代码,`TO ...

  10. Word doc/docx 格式文件转换为 MarkDown

    异想之旅:本人原创博客完全手敲,绝对非搬运,全网不可能有重复:本人无团队,仅为技术爱好者进行分享,所有内容不牵扯广告.本人所有文章仅在CSDN.掘金和个人博客(一定是异想之旅域名)发布,除此之外全部是 ...

最新文章

  1. 网络工程师_记录的一些真题_2005上半年上午
  2. java 反序列化 ysoserial exploit/JRMPClient 原理剖析
  3. 用批处理编译*.sln工程(转)
  4. 第一次做开源项目,和做SAP标准开发不同的感受
  5. 个人博客前端模板_腾讯前端开发工程师,教你极速搭建一个个人博客网站
  6. 使用Docker Swarm搭建分布式爬虫集群
  7. Gartner:阿里云蝉联全球第三、亚太第一
  8. FL Studio常见问题之通道窗口和步进音序器的设置
  9. c语言多线程的建立视频,如何用C语言实现多线程
  10. CCF201709-1 打酱油(100分)
  11. Layui-select 修复搜索之后上下键的bug
  12. Java实现最简单局域网QQ
  13. bootstrap 二级下拉菜单
  14. 电脑开机显示器黑屏是什么原因,电脑显示器黑屏怎么办
  15. scrapy 爬取大型图片网站(http://5442.com/)
  16. 浅析游戏音乐的风格特点—欧美风
  17. 张俊芳电机学12章计算题以及答案
  18. ArcEngine导出地图
  19. NYOJ82-迷宫寻宝(一)
  20. 网址URL转义,特殊字符编码HTTP URL编码表

热门文章

  1. 华为服务器操作系统筹备开源社区,华为开源服务器操作系统EulerOS 开源社区年内上线...
  2. Word设置每章不同的页眉
  3. 【研一小白论文精读】《Big Self-Supervised Models are Strong Semi-Supervised Learners》
  4. 概率论基础 —— 3.离散型、连续型概率模型,及其概率密度与概率分布函数
  5. V831——车牌识别
  6. 查看患者信息java_Java通过反射查看类的信息示例
  7. 办公室装修设计6大规范示意
  8. C语言利用图的邻接矩阵的存储方式实现拓扑排序
  9. 30 个案例教你用纯 CSS 实现常见的几何图形
  10. 30亿流量!梨视频靠什么拍出个“短视频世界杯元年”