aspose将word文档转为html内容
网站开发过程中,有时候需要将word内容展示在网页,可以通过aspose将doc文件直接转为pdf进行预览,但是有时候可能需要就在网页的某部分信息中显示内容,而不需要在线预览,这时候可以考虑将word内容简单转换为html内容来显示。
- 引入aspose相关jar包
- 将word内容转为HTML字符串
/*** word转html文本* @param doc 需要转换的doc文件对象* @return*/public String parseWord2Html(Document doc){HtmlSaveOptions saveOptions = new HtmlSaveOptions();saveOptions.setExportHeadersFootersMode(ExportHeadersFootersMode.NONE); // HtmlSaveOptions的其他设置信息请参考相关APIByteArrayOutputStream htmlStream = new ByteArrayOutputStream();String htmlText = "";try {doc.save(htmlStream, saveOptions);htmlText = new String(htmlStream.toByteArray(),"UTF-8");htmlStream.close();} catch (Exception e) {LOG.error("word文件转换失败,详细错误信息:{}",e.getMessage());}return htmlText;}
转换的效果如下,左边是word内容,右边是转换后的内容:
当然,效果并不会特别好,但是一些简单的格式会转换成功,差不多够用了,比如标题居中、加粗、回车换行缩进等;复杂一点的格式就可能不会转换成功了,测试发现序号之类的没有转换成功,可能和我option配置的有关系,没有仔细研究。
aspose将word文档转为html内容相关推荐
- word文档转为PDF以及多种文档格式转换
word文档转为PDF以及多种文档格式转换 项目地址:https://gitee.com/Jakewabc/word-of-pdf.git 相关案例: https://github.com/aspos ...
- 如何批量将 Word 文档转为 HTML 格式
概要:HTML 的全称为超文本标记语言,是一种标记语言.我们可以将所需要表达的信息按某种规则写成 HTML 文件,这样可以通过专用的软件来识别,比如常用的浏览器.这些软件可以将这些 HTML 文件&q ...
- 如何批量将 Word 文档转为 ePub 格式
概要:ePub 是一个自由的开放标准,属于一种可以"自动重新编排"的内容,也就是文字内容可以根据阅读设备的特性,以最适于阅读的方式显示,所以现在主流的电子书基本都是 ePub 的. ...
- 怎么样批量修改html里的内容,批量修改替换多个Word文档中同一内容的方法
批量修改替换多个Word文档中同一内容的方法群里一位朋友问到,如何一次性批量替换多个word文档中的同一内容.其实,实现多个Word文档的字符进行批量替换的方法有多种. 第一种方法,可以利用第三方软件 ...
- Java程序实现Word文档转为pdf以及出现的问题解决
做兽医项目需要用到这种需求,很多程序员都遇到过,有些word文档希望直接在浏览器中打开进行预览,但是浏览器往往不是很配合,直接就提示下载,不像pdf文档,浏览器可以直接进行预览. 1. Word文档转 ...
- 如何批量将 Doc 格式的 Word 文档转为 Docx 格式
概要:我们都知道 Word 格式有多种.比如常见的有 Doc.Docx,这两种类型是能够相互兼容的,也是能够相互转化的.那今天给大家介绍的是如何将多个 Doc 格式文档批量转为 Docx 格式. 我们 ...
- 怎么将word文档转为pdf
很多人问我怎么将word文档转为pdf,用程序,这个就是 package com.zms.office2pdf; import jp.ne.so_net.ga2.no_ji.jcom.IDispatc ...
- java读取word文档里面的内容(包括doc和docx格式)
java读取word文档里面的内容(包括doc和docx格式) java读取word文档里面的内容(包括doc和docx格式),使用POI架包 使用的POI架包如下 poi-3.16.jar poi- ...
- 职称计算机ppt教程,职称计算机:Word文档转为PPT的两种方法
许多人都习惯在PowerPoint环境中制作幻灯片.如果你手头有一个现成的word文稿讲义,就能变成PowerPoint演示文稿,而不用打开PowerPoint重新输入文字.因为word和PowerP ...
最新文章
- linux查找日志技巧
- shell提示符的个性化设定
- 三家逐鹿,私有化部署能帮神策数据杀出重围么?| 公司调研
- OpenCV使用dnn重新着色灰度图像的实例(附完整代码)
- Java 异常处理学习总结
- 在 Rolling Update 中使用 Health Check - 每天5分钟玩转 Docker 容器技术(146)
- access函数_ACCESS中的DLookUp函数是如何运算的?
- Halcon算子学习:create_surface_model
- php和js搜索框,利用PHP+JS实现搜索自动提示(实例)_php技巧
- java gui 布局 旋转_JAVA GUI编程之布局管理器
- git merge 回退_git+vscode进行版本控制
- 误删微软应用商店怎么装回来
- 安装Go语言开发工具
- CSM (Compatility Suport Module)兼容支持模块
- 北邮大一第二学期计算机学院课表,北京邮电大学
- matlab检验数据异方差,求教!怀特异方差检验方法在matlab中的实现,以及广义最........
- hive新功能 Cube, Rollup介绍
- 朴素贝叶斯-凉鞋问题
- pdf文件去除无用内容和链接
- EVE-NG 使用xshell