office文档转html,OFFICE 文档转换为html在线预览
@H_404_0@OFFICE 文档在线预览方案很多:
服务器先转换为PDF,再转换为SWF,最后通过网页加载Flash预览,比如flexpaper
Office文档直接转换为SWF,通过网页加载Flash预览
微软的Office365
在浏览器中直接打开
转换为html
@H_404_0@今天,我们要用的方案是转换为html来预览。
@H_404_0@技术方案:
office文档转换为pdf:使用libreoffice
pdf转html,使用pdf2htmlex
@H_404_0@测试环境:
操作系统:ubuntu 12.04
1. office文档转pdf
1.1 安装libreoffice
apt-get install libreoffice-common
1.2 启动转换服务
soffice --accept="socket,host=127.0.0.1,port=2002;urp;" --nofirststartwizard
1.3 文档转换
@H_404_0@网上一般介绍的都是使用JODConverter ,通过java来调用转换服务,其实还有一种替代方案,就是使用pyodconverter,python版本的转换脚本https://github.com/mirkonasato/pyodconverter/
@H_404_0@下载后,进行测试:
python DocumentConverter.py Website_Information_Form.doc new.pdf
@H_404_0@soffice 可以正常转换为pdf,但是中文显示为乱码
1.4 中文乱码问题修复
@H_404_0@google一下,乱码问题大概是字体缺失的问题,于是尝试将windows下的字体拷贝过去,复制windows下的字体到/usr/share/fonts下,然后刷新字体缓存
sudo fc-cache -fv 2>&1 | grep Failed | cut -f1 -d":" | xargs -i sudo touch {} && sudo fc-cache -fv
@H_404_0@再重启转换服务,再次测试,已经OK了!
2.pdf转html
@H_404_0@pdf转html,使用国人开源的pdf2htmlex,一开始尝试通过源码编译安装,依赖组件太多,安装非常麻烦!感兴趣的可以执行编译安装,参见(https://github.com/coolwanglu/pdf2htmlEX/wiki/Building)
@H_404_0@下面介绍简单安装方式:
2.1 通过apt安装
sudo add-apt-repository ppa:coolwanglu/pdf2htmlex
sudo apt-get update
sudo apt-get install pdf2htmlex
2.2 测试pdf2htmlex
pdf2htmlEX --zoom 1.3 xiaoshujiang.pdf
@H_404_0@可以看到,当前目录生成了xiaoshujiang.html
2.3 转换脚本
@H_404_0@写一个脚本,将两次转换放到一起,方便调用:
#convert2html.sh
temp=$(date +%Y%m%d%H%m%s)
python DocumentConverter.py $1 ${temp}.pdf
pdf2htmlEX --zoom 1.3 $temp.pdf
mv $temp.html $2
rm $temp.pdf
3. 测试
3.1 word (doc.docx)测试
convert2html.sh imo云办公室-私有云用户使用手册V2.0.doc imo-doc.html
@H_404_0@404_0@
3.2 表格 (xls)测试
convert2html.sh xxx.xlsx xxx.html
@H_404_0@
3.3 PPT (pptx)测试
./convert.sh xxx.pptx xxx.html
@H_404_0@
4. 总结
@H_404_0@本文介绍了一种在服务端将office文档转换为html以方便预览的方法。
@H_404_0@实际使用时,可以将生成好的html放到网站路径下,通过拦截器,设置访问权限。
总结
如果觉得编程之家网站内容还不错,欢迎将编程之家网站推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
小编个人微信号 jb51ccc
喜欢与人分享编程技术与工作经验,欢迎加入编程之家官方交流群!
office文档转html,OFFICE 文档转换为html在线预览相关推荐
- office 文档在线预览新姿势之永中云转换
你知道的越多,你不知道的越多 点赞再看,养成习惯 如果您有疑问或者见解,或者需要毕业设计,大作业指导,购买付费源码等,欢迎指教: 企鹅:869192208 文章目录 前言: 一.接入准备 二.预览 w ...
- Print2flash在.NET(C#)64位中的使用,即文档在线预览(转载)
转:http://www.cnblogs.com/flowwind/p/3411106.html Print2flash在.NET(C#)中的使用,即文档在线预览 office文档(word,exce ...
- wps在线预览接口_文档在线预览的实现
最近在研究企业文档管理,这个是基本上所有企业都需要的软件,当然也是有很多种解决方案.对于企业文档来说,最基本的需求就是独立存储,共享.这种需求只需要建立一个Windows共享文件夹或者架一个Samba ...
- 文档在线预览(二)word、pdf、excel文件转html以实现文档在线预览
文章目录 一.前言 1.aspose 2 .poi + pdfbox 3 spire 二.将文件转换成html字符串 1.将word文件转成html字符串 1.1 使用aspose 1.2 使用poi ...
- office(如:Word、Excel、PPT 等)文件轻松实现在线预览
解决方案有很多,比如可以先将文件转图片或者pdf然后再网页中显示, 我在这里说的可能并不适合大家,这里简单说下几个快捷的方式 方案一: 可以直接使用第三方服务,不过这个需要收费的,我在这列几个http ...
- Office文档在线预览/在线编辑解决方案 - 毕升OfficeAPI说明
毕升OfficeAPI说明 毕升OfficeAPI集成.onlyoffice api集成 使用毕升Office编辑,预览文件的过程 Api 具体说明 HMAC-MD5签名 callURL返回值 如何检 ...
- java零碎要点010---Java实现office文档与pdf文档的在线预览功能
最近项目有个需求要java实现office文档与pdf文档的在线预览功能,刚刚接到的时候就觉得有点难,以自己的水平难以在三四天做完.压力略大.后面查找百度资料.以及在同事与网友的帮助下,四天多把它做完 ...
- Office文档在线预览接口服务器
现在的Office文档在线预览基本都是收费的,但这个功能几乎在所有软件系统中都会有这个需求,微软有一个Office online是免费的,但是安装跟配置非常复杂,可以说用难度5颗星来形容,有没有一个更 ...
- office文档 在线预览 (doc、ppt、xls)
office 在线预览 调用微软的api,将office文档转换为html,然后实现预览. 参考我们的实现方式:http://demo.kalcaddle.com/?user/loginSubmit ...
- Office 文档在线预览解决方案
目录 一.前言 二.解决方案 1.方案一:使用开源项目搭建私服 2.方案二:永中云转换 3.方案三:XDOC 4.方案四:Office Web 365 三.总结 一.前言 对于 offic 文档,在电 ...
最新文章
- maven整合@data注解_SpringBoot 整合 Dubbo实践(实用文章)
- Oracle和sql server中复制表结构和表数据的sql语句
- 使一个div垂直+水平居中的几种方法
- STM32开发 -- 主天线和分集天线
- 华为今年不会发布鸿蒙系统的手机,谷歌终于放下心了,华为:今年不会有鸿蒙系统的手机开售...
- JS以及CSS对页面的阻塞
- java 缓存方法_Java实现一个简单的缓存方法
- poj 1269 Intersecting Lines
- LM358恒流恒压原理
- 齐次方程与非齐次方程
- PPT写的好,升职加薪不会少-全套免费教程
- gitea mysql8_初试drone1.0+gitea—docker安装
- PR标题动画模板 创意动态多行标题注释字幕条pr模板
- Java编程练习之:转换罗马数字
- 百度OCR识别图片文字,解决image format error错误
- cscd期刊是c刊吗_武工商C刊和北大核心期刊论文发表数量位列全省同类高校前三甲...
- python智力问答游戏_Python语言编写智力问答小游戏功能
- 计算机组成原理笔记(7)---定、浮点运算、算术逻辑单元
- while、dowhile和for循环
- vue后台管理系统打包上线到node