OFFICE 文档在线预览方案很多:

服务器先转换为PDF,再转换为SWF,最后通过网页加载Flash预览,比如flexpaper

Office文档直接转换为SWF,通过网页加载Flash预览

微软的Office365

在浏览器中直接打开

转换为html

今天,我们要用的方案是转换为html来预览。

技术方案:

office文档转换为pdf:使用libreoffice

pdf转html,使用pdf2htmlex

测试环境:

操作系统:ubuntu 12.04

1. office文档转pdf

1.1 安装libreoffice

apt-get install libreoffice-common

1.2 启动转换服务

soffice --accept="socket,host=127.0.0.1,port=2002;urp;" --nofirststartwizard

1.3 文档转换

网上一般介绍的都是使用JODConverter ,通过java来调用转换服务,其实还有一种替代方案,就是使用pyodconverter,python版本的转换脚本https://github.com/mirkonasato/pyodconverter/

下载后,进行测试:

python DocumentConverter.py Website_Information_Form.doc new.pdf

soffice 可以正常转换为pdf,但是中文显示为乱码

1.4 中文乱码问题修复

google一下,乱码问题大概是字体缺失的问题,于是尝试将windows下的字体拷贝过去,复制windows下的字体到/usr/share/fonts下,然后刷新字体缓存

sudo fc-cache -fv 2>&1 | grep failed | cut -f1 -d":" | xargs -i sudo touch {} && sudo fc-cache -fv

再重启转换服务,再次测试,已经OK了!

2.pdf转html

下面介绍简单安装方式:

2.1 通过apt安装

sudo add-apt-repository ppa:coolwanglu/pdf2htmlex

sudo apt-get update

sudo apt-get install pdf2htmlex

2.2 测试pdf2htmlex

pdf2htmlEX --zoom 1.3 xiaoshujiang.pdf

可以看到,当前目录生成了xiaoshujiang.html

2.3 转换脚本

写一个脚本,将两次转换放到一起,方便调用:

#convert2html.sh

temp=$(date +%Y%m%d%H%m%s)

python DocumentConverter.py $1 ${temp}.pdf

pdf2htmlEX --zoom 1.3 $temp.pdf

mv $temp.html $2

rm $temp.pdf

3. 测试

3.1 word (doc.docx)测试

convert2html.sh imo云办公室-私有云用户使用手册V2.0.doc imo-doc.html

效果:

3.2 表格 (xls)测试

convert2html.sh xxx.xlsx xxx.html

3.3 PPT (pptx)测试

./convert.sh xxx.pptx xxx.html

4. 总结

本文介绍了一种在服务端将office文档转换为html以方便预览的方法。

实际使用时,可以将生成好的html放到网站路径下,通过拦截器,设置访问权限。

作者:JadePeng

office文件 vue 预览_OFFICE 文档转换为html在线预览相关推荐

  1. 文档转换、在线预览的几种方式以及推荐

    互联网时代的繁荣期,在线教育犹如三国中的巴蜀之地,无论是各大巨头还是中小软件.都希望在此领域分的一口肥肉. 其中,关于文档转换.一直是开发在线教育软件让人头痛的事. 在这先说一下文档转换以及预览的几种 ...

  2. .net oss存储 oss api接口开发 office文档上传在线预览oss存储 office文档上传oss 阿里云oss接口开发

    word在线预览api接口 office在线预览接口 word转图片 ppt在线预览 excel在线预览 预览支持的文件格式:word(doc,docx),excel(xls,xlsx),ppt(pp ...

  3. java doc转图片_使用Java实现word文档转图片 在线预览

    [Java] 纯文本查看 复制代码/** * licence 验证 * @return * @throws Exception */ public static boolean getLicense( ...

  4. Angualr6+ 将数据转换整合PDF文档导出或在线预览

    前言:需要将自己的数据单或是图片等转换成PDF格式,可以在线预览与下载:所需pdfmakes和ng2-pdf-viewer:并且解决pdfmakes中文与中文符号乱码问题: 一.安装Pdfmakes ...

  5. 免费图片或PDF文档转换为文本在线网站

    上期达芬奇同大家介绍了几个图片或PDF免费转换为文本软件,有些同学可能不想安装软件,今天达芬奇同大家分享几个免费的在线图片或PDF转文本网站. 网站1,白描网页版(图片转文字 - 图片转Excel表格 ...

  6. word文档转html在线预览Demo

    demo地址:https://download.csdn.net/download/caidingnu/11390310

  7. DCMTK:将XML文档转换为DICOM文件或数据集

    DCMTK:将XML文档转换为DICOM文件或数据集 将XML文档转换为DICOM文件或数据集 将XML文档转换为DICOM文件或数据集 #include "dcmtk/config/osc ...

  8. java 预览word文档_Java实现office文档与pdf文档的在线预览功能

    最近项目有个需求要java实现office文档与pdf文档的在线预览功能,刚刚接到的时候就觉得有点难,以自己的水平难以在三四天做完.压力略大.后面查找百度资料.以及在同事与网友的帮助下,四天多把它做完 ...

  9. 将vue文档下载到本地预览

    将vue文档下载到本地预览 由于vue文档在服务器在国外,因此访问速度较慢,为了方便文档查看,可以将文档下载到本地预览 步骤 到vue的GitHub仓库下载文档源码 下载node.js和git安装到本 ...

  10. 加载js文件,在线预览pdf文档

    加载js文件,在线预览pdf文档 效果演示 环境要求 JS文件下载 Jsp页面导入js文件 jquery.media.js源码 效果演示 首先,先展示效果图 环境要求 Tomcat8.5 [注意]:T ...

最新文章

  1. 继承、实现、依赖、关联、聚合、组合的联系与区别
  2. WINCE设备开机灰屏问题(很怪异)
  3. 对图像进行二维离散Fourier变换
  4. 性能测试入门(六)windows及Linux下做压力测试的注册表设置
  5. 在你迷茫时不如学好一门语言(送给大一的学弟学妹)
  6. html button样式_HTML基础
  7. Android中的短信收不到问题
  8. HashMap工作原理和扩容机制
  9. WPS文字2013利用绘图工具中的形状裁剪出各式各样的图片
  10. 最新版本Eclipse安装SVN插件Subclipse过程
  11. 1. 类,对象,对象属性,对象的行为
  12. uos应用_UOS指标的应用详解
  13. GPLv2许可证正经人话翻译
  14. 【Typora】 自定义背景颜色(护眼绿) 高亮颜色 选中内容颜色 高亮快捷键
  15. 通过过滤器Filter来完成url访问权限限制
  16. 转:使用DOS命令chcp查看windows操作系统的默认编码以及编码和语言的对应关系
  17. 计算机睡眠状态单机游戏,睡眠神经图 电脑版
  18. 现在的你对未来什么规划?
  19. 怎么实现文字转换成语音?分享一个简单的小妙招
  20. 清除盗游戏帐号的密西木马变种(Trojan.PSW.Misc.r)等

热门文章

  1. 徐思201771010132《面向对象程序设计(java)》第一周学习总结
  2. php美颜相机,手机照片美化软件哪个好|美颜相机官方版-官方版
  3. 软件开发工具【十】 之 调试程序
  4. javax.persistence.EntityNotFoundException: Unable to find报错
  5. DirectSHOW中的视频捕捉 (乱七八糟整理)
  6. 听羊哥聊如何学习一门新技术
  7. 阿里云ddns过程记录
  8. CDlinux万能无线破解系统iSO中文版 U盘启动版
  9. python代码块符号_Python 中代码块是用下列()符号代表的。_学小易找答案
  10. 第一台电子计算机乌拉尔,2018网易爱乐之战题目答案大全一览