最近項目中遇到一個新需求,需要將Word和Excel文檔解析成為html編碼並在前台顯示,word中包含圖片信息,保留原文檔基礎樣式,博主查找了相關資料后,利用OpenOffice第三方插件,以及自己封裝了一些解析方法,功能已經實現,在此分為上下兩部分做總結以便后期使用,希望可以幫助到大家,如有更好的建議望留言告知。

1.OpenOffice

1.軟件下載

首先,去到官網根據自己的需求下載所需要的版本(我的版本是4.1.4)。

2.軟件安裝

雙擊安裝包 打開運行程序 這里是安裝向導首界面 點擊下一步按鈕

點擊瀏覽按鈕 選擇安裝目錄路徑 如圖所示

會自動檢測系統中的插件 如果需要會自動安裝

輸入使用的用戶 以及選擇用戶權限 點擊下一步按鈕

這里勾選通常安裝 簡單而且點擊下一步

是否在桌面上創建一個快捷方式 建議勾選

這是安裝完成界面 點擊完成關閉安裝向導

PS:安裝度娘上都有,博主幫你們移植過來,按照步驟即可。

3.啟動OpenOffice服務

打開cmd命令窗口,進入OpenOffice安裝目錄下的program目錄,如下圖

因為我的OpenOffice安裝在D盤所以我先進的D盤,至於怎么在cmd里敲命令行我想大家都懂得,在這里我就不獻丑了。

進入program目錄后,繼續執行(按原句執行不要更改)

soffice -headless -accept=”socket,host=127.0.0.1,port=8100;urp;” -nofirststartwizard

如下圖:

執行完成后可打開:任務管理器 進行查看服務是否啟動 如下圖:

記住每次重啟電腦都得重新打開OpenOffice執行上述步驟,如果需要自啟動請自行寫自啟動腳本

4.工具類

OpenOfficeUtils.java

package com.utils;

import java.io.BufferedReader;

import java.io.File;

import java.io.IOException;

import java.io.InputStream;

import java.io.InputStreamReader;

import java.net.ConnectException;

import com.artofsolving.jodconverter.DocumentConverter;

import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;

import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;

import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter;

/** * 任意文件轉化為html * * @author Mr.F * */

public class OpenOfficeUtils {

// 任意文件轉html

public static void FileToHtml(String sourceFile, String htmlFile) {

File SourceFile = new File(sourceFile);

File HtmlFile = new File(htmlFile);

/* * 轉換成pdf文件 * 項目執行需要啟動OpenOffice服務,在系統命令窗口執行命令。 * cd C:\Program Files (x86)\OpenOffice.org 4\program * soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard */

if(SourceFile.exists()) {

if(!HtmlFile.exists()) {

OpenOfficeConnection connection = new SocketOpenOfficeConnection(8100);

try {

connection.connect();

DocumentConverter converter = new OpenOfficeDocumentConverter(connection);

converter.convert(SourceFile, HtmlFile);

HtmlFile.createNewFile();

connection.disconnect();

System.out.println("第二步:轉換為HTML格式 路徑" + HtmlFile.getPath());

} catch (java.net.ConnectException e) {

//} catch (Exception e) {

e.printStackTrace();

System.out.println("OpenOffice服務未啟動");

try {

throw e;

} catch (ConnectException e1) {

e1.printStackTrace();

}

} catch (com.artofsolving.jodconverter.openoffice.connection.OpenOfficeException e) {

e.printStackTrace();

System.out.println("讀取文件失敗");

throw e;

} catch (Exception e){

e.printStackTrace();

try {

throw e;

} catch (Exception e1) {

e1.printStackTrace();

}

}

} else {

System.out.println("已轉換為HTML,無需再次轉換");

}

} else {

System.out.println("要轉換的文件不存在");

}

}

public static void main(String[] args) {

FileToHtml("F:\\ceshi.xlsx", "F:\\ceshi1.html");

}

}

PS:OpenOffice會自動識別Office版本,比如doc和docx以及xls和xlsx。

先告訴大家工具下載和使用情況,下篇會結合web工程給大家演示完整的功能,如有問題請留言告知,我們不止會New!

java openoffic excel转html,Java利用OpenOffice進行將word,excel轉化成html解析到界面(上)...相关推荐

  1. php word excel转pdf文件怎么打开,php office文件(word/excel/ppt)转pdf文件,pptpdf

    php office文件(word/excel/ppt)转pdf文件,pptpdf 把代码放到了github上,点击进入 前阶段有个项目用到了线上预览功能, 关于预览office文件实现核心就是,把o ...

  2. [心得] 如何利用liquibase進行資料庫版本控制 - 實際練習

    透過上一篇的基本觀念介紹,希望大家應該有一點點感覺了! 這篇我們就來做個簡單的版本演練,加深印象吧! 我使用的環境如下 System : Windows 7 Database : SQL Server ...

  3. 在OpenGL中利用shader進行實時瘦臉大眼等臉型微調

    在現在這個靠臉吃飯的時代,如果你沒有一張瓜子臉一雙大眼睛,那還怎麼去吃飯呢,而現在一些直播視頻App相機應用基本都會有瘦臉大眼效果.本文是在OpenGl環境下,在shader中通過對像素位置進行偏移來 ...

  4. python批量将excel转成pdf_使用Python转换PDF,Word/Excel/PPT/md/HTML都能转!

    同一个操作执行两次,就要考虑自动化! 大家好,又到了Python办公自动化专题. 今天讲的是各位一定会接触到的PDF转换,关于各种格式的文件转换为PDF有很多第三方工具与网站可以实现,但是使用Pyth ...

  5. vue,React中利用的axios进行下载word,excel,pdf 常见的问题

    /* 下载方法 */ function downFile(blob, fileName) { if (window.navigator.msSaveOrOpenBlob) { navigator.ms ...

  6. 利用存儲過程進行簡繁體轉換

    if exists (select * from dbo.sysobjects where id = object_id(N'[dbo].[f_GB2BIG]') and xtype in (N'FN ...

  7. java classpath import package 机制 @Java的ClassPath, Package和Jar

    java classpath import package 机制 從一個簡單的例子談談package與import機制 基本原則:為什麼需要將Java文件和類文件切實安置到其所歸屬之Package所對 ...

  8. excel中html批量转化为pdf文件,批量将Excel转换成pdf文档的方法

    在我们办公过程中建立各种表格都喜欢用excel软件,特别是那些人事部的同事,将数据存储好之后,因为担心他人修改我们的数据,所以会选择将excel文件转换成比较难以编辑的pdf文件.可是,excel如何 ...

  9. 利用Spring-Boot解析Excel、用Java分析Excel、告别手动输入用程序读取Excel

    利用Spring-Boot解析Excel.用Java分析Excel.告别手动输入用程序读取Excel 一.资源 java读取Excel文件 二.修改 (一)中的代码中的 import service. ...

  10. Java通过openOffice实现word,excel,ppt转成pdf实现在线预览

    Java通过openOffice实现word,excel,ppt转成pdf实现在线预览 一.OpenOffice 1.1 下载地址 1.2 JodConverter 1.3 新建实体类PDFDemo ...

最新文章

  1. mybaits十:关联查询
  2. 深度学习核心技术精讲100篇(三十六)-EdgeRec:边缘计算在淘宝推荐系统中的大规模应用
  3. SpringBoot_数据访问-整合MyBatis(二)-配置版MyBatis
  4. POJ - 3268 Silver Cow Party(最短路)
  5. 两个fetion飞信API
  6. Linux内核中的atoi,itoa等函数
  7. 深圳市最新10区地图json文件,使用与echarts,百度,高德等免费
  8. python博弈论_通过几个例子理解博弈论与纳什均衡
  9. 计算机联锁维修管理机,计算机联锁试卷
  10. RNA-seq流程学习笔记(5)-Linux系统下载UCSC人类基因组和基因注释文件(未完成)
  11. 后端返回base64格式数据转excel格式文件并下载
  12. Excel怎么批量删除开头文本
  13. html5创建桌面快捷方式,iOS APP创建桌面快捷方式
  14. 新建SpringCloud电商后台项目
  15. 微信公众号开发—通过网页授权实现业务系统登录及用户绑定(微信网页授权自动登录业务系统)
  16. Linux下根据关键字搜索最后一条日志
  17. java的class是什么意思_Java的class是什么意思?
  18. LED小间距屏幕理解
  19. 宝塔搭建网站教程php,怎么利用宝塔面板搭建网站详细教程
  20. [No0000C7]windows 10桌面切换快捷键,win10

热门文章

  1. 【2】CH347应用--在OpenOCD添加CH347-USB转JTAG接口
  2. CentOS7 五步安装搜狗拼音输入法
  3. Python 获取车票信息
  4. 行为决策学入门书籍推荐《别做正常的傻瓜》
  5. 【SVM分类】基于遗传算法优化支持向量机实现葡萄酒分类附matlab代码
  6. js设为首页和加入收藏
  7. Android 长按Menu键的监听
  8. hp450 g8摄像头打开后黑屏
  9. android NDK 基础普及
  10. spring jpa Specification in 查询