上一个项目的开发中需要实现从word中读取表格数据的功能,在JAVA社区搜索了很多资料,终于找到了两个相对最佳的方案,因为也得到了不少网友们的帮助,所以不敢独自享用,在此做一个分享。

两个方案分别是:一,用POI的TableIterator获取表格中的数据;二,用PageOffice来获取。

为什么说是两个相对最佳的方案呢?因为两个方案都各有优缺点,POI的优点很明显,就是免费,这正是PageOffice的缺点,PageOffice是一个国产的商业Office组件;POI的缺点有点多,接口复杂调用起来比较麻烦,尤其是不好读取word指定位置处的内容。由于获取表格数据的代码是在服务器端执行的,所以要求很高的代码质量,要考虑到代码执行效率问题、用户请求并发问题、大文档执行慢阻塞页面的问题等等,POI的架构属于仿VBA接口的模型,比VBA代码还要复杂,在调用方便上未做任何优化,光看代码都觉得头疼。所以在实际使用的过程中会遇到这些问题需要自己解决,相对来说这正是PageOffice的优点,使用PageOffice的话,就不会遇到这些问题,因为PageOffice的获取word中表格数据的工作是在客户端执行的,确实也符合了分布式计算思想,减轻服务器端压力,最为强悍的是,用PageOffice竟然可以从word表格中用很简单一句代码把图片提取出来,实在是出乎意料……

顶礼膜拜中……

膜拜完毕再回回神儿,PageOffice是收费的,但是事半功倍,而且还能实现许多POI无法实现的功能。如果确实预算紧张,还是需要用POI,再难用也要捏着鼻子用了……,闲话少撤,看代码实现。

POI获取word表格中数据的代码如下:

====================================

package PoiTest;

import java.io.FileInputStream;

import org.apache.poi.hwpf.HWPFDocument;

import org.apache.poi.hwpf.usermodel.Paragraph;

import org.apache.poi.hwpf.usermodel.Range;

import org.apache.poi.hwpf.usermodel.Table;

import org.apache.poi.hwpf.usermodel.TableCell;

import org.apache.poi.hwpf.usermodel.TableIterator;

import org.apache.poi.hwpf.usermodel.TableRow;

import org.apache.poi.poifs.filesystem.POIFSFileSystem;

public class ExportDocImpl {

public static void testWord() {

try {

FileInputStream in = new FileInputStream("F:\\table.doc");// 加载文档

POIFSFileSystem pfs = new POIFSFileSystem(in);

HWPFDocument hwpf = new HWPFDocument(pfs);

Range range = hwpf.getRange();// 获取文档的读取范围

TableIterator it = new TableIterator(range);

// 迭代文档中的表格

while (it.hasNext()) {

Table tb = (Table) it.next();

// 迭代行,默认从0开始

for (int i = 0; i < tb.numRows(); i++) {

TableRow tr = tb.getRow(i);

// 迭代列,默认从0开始

for (int j = 0; j < tr.numCells(); j++) {

TableCell td = tr.getCell(j);

// System.out.println(td.text());

// 取得单元格的内容

for (int k = 0; k < td.numParagraphs(); k++) {

Paragraph para = td.getParagraph(k);

String s = para.text();

System.out.println(s.replaceAll("\r", "").replaceAll(" ","")+":"+s2.replaceAll("\r", "").replaceAll(" ",""));

}

}

}

}

in.close();

} catch (Exception e) {

e.printStackTrace();

}

}

public static void main(String[] args){

testWord();

}

}

PageOffice获取word表格中数据的代码:

=====================================

import com.zhuozhengsoft.pageoffice.*;

import com.zhuozhengsoft.pageoffice.wordreader.*    ;

// 创建word文件处理对象

WordDocument doc = new WordDocument(request, response);

DataRegion dataReg = doc.openDataRegion("PO_table");

SimpleDateFormat format = new SimpleDateFormat("yyyyMMddHHmmSS");

//获取Word中指定单元格内插入的图片

Shape shape = dataReg.openTable(1).openCellRC(1,5).openShape(1);

String path = "photos/" + format.format(new Date()) + ".jpg";

String PhotoUrl = request.getSession().getServletContext()

.getRealPath(path);

shape.saveAsJPG(PhotoUrl);//保存图片到某个目录下

Table table = dataReg.openTable(1);

//从Word中的table获取数据

String Name = table.openCellRC(1, 2).getValue();

String Sex = table.openCellRC(2, 2).getValue();

String EduGrade = table.openCellRC(2, 4).getValue();

String Profession = table.openCellRC(3, 2).getValue();

String Job = table.openCellRC(3, 4).getValue();

String Experience = table.openCellRC(4, 2).getValue();

String Address = table.openCellRC(6, 3).getValue();

String Email = table.openCellRC(7, 3).getValue();

String Phone = table.openCellRC(8, 3).getValue();

doc.close();

PageOffice的以上代码是从例子代码里拷贝出来的,可以从PageOffice的官网下载中心下载“PageOffice for JAVA Word ResumeDemo[示例代码]”看看里面的具体代码和实现效果。需要说明一点,PageOffice中提到了一个数据区域(DataRegion)的概念,其实所谓的数据区域本质上就是书签,但是这个书签必须以“PO_”开头,编程的时候代码里这个前缀还必须大写,虽然有这么一点不方便,但是好处很大,如果word文件中有多个表格的话,可以用数据区域去指定PageOffice获取word中哪个表格的数据,定位非常方便,比方说PO_Table的书签里有一个表格,那么不管这个表格在整个word文件中是第几个表(word中的表格没有名称只有Index,从文件头到末尾依次编号的)用doc.openDataRegion("PO_table").openTable(1);总是可以获取到这个表格的数据,非常方便,用POI就不行了,表格、图片位置移动,代码必须重写。

就写这么多吧,做个共享,希望对大家都有帮助。

java读取word表格中的数据_JAVA获取word表格中数据的方案相关推荐

  1. java全文检索word中的内容_java获取word里面的文本

    需求场景 开发的web办公系统如果需要处理大量的Word文档(比如有成千上万个文档),用户一定提出查找包含某些关键字的文档的需求,这就要求能够读取 word 中的文字内容,而忽略其中的文字样式.表格. ...

  2. java给xml加入值,怎么用java读取XML文件里的值并加入jsp页面中的下拉列表中

    如何用java读取XML文件里的值并加入jsp页面中的下拉列表中? 如何用java读取XML文件里的值并加入jsp页面中的下拉列表中? java xml jsp 分享到: ------解决方案---- ...

  3. 易游数据劫持获取和易游取数据工具

    易游数据劫持获取和易游取数据 大家注意看使用方法 字就不多打了,至于有什么用,会山寨验证都懂 不懂的建议去学习下基础 易游key 78C97F700AE542A6869C5922572D0F56 版本 ...

  4. java 从excel中读取数据_java如何从excel中读出数据

    package myexceltest; import jxl.*; import java.io.*; import jxl.write.*; /** * java读取Excel表格,拷贝.更新Ex ...

  5. c# 获取word表格中的内容_Java 获取、删除Word文本框中的表格

    本文介绍如何来获取Word文本框中包含的表格,以及删除表格. 程序测试环境包括: IDEA JDK 1.8.0 Spire.Doc.jar 注:jar导入,可通过创建Maven程序项目,并在pom.x ...

  6. java读取qq邮箱_java获取qq邮箱中的好友列表

    评论 # re: java获取qq邮箱中的好友列表 2009-05-07 20:56 咖啡@可乐 # re: java获取qq邮箱中的好友列表 2009-05-08 09:07 EverestSnow ...

  7. java excel data 导入数据_java实现导入导出excel数据

    项目需要,要实现一个导入导出excel的功能,于是,任务驱动着我学习到了POI和JXL这2个java操作Excel的插件. 一.POI和JXL介绍 1.POI:是对所有office资源进行读写的一套工 ...

  8. java文件中查找字符串_Java 在本地文件中查找固定字符串

    适用范围:只适用于在文本文档中查找(如,txt.java.c等等,并不适用与doc.xls等等这些文件),可嵌套文件夹.但是对中文不支持. 例如:文件夹:F:/demo 子文件夹:F:/demo/er ...

  9. java word模板替换多行_java poi word模板替换段落的换行显示

    在poi操作word模板进行数据替换时,会存在替换的段落需要换行的情况,由于传入的都是字符串,之前在网上搜索过一些处理方法都没有效果,如给字符串添加:"\r","\r\n ...

最新文章

  1. 人工智能为人们减肥操碎了心
  2. Shell 脚本编程 基本语法:
  3. sql语句中`和'两个符号的区别
  4. 什么是敏捷_什么是敏捷?
  5. 开源之旅之开源企业软件采购指南
  6. 多线程篇三:线程同步
  7. 联盛德W801系列9-wifi和4G模块(air724ug)并存使用MQTT总结
  8. VBA实现EXCEL随机本地随机刷题
  9. 百度搜索引擎都有哪些算法
  10. 频繁默认网关不可用_Win10经常断网提示默认网关不可用的解决方法
  11. 3-增量序列{3,2,1}的希尔排序时间复杂度分析
  12. c#把word文档转换为html页面
  13. 大数定理详解(转载)
  14. LINUX NGINX 环境禁止访问指定后缀文件
  15. 2007年中国地方门户网站市场规模达6.1亿元
  16. Java书签 #用Java生成指定位数不重复随机数
  17. linux下更新Cmake,包括cmake下载缓慢解决方案
  18. 《Effective C++》读书笔之六 Item 6. Explicitly disallow the use of compile-generated functions
  19. Python_基础语法_字符串基本操作__声明方式_占位符_切片_转义字符_加密解密(6)
  20. linux 进程间通信及makefile 无名管道/有名管道/共享内存/信号/消息队列

热门文章

  1. F - Color the ball
  2. 【图像去雾】基于matlab颜色衰减先验图像去雾【含Matlab源码 2036期】
  3. uboot启动时flash擦除大小问题
  4. C#程序打印AX2012的SSRS
  5. Matlab 2018a安装教程和破解方法(附Crack文件)
  6. axios拦截器作用及工作流程详解
  7. SQL中的in、not in语句遇到null时的坑点
  8. 100行代码实现数字滚动抽奖功能
  9. matlab bsxfun memory,matlab之bsxfun函数
  10. csgo准星设置代码_csgo准星设置指令