1.添加jar包

<dependency><groupId>org.apache.poi</groupId><artifactId>poi</artifactId><version>4.1.0</version></dependency><dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>4.1.0</version></dependency><dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml-schemas</artifactId><version>4.1.0</version></dependency><!-- https://mvnrepository.com/artifact/org.apache.poi/poi-scratchpad --><dependency><groupId>org.apache.poi</groupId><artifactId>poi-scratchpad</artifactId><version>4.1.0</version></dependency>

2.读取所有内容(非表格)

public static String readDoc(String path) {String resullt = "";//首先判断文件中的是doc/docxtry {if (path.endsWith(".doc")) {InputStream is = new FileInputStream(new File(path));WordExtractor extractor = new WordExtractor(is);resullt = extractor.getText();//输出word文档所有的文本System.out.println(extractor.getText());System.out.println("=================1=================");System.out.println("==================2================");//                //输出页脚的内容System.out.println("页脚:" + extractor.getDocument());//                System.out.println("===============4===================");//                //输出当前word文档的元数据信息,包括作者、文档的修改时间等。System.out.println(extractor.getMetadataTextExtractor().getText());System.out.println("===============5===================");//获取各个段落的文本String paraTexts[] = extractor.getParagraphText();for (int i=0; i<paraTexts.length; i++) {System.out.println("Paragraph " + (i+1) + " : " + paraTexts[i]);}//输出当前word的一些信息System.out.println(extractor.getTextFromPieces());System.out.println("=============6=====================");//输出当前word的一些信息System.out.println(extractor.getMetadataTextExtractor());System.out.println("===============7===================");System.out.println(extractor.getEndnoteText());System.out.println("===============8===================");extractor.close();} else if (path.endsWith(".docx")) {OPCPackage opcPackage = POIXMLDocument.openPackage(path);POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);resullt = extractor.getText();extractor.close();} else {System.out.println("此文件不是word文件");}} catch(Exception e){e.printStackTrace();}return resullt;
}

3.读取表格内容

以下代码包含读取段落内容、表格内容

public static void readTableData(String path){try {InputStream is = new FileInputStream(path);XWPFDocument doc = new XWPFDocument(is);List<XWPFParagraph> paras = doc.getParagraphs();for (XWPFParagraph para : paras) {//当前段落的属性//CTPPr pr = para.getCTP().getPPr();System.out.println(para.getText());}//获取文档中所有的表格List<XWPFTable> tables = doc.getTables();List<XWPFTableRow> rows;List<XWPFTableCell> cells;for (XWPFTable table : tables) {//表格属性//CTTblPr pr = table.getCTTbl().getTblPr();//获取表格对应的行rows = table.getRows();for (XWPFTableRow row : rows) {//获取行对应的单元格cells = row.getTableCells();for (XWPFTableCell cell : cells) {System.out.println(cell.getText());}}}is.close();} catch (Exception e) {e.printStackTrace();}}

参考文章:java poi word 表格_java 使用POI 读写word 表格 https://blog.csdn.net/weixin_33045961/article/details/114433011

java poi读取word内容相关推荐

  1. java poi读取word中附件_java poi word读取

    用 poi 读取word文件 . 老是报错 org.apache.poi.poifs.filesystem.NotOLE2FileException: Invalid header signature ...

  2. java poi读取word中附件_java用poi实现对word读取和修改操作

    java编程要实现对word的操作没有vb那种编程语言来得容易,得借助一些开源组件,其中就包括jacob.poi等, 而poi应用得最为广泛,对word2003和2007的读和写word操作都十分方便 ...

  3. java poi读取word 2003, 2007文档

    前言 最近本来想写linux的 但是工作太忙一直腾不出手学习. 所以我打算最近出: 1.shiro 一个权限模块定制化很强的安全框架. 2. elasticSearch 全文检索, 分词分片. 3. ...

  4. Java POI 读取word文件

    Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能. 1.读取word 2003及word 2007需要 ...

  5. java poi读取word中附件_Java POI导入word, 带图片

    1.导入文件示例,word中简历表格模板 2.代码示例分两部分,一部分读取图片 /** * 导入word(基本信息,word格式) * @param staffId * @param baseInfo ...

  6. java poi 读取word图片,Java POI导入word, 带图片

    1.导入文件示例,word中简历表格模板 2.代码示例分两部分,一部分读取图片/** * 导入word(基本信息,word格式) * @param staffId * @param baseInfoF ...

  7. java poi 读取 word图片_Java Poi 根据文字内容 插入 word 图片-Go语言中文社区

    需求描述 如下图,我需要在word里根据一个图片的名字,将名字替换成该图片(公章) 思路: 用POI遍历每一个表格里的每一行的每一个单元格,如果遇到我自己定义的"&章",则 ...

  8. java poi读取word中附件_数据导出生成word附件使用POI的XWPFTemplate对象

    比较常用的实现Java导入.导出Excel的技术有两种Jakarta POI和Java Excel. Jakarta POI 是一套用于访问微软格式文档的Java API.Jakarta POI有很多 ...

  9. java poi无法读取word_poi,word_POI读取word内容的疑问,poi,word,java - phpStudy

    POI读取word内容的疑问 两片内容相同的word,poi分割成XWPFRun集合的时候,发现相同的段落内容有空行. word1打印的段落内容 word2打印的段落内容 代码如下 /** 替换段落中 ...

  10. java word模板poi生成文件_利用poi读取word模板文件生成新的word文档

    利用poi读取word模板文件生成新的word文档 利用poi读取word模板文件,并回填逻辑数据,生成并导出需要的word文档源码.解决模板读取异常问题,提供wordUtils工具类(各种功能实现) ...

最新文章

  1. numpy.array()基本操作
  2. 产品图片无缝水平滚动效果代码
  3. PaddleHub 视频口罩检测
  4. 忠告:不要在愚蠢时间写代码
  5. 在 Lotus Notes 中设置邮件定时发送的方法及代理功能介绍
  6. makefile与stm32工程皮毛了解
  7. headfirst设计模式(2)—观察者模式
  8. java基础知识总结(4)
  9. Python面向对象成员修饰符
  10. 数据采集与数据挖掘是什么?有什么区别?
  11. oracle -00257
  12. Java常量池储存什么_JAVA常量池中存储的常量是什么
  13. Android系统启动流程分析
  14. 2020年中国海洋大学夏令营记录
  15. 美国最常见英文名字排行榜(500名)
  16. 可恢复保险丝的内部结构
  17. 365天英语口语学习_11,收拾餐桌碗碟
  18. 求符号函数sgn(x)的c++程序
  19. 放弃csv,拥抱feather文件
  20. L6 U5 商务方案

热门文章

  1. 最强数据库工具——IDEA
  2. 《终极算法》读书笔记(一)机器学习革命
  3. Web前端笔记和简历模板
  4. sybase常用sql语句
  5. html颜色代码生成器,在线取色配色工具,CSS3渐变色代码生成器-易玩稀有
  6. 我的超休闲游戏作品集
  7. 已解决:如何使用IDEA生成java帮助文档java doc?
  8. 【Latex】教你如何在word中像LaTex那样打公式
  9. 乐高ev3编程 c语言,乐高ev3编程软件下载-乐高EV3机器人编程软件lego mindstorms ev31.0 官方版 - 极光下载站...
  10. 05- 基于UDS协议的故障代码状态字节及检测机制