1、下载poi的jar包

    下载地址:https://www.apache.org/dyn/closer.lua/poi/release/bin/poi-bin-3.17-20170915.tar.gz

    

    下载解压后用到的jar包,这些包都能在下载的文件夹中找到

    

  2、代码

//package com.word;
import java.io.*;import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;import org.apache.poi.POIXMLDocument;
import org.apache.poi.POIXMLTextExtractor;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
/*** @Author:sks* @Description:* @Date:Created in 15:49 2018/1/24* @Modified by:**/
public class poi_doc {public static void main(String[] args)  {String filePath = "D:/work/Solr/ImportData/test.docx";String content = readWord(filePath);}public static String readWord(String path) {String buffer = "";try {if (path.endsWith(".doc")) {InputStream is = new FileInputStream(new File(path));WordExtractor ex = new WordExtractor(is);buffer = ex.getText();ex.close();} else if (path.endsWith("docx")) {OPCPackage opcPackage = POIXMLDocument.openPackage(path);POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);buffer = extractor.getText();extractor.close();} else {System.out.println("此文件不是word文件!");}} catch (Exception e) {e.printStackTrace();}return buffer;}}

java 实现poi方式读取word文件内容相关推荐

  1. c语言读取word文件内容,c 读取word c 读取word文档

    c++如何读取word 基本步骤(1)创建)一个 MFC 的程序工程. 注意:在VC中对WORD进行操作需要在MFC AppWizard - Step 2 of4中的Automaiton选项上打上勾. ...

  2. java利用poi模板导出word文件

    注意:  doc文件的读取,需要导入poi-scratchpad包: docx文件读取,需要导入poi-ooxml包: 一.引入pom <dependency><groupId> ...

  3. poi方式读取word目录大纲

    如下图的word目录大纲该怎么获取呢? 试过用jacob方式确实可以直接读取到大纲的编号,但是jacob不支持在linux上的调用(不确定反正网络上都说不支持,自己目前没有找到可以解决linux如何调 ...

  4. Java使用GeoTools轻松读取shapefile文件内容

    日常GIS开发中难免会将一些shapefile文件数据读取存入数据库中,很多人第一想到的就是使用GeoTools操作和显示地图的开源Java 代码库. 生活捉弄人,因为项目需要对于从来没有做过GIS相 ...

  5. Java:POI方式实现Word转html/htm

    2019独角兽企业重金招聘Python工程师标准>>> 这里就不对POI做过多的说明了,贴个官网 https://poi.apache.org/,随意看看. 首先搞清楚下要将doc/ ...

  6. POI读取word文件,(支持HSSF和XSSF两种方式)

    POI读取word文件,(支持HSSF和XSSF两种方式) 参考:HSSF,XSSF,SXSSF三种方式 1.引用maven(版本必须一致) <dependency><groupId ...

  7. Java POI 读取word文件

    Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能. 1.读取word 2003及word 2007需要 ...

  8. java中读取properties文件内容五种方式

    一.背景 最近,在项目开发的过程中,遇到需要在properties文件中定义一些自定义的变量,以供java程序动态的读取,修改变量,不再需要修改代码的问题.就借此机会把Spring+SpringMVC ...

  9. 五种方式让你在java中读取properties文件内容不再是难题

    2019独角兽企业重金招聘Python工程师标准>>> 方式1.通过context:property-placeholder加载配置文件jdbc.properties中的内容 < ...

  10. Java读取word文件,字体,颜色

    在Android读取Word文件时,在网上查看时可以用tm-extractors,但好像没有提到怎么读取Word文档中字体的颜色,字体,上下标等相关的属性.但由于需要,要把doc文档中的内容(字体,下 ...

最新文章

  1. [记录]使用openGL显示点云的一个程序
  2. mysql 触发器介绍
  3. ssh scp文件同步(先不搞了)
  4. Coolite 中GridView行按钮取行ID并调用服务器端代码
  5. php读取子目录下文件内容,php小代码----目录下读取子文件或子目录_PHP教程
  6. 被江苏网警点名后 咪蒙发道歉信:公众号停更2个月 微博永久关停
  7. USB Mass Storage大容量存储 The Thirteen Class章节的理解
  8. 计算机二级做的完吗,大学计算机二级都没过 毕业后却做起了IT。。。。。
  9. 【信号处理】信号与系统 电子课本(郑君里)
  10. 计算机网络——计算机网络病毒和黑客
  11. 洛谷 P3137 [USACO16FEB]圆形谷仓Circular Barn_Silver
  12. 常用的机器学习算法(使用 Python 和 R 代码)
  13. 大漠穷秋:一个写代码的浪人|码云封面人物第 17 期
  14. 虚幻四Gameplay Ability System入门学习合集
  15. 2013 CVPR点评
  16. Oracle存储过程打印输出错误信息、行号,快速排查
  17. 入职前的背景调查到底在查什么?
  18. VSPD+XCOM+Proteus仿真stm32串口通信
  19. ECIF OCRM ACRM关系
  20. 【推荐】2022年物流快递行业市场行情分析投资趋势产业发展前景调研究报告(附件中为网盘地址,报告持续更新)

热门文章

  1. 去掉表中字段空的空格或换行符
  2. 实现Qt日志功能并输出到文件(qDebug\qWarning\ qCritical\qFatal)
  3. dom4j解析XML文件,通过属性查找节点,出现异常
  4. 在地图上点击一下,在图层上画一个点,并显示相关的信息
  5. 公交车刮擦 两名驾驶员丢下乘客下车“开战”
  6. xcode 此工作区的项目包含使用Swift 3.x开发的源代码。此版本的Xcode不支持生成或迁移Swift 3.x目标。使用Xcode 10.1将代码迁移到Swift 4。
  7. FZU2105 Digits Count(按位建线段树)题解
  8. 我的第一场比赛——金马五校赛
  9. React:组件的生命周期
  10. 2018.10.24