maven构建的项目-->pom.xml文件

eclipse提供Dependencies直接添加依赖jar包的工具:直接搜索poi以及poi-ooxml即可,maven会自动依赖需要的jar包:

poi提供microsoft office旧版本支持,eg .xls Excel

poi-ooxml提供microsoft office新版本支持,eg .xlsx Excel

或者手动修改pom.xml,在添加jar包依赖的地方加入

翻过这道山,就有人听到你的故事。

1

2 org.apache.poi

3 poi

4 3.10-FINAL

5

1

2 org.apache.poi

3 poi-ooxml

4 3.10-FINAL

5

java使用poi读取doc和docx文件(maven自动导入依赖包)

于是在网上搜寻了一阵之后才发现原来doc文档和excel一样不能用普通的io流的方法来读取,而是也需要用poi,于是进行了一番尝试后,终于以正确的编码格式读取了这个doc文件。

在网上搜索的过程中发现doc和docx的读取方法是不一样的,于是顺带也学了一下docx文件的简单读取。

一、导包:

doc文件的读取,需要导入poi-scratchpad的jar包和相关依赖包:

docx文件读取,需要导入poi-ooxml的jar包和相关依赖包:

我用的是maven构建项目,相关的依赖包会自动导入,maven导包配置如下:

1

2 org.apache.poi

3 poi-ooxml

4 3.8

5

6

7 org.apache.poi

8 poi-scratchpad

9 3.8

10

二、读取文件的代码:

1、doc文件读取简单示例:

1 public static void readAndWriterTest3() throws IOException {

2 File file = new File("C:\\Users\\tuzongxun123\\Desktop\\aa.doc");

3 String str = "";

4 try {

5 FileInputStream fis = new FileInputStream(file);

6 HWPFDocument doc = new HWPFDocument(fis);

7 String doc1 = doc.getDocumentText();

8 System.out.println(doc1);

9 StringBuilder doc2 = doc.getText();

10 System.out.println(doc2);

11 Range rang = doc.getRange();

12 String doc3 = rang.text();

13 System.out.println(doc3);

14 fis.close();

15 } catch (Exception e) {

16 e.printStackTrace();

17 }

18 }

2、docx文件读取简单示例:

1 public static void readAndWriterTest4() throws IOException {

2 File file = new File("C:\\Users\\tuzongxun123\\Desktop\\aa.docx");

3 String str = "";

4 try {

5 FileInputStream fis = new FileInputStream(file);

6 XWPFDocument xdoc = new XWPFDocument(fis);

7 XWPFWordExtractor extractor = new XWPFWordExtractor(xdoc);

8 String doc1 = extractor.getText();

9 System.out.println(doc1);

10 fis.close();

11 } catch (Exception e) {

12 e.printStackTrace();

13 }

14 }

//20171218修改

我并没有在工作中操作过word,这篇博客也只是一时兴起所做,因此写的很简单。

而最近陆续有朋友找我询问相关的问题,其中有好几个都在询问依赖包有哪些,为了避免一再回答这种问题,特将依赖包截图:

范仁义 2018-01-01 14:30 阅读:1933 评论:0 推荐:0 编辑

范仁义 2018-01-01 14:09 阅读:176 评论:0 推荐:0 编辑

范仁义 2017-12-31 09:35 阅读:915 评论:0 推荐:1 编辑

范仁义 2017-12-31 09:33 阅读:1341 评论:0 推荐:1 编辑

范仁义 2017-12-30 08:54 阅读:1388 评论:0 推荐:0 编辑

范仁义 2017-12-30 02:13 阅读:1534 评论:0 推荐:0 编辑

范仁义 2017-12-30 01:33 阅读:293 评论:0 推荐:0 编辑

范仁义 2017-09-27 10:57 阅读:624 评论:0 推荐:1 编辑

java读取docx_java使用poi读取doc和docx文件相关推荐

  1. java poi生.docx_java – Apache POI或docx4j处理docx文件

    披露:我领导docx4j项目 虽然docx4j也可以处理pptx和xlsx,但它主要用于docx操作.作为例证,在写作时,docx4j forum中有近1000个主题.pptx论坛只有10%的音量. ...

  2. java 读取 doc_java使用poi读取doc和docx文件的实现示例

    这几天在学习java io流的东西,有一个网友看到博客后问了一个问题,就是说他的doc文档为什么用我所说的方法死活就是乱码. 我一开始以为是他方法问题,结果自己试了之后发现和他的结果一样也是乱码. 于 ...

  3. Java教程:使用POI读取excel文档(根据BV1bJ411G7Aw整理)

    Java教程:使用POI读取excel文档(根据BV1bJ411G7Aw整理) 最近公司需要我做一个导出Excel表格的功能,为此来学习一下POI,在这里记录一下学习笔记.B站直接搜BV1bJ411G ...

  4. Apache POI 读取 Word 表格数据(doc 和 docx 后缀)

    简要 因为实习工作的原因, 需要从 word 文件中读取数据,而这些 word 文件的内容都是表格的形式. 引入 jar 包 两种方式: 通过 Maven 引入到项目中(强烈推荐这种) <dep ...

  5. java 读取doc文件_如何在java中读取Doc或Docx文件?

    我想在 java中读一个word文件 import org.apache.poi.poifs.filesystem.*; import org.apache.poi.hpsf.DocumentSumm ...

  6. 一图看懂 docx 读取、查询、修改 Ms Word docx 文件, 资料整理+笔记(大全)

    本文由 大侠(AhcaoZhu)原创,转载请声明. 链接: https://blog.csdn.net/Ahcao2008 一图看懂 docx 读取.查询.修改 Ms Word docx 文件, 资料 ...

  7. php格式转换成docx,如何在PHP中修改.doc或.docx文件

    我必须修改php中上传的.doc或.docx文件.我用谷歌搜索,但我只发现了如何阅读,却没有. 我想要原样的Word文件,并将文本放在该MS Word文件的底部. 怎么可能有人知道,请回复. 谢谢, ...

  8. Python在Linux,Windows上打开有密doc,docx文件(密码已知)

    Python在Linux,Windows上打开有密doc,docx文件(密码已知) Linux Windows Linux Install: pip install msoffcrypto-tool ...

  9. php 上传.doc .docx文件,无法上传doc和docx文件

    在这里我试图上传pdf,doc和docx文件. PDF文件正在上传,但doc和docx文件未上传.我在form标记中保留了enctype="multipart/form-data" ...

最新文章

  1. SpringBoot 框架中 使用Spring Aop 、创建注解、创建枚举类 使用过程记录
  2. android 手机号码去重,第135天:移动端开发经验总结
  3. 关于Android HTTP边下边播
  4. 微型计算机技术习题,微型计算机技术课后习题一二三章答案
  5. 最靠谱的解决 Ubuntu 18.04 / Linux mint 19 安装网易云音乐 不能正常点击启动问题
  6. Web 2.0的个性化存储需求
  7. [转载][记录]javascript生成不重复的随机数
  8. SqlServer按时间自动生成生成单据编号
  9. Python 必知的 20 个骚操作!
  10. Extjs可视化设计视频教程三
  11. vue 匹配键盘输入_vue如何监听键盘事件中的按键?
  12. 通过IPv4网络访问IPv6网络 ISATAP隧道配置方法
  13. python爬虫源代码_【Python每日一问】Python爬虫能做什么?
  14. 5款免费的WordPress备份解决方案
  15. SqlParameter的参数值为 null
  16. 学习编程悟出8个字《精辟》!
  17. TFN DG15M 高抗干扰电缆故障测试仪评测
  18. 应用计算机散热的原理是什么,笔记本电脑散热原理与CPU降频技术解析
  19. 川希:普通人通过理财就能实现财务自由?大骗局!
  20. C语言多组输入和字符输入(小白)

热门文章

  1. 应用代码(3)——modbus模板(RTU消息帧)
  2. PID算法在STM32上的实现
  3. 第2节 Kali Linux系统初体验及简单操作
  4. 记录一次微信小程序总是闪退的问题
  5. Ureport2分栏功能
  6. Bugku CTF web 你必须让他停下来 解题思路
  7. 三十多岁的我,为了生活转行Java,开始我的小白之路!
  8. git reset current branch to here
  9. MySQL.MyBatis怎么将查询的两个字段作为Map的key和value
  10. 优信拍集团php面试题_【优信拍PHP面试】一次不错的面试体验,面试官根据实际出发提问。-看准网...