java读取docx_java使用poi读取doc和docx文件
maven构建的项目-->pom.xml文件
eclipse提供Dependencies直接添加依赖jar包的工具:直接搜索poi以及poi-ooxml即可,maven会自动依赖需要的jar包:
poi提供microsoft office旧版本支持,eg .xls Excel
poi-ooxml提供microsoft office新版本支持,eg .xlsx Excel
或者手动修改pom.xml,在添加jar包依赖的地方加入
翻过这道山,就有人听到你的故事。
1
2 org.apache.poi
3 poi
4 3.10-FINAL
5
1
2 org.apache.poi
3 poi-ooxml
4 3.10-FINAL
5
java使用poi读取doc和docx文件(maven自动导入依赖包)
于是在网上搜寻了一阵之后才发现原来doc文档和excel一样不能用普通的io流的方法来读取,而是也需要用poi,于是进行了一番尝试后,终于以正确的编码格式读取了这个doc文件。
在网上搜索的过程中发现doc和docx的读取方法是不一样的,于是顺带也学了一下docx文件的简单读取。
一、导包:
doc文件的读取,需要导入poi-scratchpad的jar包和相关依赖包:
docx文件读取,需要导入poi-ooxml的jar包和相关依赖包:
我用的是maven构建项目,相关的依赖包会自动导入,maven导包配置如下:
1
2 org.apache.poi
3 poi-ooxml
4 3.8
5
6
7 org.apache.poi
8 poi-scratchpad
9 3.8
10
二、读取文件的代码:
1、doc文件读取简单示例:
1 public static void readAndWriterTest3() throws IOException {
2 File file = new File("C:\\Users\\tuzongxun123\\Desktop\\aa.doc");
3 String str = "";
4 try {
5 FileInputStream fis = new FileInputStream(file);
6 HWPFDocument doc = new HWPFDocument(fis);
7 String doc1 = doc.getDocumentText();
8 System.out.println(doc1);
9 StringBuilder doc2 = doc.getText();
10 System.out.println(doc2);
11 Range rang = doc.getRange();
12 String doc3 = rang.text();
13 System.out.println(doc3);
14 fis.close();
15 } catch (Exception e) {
16 e.printStackTrace();
17 }
18 }
2、docx文件读取简单示例:
1 public static void readAndWriterTest4() throws IOException {
2 File file = new File("C:\\Users\\tuzongxun123\\Desktop\\aa.docx");
3 String str = "";
4 try {
5 FileInputStream fis = new FileInputStream(file);
6 XWPFDocument xdoc = new XWPFDocument(fis);
7 XWPFWordExtractor extractor = new XWPFWordExtractor(xdoc);
8 String doc1 = extractor.getText();
9 System.out.println(doc1);
10 fis.close();
11 } catch (Exception e) {
12 e.printStackTrace();
13 }
14 }
//20171218修改
我并没有在工作中操作过word,这篇博客也只是一时兴起所做,因此写的很简单。
而最近陆续有朋友找我询问相关的问题,其中有好几个都在询问依赖包有哪些,为了避免一再回答这种问题,特将依赖包截图:
范仁义 2018-01-01 14:30 阅读:1933 评论:0 推荐:0 编辑
范仁义 2018-01-01 14:09 阅读:176 评论:0 推荐:0 编辑
范仁义 2017-12-31 09:35 阅读:915 评论:0 推荐:1 编辑
范仁义 2017-12-31 09:33 阅读:1341 评论:0 推荐:1 编辑
范仁义 2017-12-30 08:54 阅读:1388 评论:0 推荐:0 编辑
范仁义 2017-12-30 02:13 阅读:1534 评论:0 推荐:0 编辑
范仁义 2017-12-30 01:33 阅读:293 评论:0 推荐:0 编辑
范仁义 2017-09-27 10:57 阅读:624 评论:0 推荐:1 编辑
java读取docx_java使用poi读取doc和docx文件相关推荐
- java poi生.docx_java – Apache POI或docx4j处理docx文件
披露:我领导docx4j项目 虽然docx4j也可以处理pptx和xlsx,但它主要用于docx操作.作为例证,在写作时,docx4j forum中有近1000个主题.pptx论坛只有10%的音量. ...
- java 读取 doc_java使用poi读取doc和docx文件的实现示例
这几天在学习java io流的东西,有一个网友看到博客后问了一个问题,就是说他的doc文档为什么用我所说的方法死活就是乱码. 我一开始以为是他方法问题,结果自己试了之后发现和他的结果一样也是乱码. 于 ...
- Java教程:使用POI读取excel文档(根据BV1bJ411G7Aw整理)
Java教程:使用POI读取excel文档(根据BV1bJ411G7Aw整理) 最近公司需要我做一个导出Excel表格的功能,为此来学习一下POI,在这里记录一下学习笔记.B站直接搜BV1bJ411G ...
- Apache POI 读取 Word 表格数据(doc 和 docx 后缀)
简要 因为实习工作的原因, 需要从 word 文件中读取数据,而这些 word 文件的内容都是表格的形式. 引入 jar 包 两种方式: 通过 Maven 引入到项目中(强烈推荐这种) <dep ...
- java 读取doc文件_如何在java中读取Doc或Docx文件?
我想在 java中读一个word文件 import org.apache.poi.poifs.filesystem.*; import org.apache.poi.hpsf.DocumentSumm ...
- 一图看懂 docx 读取、查询、修改 Ms Word docx 文件, 资料整理+笔记(大全)
本文由 大侠(AhcaoZhu)原创,转载请声明. 链接: https://blog.csdn.net/Ahcao2008 一图看懂 docx 读取.查询.修改 Ms Word docx 文件, 资料 ...
- php格式转换成docx,如何在PHP中修改.doc或.docx文件
我必须修改php中上传的.doc或.docx文件.我用谷歌搜索,但我只发现了如何阅读,却没有. 我想要原样的Word文件,并将文本放在该MS Word文件的底部. 怎么可能有人知道,请回复. 谢谢, ...
- Python在Linux,Windows上打开有密doc,docx文件(密码已知)
Python在Linux,Windows上打开有密doc,docx文件(密码已知) Linux Windows Linux Install: pip install msoffcrypto-tool ...
- php 上传.doc .docx文件,无法上传doc和docx文件
在这里我试图上传pdf,doc和docx文件. PDF文件正在上传,但doc和docx文件未上传.我在form标记中保留了enctype="multipart/form-data" ...
最新文章
- SpringBoot 框架中 使用Spring Aop 、创建注解、创建枚举类 使用过程记录
- android 手机号码去重,第135天:移动端开发经验总结
- 关于Android HTTP边下边播
- 微型计算机技术习题,微型计算机技术课后习题一二三章答案
- 最靠谱的解决 Ubuntu 18.04 / Linux mint 19 安装网易云音乐 不能正常点击启动问题
- Web 2.0的个性化存储需求
- [转载][记录]javascript生成不重复的随机数
- SqlServer按时间自动生成生成单据编号
- Python 必知的 20 个骚操作!
- Extjs可视化设计视频教程三
- vue 匹配键盘输入_vue如何监听键盘事件中的按键?
- 通过IPv4网络访问IPv6网络 ISATAP隧道配置方法
- python爬虫源代码_【Python每日一问】Python爬虫能做什么?
- 5款免费的WordPress备份解决方案
- SqlParameter的参数值为 null
- 学习编程悟出8个字《精辟》!
- TFN DG15M 高抗干扰电缆故障测试仪评测
- 应用计算机散热的原理是什么,笔记本电脑散热原理与CPU降频技术解析
- 川希:普通人通过理财就能实现财务自由?大骗局!
- C语言多组输入和字符输入(小白)
热门文章
- 应用代码(3)——modbus模板(RTU消息帧)
- PID算法在STM32上的实现
- 第2节 Kali Linux系统初体验及简单操作
- 记录一次微信小程序总是闪退的问题
- Ureport2分栏功能
- Bugku CTF web 你必须让他停下来 解题思路
- 三十多岁的我,为了生活转行Java,开始我的小白之路!
- git reset current branch to here
- MySQL.MyBatis怎么将查询的两个字段作为Map的key和value
- 优信拍集团php面试题_【优信拍PHP面试】一次不错的面试体验,面试官根据实际出发提问。-看准网...