学习POI处理word
为什么要用POI。因为POI是一款简单的,用于抽取word文档成string的开源java。
一,下载POI
首先从http://poi.apache.org/下载二进制发布包。
poi-bin-3.8-beta4-20110826.zip
二,解压
三,在eclipse中新建一个java项目 导入日志相关的包commons-logging-1.1.jar、log4j-1.2.13.jar。
还有poi-3.8-beta4-20110826.jar以及poi-scratchpad-3.8-beta4-20110826.jar。
导入的过程:一是建立lib目录;二是向目录中拷入上述四个文件;三是,用build path ——add jars,导入相关包文件。
四,第一个POI程序
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
public class TestWord {
/**
* @param args
* @throws IOException
* @throws FileNotFoundException
*/
public static void main(String[] args) throws FileNotFoundException, IOException {
String filesname = "Hello.doc";
POIFSFileSystem fs = new POIFSFileSystem(new FileInputStream(filesname));
HWPFDocument doc = new HWPFDocument(fs);
WordExtractor we = new WordExtractor(doc);
String str = we.getText() ;
System.out.println(str);
}
}
学习POI处理word相关推荐
- Java POI解析Word提取数据存储在Excel
JavaPOI解析word提取数据到excel 一.了解POI POI以前有了解,这次需求是解析word读取其中标题,还有内容赛选获取自己想要的内容 经过两天的学习,开始熟悉Java这么读取word和 ...
- java word 题目导入_java使用poi导入word题库
java使用poi导入word题库 包含单选,多选,填空,判断 //word图示 //具体代码,仅适合本人自己的格式 //代码一 InputStream inputStream = file.getI ...
- java poi读取word 2003, 2007文档
前言 最近本来想写linux的 但是工作太忙一直腾不出手学习. 所以我打算最近出: 1.shiro 一个权限模块定制化很强的安全框架. 2. elasticSearch 全文检索, 分词分片. 3. ...
- POI对word进行基本导出(段落、表格)
简单使用POI对word进行基本导出(段落.表格) 使用场景 最近遇到帮同事做一个多选运动员选择几个运动员就导出几个运动员生成表格,同时还要输出固定文字的word的这样一个功能.我公司一般导出功能都是 ...
- [实用][更新中]Java Apache POI 打印Word文档工具(含文本替换,动态表格功能)
[实用][更新中]Java Apache POI 打印Word文档工具(含文本替换,动态表格功能) 基于Apache POI对Word进行操作 一.基于Apache POI封装的word文档工具V1. ...
- poi解析word文档(解析表格,emf,wmf,svg转jpg图片)
POI解析word文档 poi解析word的表格: 提前先准备需要的jar包: <!-- poi --><dependency><groupId>org.a ...
- Java:Java的jar包之POI的简介、安装、使用方法(基于POI将Word、Excel、PPT转换为html)之详细攻略
Java:Java的jar包之POI的简介.安装.使用方法(基于POI的转换-Word.Excel.Ppt等转html)之详细攻略 目录 POI的简介 1.基本功能 POI的安装 POI的使用方法(基 ...
- POI获取WORD信息
最近由于工作需要,调研了一下关于poi获取word字体信息方面的方法,在这里mark一下. 首先word格式分为doc和docx,分别利用HWPFDocument和XWPFDocument对文档进行解 ...
- POI读取word文件,(支持HSSF和XSSF两种方式)
POI读取word文件,(支持HSSF和XSSF两种方式) 参考:HSSF,XSSF,SXSSF三种方式 1.引用maven(版本必须一致) <dependency><groupId ...
最新文章
- hdu 2067 兔子板
- TCP超时与重传机制与拥塞避免
- emmap erlang_erlang的map基本使用
- 使用uni-app报错this.setData is not a function
- Java的JDBC事务详解
- javaScript实现E-mail 验证
- 前端学习(2838):swiper等比
- visual studio code怎么改成中文?Visual Studio Code Insiders for Mac中文修复版
- linux 网络有关的5个命令
- php多维数组key交换,php 根据key计算多维数组的和功能实例
- 有些新手小白创业者开奶茶店,为什么总是容易上当受骗呢?
- Opencascade关键词
- 柳传志退休:激荡三十五年
- html怎么添加banner图,如何在wordpress首页中添加banner图片?
- debian/ubuntu 64bit 安装 android sdk时adb无法编译的问题
- Viola-Jones检测器(VJ)---学习笔记
- MATLAB:预设矩阵的大小与不预设的时间差距
- Oracle 的SQL*LOADER中optionally enclosed的作用
- 部署https证书的端口是什么意思
- 201571030121 《小学生四则运算练习软件》结对项目
热门文章
- 【leetcode】91. Decode Ways A-Z的字母表示1-26的数字,反向破解多少种字符串的可能性...
- jdk的安装(redhat)
- Cannot drop the database ‘XXX’ because it is being used for replication.
- 转载--数据库sql取整操作
- 初次遇见Visual Studio 2008 Beta 2 中的bug
- Flink SQL中的函数
- BI软件的作用有哪些
- 如何提高使用物联网卡应用的安全性
- 物联网卡封卡原因有哪些
- [运维笔记] - (命令).Windows server常用网络相关命令