txt doc rtf html,JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例.docx
JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例
JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例??2012-06-29 17:13:08|??分类:JAVA |??标签: |字号大中小?订阅以下是Java对几种文本文件内容读取代码。其中,OFFICE文档(WORD,EXCEL)使用了POI控件,PDF使用了PDFBOX控件。查看相关控件的下载地址和配置方法。转自:/allan811112/blog/item/d77b70492f0a65fb82025c3b.htmlWORD Java代码package textReader; import java.io.*; import org.apache.poi.hwpf.extractor.WordExtractor; public class WordReader { public WordReader(){ } /** * @param filePath 文件路径* @return 读出的Word的内容*/ public String getTextFromWord(String filePath){ String result = null; File file = new File(filePath); try{ FileInputStream fis = new FileInputStream(file); WordExtractor wordExtractor = new WordExtractor(fis); result = wordExtractor.getText(); }catch(FileNotFoundException e){ e.printStackTrace(); }catch(IOException e){ e.printStackTrace(); }; return result; } } EXCEL Java代码package textReader; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.hssf.usermodel.HSSFSheet; import org.apache.poi.hssf.usermodel.HSSFRow; import org.apache.poi.hssf.usermodel.HSSFCell; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; public class ExcelReader { @SuppressWarnings("deprecation") /** * @param filePath 文件路径* @return 读出的Excel的内容*/ public String getTextFromExcel(String filePath) { StringBuffer buff = new StringBuffer(); try { //创建对Excel工作簿文件的引用HSSFWorkbook wb = new HSSFWorkbook(new FileInputStream(filePath)); //创建对工作表的引用。????????? for (int numSheets = 0; numSheets < wb.getNumberOfSheets(); numSheets++) { if (null != wb.getSheetAt(numSheets)) { HSSFSheet aSheet = wb.getSheetAt(numSheets);//获得一个sheet for (int rowNumOfSheet = 0; rowNumOfSheet <= aSheet.getLastRowNum(); rowNumOfSheet++) { if (null != aSheet.getRow(rowNumOfSheet)) { HSSFRow aRow = aSheet.getRow(rowNumOfSheet); //获得一个行for (int cellNumOfRow = 0; cellNumOfRow <= aRow.getLastCellNum(); cellNumOfRow++) { if (null != aRow.getCell(cellNumOfRow)) { HSSFCell aCell = aRow.getCell(cellNumOfRow);//获得列值switch(aCell.getCellType()){ case HSSFC
txt doc rtf html,JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例.docx相关推荐
- java操作word/excel/pdf等文件技术方案
最近项目中遇到很多对word/excel/pdf等文件的操作,解决方案有好多,开源免费有:利用openoffice组件(需要安装openoffice软件),poi,itext等.也有收费的服务:asp ...
- Linux系统下Java 转换Word到PDF时,结果文档内容乱码的解决方法
本文分享在Linux系统下,通过Java 程序代码将Word转为PDF文档时,结果文档内容出现乱码该如何解决.具体可参考如下内容: 1.问题出现的背景 在Windows系统中,使用Spire.Doc ...
- JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法
OFFICE文档使用POI控件,PDF可以使用PDFBOX0.7.3控件,完全支持中文,用XPDF也行. java2word 是一个在java程序中调用 MS Office Word 文档的组件(类库 ...
- Java处理Word, Excel, PDF文档的4种开源系统的代码例子
原文: http://blog.csdn.net/wzwfly/article/details/1645046 很多人用java进行文档操作时经常会遇到一个问题,就是如何获得word,excel, ...
- java poi- 实现 word Excel pdf ppt 转 HTML
所需要 jar poi-3.17.jar poi-examples-3.17.jar poi-excelant-3.17.jar poi-ooxml-3.17.jar poi-ooxml-schema ...
- java全文检索word中的内容_搜索引擎时对WORD,EXCEL,PDF,POWERPOINT文件全文检索的总结...
搜索引擎时对WORD,EXCEL,PDF,POWERPOINT文件全文检索的总结 (2012-02-12 16:31:59) 标签: pdf文档 幻灯片 pdf文件 全文检索 控件 it JAVA读取 ...
- java操作office和pdf文件java读取word,excel和pdf文档内容
在平常应用程序中,对office和pdf文档进行读取数据是比较常见的功能,尤其在很多web应用程序中.所以今天我们就简单来看一下Java对word.excel.pdf文件的读取.本篇博客只是讲解简单应 ...
- java 操作 word 表格和样式,java读取word表格中的表格 java如何读取word中的excel表格数据...
Java 利用poi 可以直接读取word中的表格保持样式生1.读取word 2003及word 2007需要的jar包 读取 2003 版本(.doc)的word文件相对来说比较简单,只需要 poi ...
- java读取word文档里面的内容(包括doc和docx格式)
java读取word文档里面的内容(包括doc和docx格式) java读取word文档里面的内容(包括doc和docx格式),使用POI架包 使用的POI架包如下 poi-3.16.jar poi- ...
最新文章
- 脑电传感器并不复杂,那精度呢?
- flash 绘图API:绘制基础的图形
- XBOX ONE游戏开发之登陆服务器(一)
- ffmpeg编译gb28181_国标GB28181协议视频推流平台EasyGBD在Linux下编译报“UINT64_C在此作用领域中尚未声明”错误...
- 程序员生活之路--来自程序员爸爸的一封信
- 谈谈CLOSE_WAIT
- Windowserver2012部署always on
- SpaceClaim功能解析与应用介绍
- python之爬取中华诗词网
- 非功能需求分析是什么
- Markdown开发VSCode插件推荐
- SGG前台项目复习笔记
- 什么是TAO以及如何安装和使用TAO
- 未知USB设备(设备描述符请求失败)是什么?
- PCB设计规则总结和原因分析
- 关于Amazon AWS —— 免费的午餐不好吃
- 吊炸天的CNNs,这是我见过最详尽的图解!(下)
- 遥感影像目标检测:从CNN(Faster-RCNN)到Transformer(DETR)
- jQuery获取(设置)自定义属性值
- PHP curl--电信手机号码话费余额
热门文章
- 小米9京东预约破百万!明日正式首销:售价2999元起
- DTMF采用RFC2833进行带内传输的实现[ZT]
- android.view.WindowManager$BadTokenException
- upnp协议和dlna源码理解与修改
- lisp 多边形象限_AutoLISP图程序设计.ppt
- 【Elasticsearch】Elasticsearch 存储桶聚合
- 【kafka】Kafka JMX监控报错 Failed to get broker metrics for BrokerIdentity
- 【elasticsearch】 document 查询原理
- 【Spark】大数据+AI mettup【视频笔记】
- 【Kafka】Kafka WARN Property ssl.keystore.location is not valid (kafka.utils.VerifiableProperties)