JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例

JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例??2012-06-29 17:13:08|??分类:JAVA |??标签: |字号大中小?订阅以下是Java对几种文本文件内容读取代码。其中,OFFICE文档(WORD,EXCEL)使用了POI控件,PDF使用了PDFBOX控件。查看相关控件的下载地址和配置方法。转自:/allan811112/blog/item/d77b70492f0a65fb82025c3b.htmlWORD Java代码package textReader; import java.io.*; import org.apache.poi.hwpf.extractor.WordExtractor; public class WordReader { public WordReader(){ } /** * @param filePath 文件路径* @return 读出的Word的内容*/ public String getTextFromWord(String filePath){ String result = null; File file = new File(filePath); try{ FileInputStream fis = new FileInputStream(file); WordExtractor wordExtractor = new WordExtractor(fis); result = wordExtractor.getText(); }catch(FileNotFoundException e){ e.printStackTrace(); }catch(IOException e){ e.printStackTrace(); }; return result; } } EXCEL Java代码package textReader; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.poi.hssf.usermodel.HSSFSheet; import org.apache.poi.hssf.usermodel.HSSFRow; import org.apache.poi.hssf.usermodel.HSSFCell; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; public class ExcelReader { @SuppressWarnings("deprecation") /** * @param filePath 文件路径* @return 读出的Excel的内容*/ public String getTextFromExcel(String filePath) { StringBuffer buff = new StringBuffer(); try { //创建对Excel工作簿文件的引用HSSFWorkbook wb = new HSSFWorkbook(new FileInputStream(filePath)); //创建对工作表的引用。????????? for (int numSheets = 0; numSheets < wb.getNumberOfSheets(); numSheets++) { if (null != wb.getSheetAt(numSheets)) { HSSFSheet aSheet = wb.getSheetAt(numSheets);//获得一个sheet for (int rowNumOfSheet = 0; rowNumOfSheet <= aSheet.getLastRowNum(); rowNumOfSheet++) { if (null != aSheet.getRow(rowNumOfSheet)) { HSSFRow aRow = aSheet.getRow(rowNumOfSheet); //获得一个行for (int cellNumOfRow = 0; cellNumOfRow <= aRow.getLastCellNum(); cellNumOfRow++) { if (null != aRow.getCell(cellNumOfRow)) { HSSFCell aCell = aRow.getCell(cellNumOfRow);//获得列值switch(aCell.getCellType()){ case HSSFC

txt doc rtf html,JAVA读取WORD,EXCEL,PDF,TXT,RTF,HTML文件文本内容的方法示例.docx相关推荐

  1. java操作word/excel/pdf等文件技术方案

    最近项目中遇到很多对word/excel/pdf等文件的操作,解决方案有好多,开源免费有:利用openoffice组件(需要安装openoffice软件),poi,itext等.也有收费的服务:asp ...

  2. Linux系统下Java 转换Word到PDF时,结果文档内容乱码的解决方法

    本文分享在Linux系统下,通过Java 程序代码将Word转为PDF文档时,结果文档内容出现乱码该如何解决.具体可参考如下内容: 1.问题出现的背景 在Windows系统中,使用Spire.Doc ...

  3. JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法

    OFFICE文档使用POI控件,PDF可以使用PDFBOX0.7.3控件,完全支持中文,用XPDF也行. java2word 是一个在java程序中调用 MS Office Word 文档的组件(类库 ...

  4. Java处理Word, Excel, PDF文档的4种开源系统的代码例子

    原文: http://blog.csdn.net/wzwfly/article/details/1645046   很多人用java进行文档操作时经常会遇到一个问题,就是如何获得word,excel, ...

  5. java poi- 实现 word Excel pdf ppt 转 HTML

    所需要 jar poi-3.17.jar poi-examples-3.17.jar poi-excelant-3.17.jar poi-ooxml-3.17.jar poi-ooxml-schema ...

  6. java全文检索word中的内容_搜索引擎时对WORD,EXCEL,PDF,POWERPOINT文件全文检索的总结...

    搜索引擎时对WORD,EXCEL,PDF,POWERPOINT文件全文检索的总结 (2012-02-12 16:31:59) 标签: pdf文档 幻灯片 pdf文件 全文检索 控件 it JAVA读取 ...

  7. java操作office和pdf文件java读取word,excel和pdf文档内容

    在平常应用程序中,对office和pdf文档进行读取数据是比较常见的功能,尤其在很多web应用程序中.所以今天我们就简单来看一下Java对word.excel.pdf文件的读取.本篇博客只是讲解简单应 ...

  8. java 操作 word 表格和样式,java读取word表格中的表格 java如何读取word中的excel表格数据...

    Java 利用poi 可以直接读取word中的表格保持样式生1.读取word 2003及word 2007需要的jar包 读取 2003 版本(.doc)的word文件相对来说比较简单,只需要 poi ...

  9. java读取word文档里面的内容(包括doc和docx格式)

    java读取word文档里面的内容(包括doc和docx格式) java读取word文档里面的内容(包括doc和docx格式),使用POI架包 使用的POI架包如下 poi-3.16.jar poi- ...

最新文章

  1. 脑电传感器并不复杂,那精度呢?
  2. flash 绘图API:绘制基础的图形
  3. XBOX ONE游戏开发之登陆服务器(一)
  4. ffmpeg编译gb28181_国标GB28181协议视频推流平台EasyGBD在Linux下编译报“UINT64_C在此作用领域中尚未声明”错误...
  5. 程序员生活之路--来自程序员爸爸的一封信
  6. 谈谈CLOSE_WAIT
  7. Windowserver2012部署always on
  8. SpaceClaim功能解析与应用介绍
  9. python之爬取中华诗词网
  10. 非功能需求分析是什么
  11. Markdown开发VSCode插件推荐
  12. SGG前台项目复习笔记
  13. 什么是TAO以及如何安装和使用TAO
  14. 未知USB设备(设备描述符请求失败)是什么?
  15. PCB设计规则总结和原因分析
  16. 关于Amazon AWS —— 免费的午餐不好吃
  17. 吊炸天的CNNs,这是我见过最详尽的图解!(下)
  18. 遥感影像目标检测:从CNN(Faster-RCNN)到Transformer(DETR)
  19. jQuery获取(设置)自定义属性值
  20. PHP curl--电信手机号码话费余额

热门文章

  1. 小米9京东预约破百万!明日正式首销:售价2999元起
  2. DTMF采用RFC2833进行带内传输的实现[ZT]
  3. android.view.WindowManager$BadTokenException
  4. upnp协议和dlna源码理解与修改
  5. lisp 多边形象限_AutoLISP图程序设计.ppt
  6. 【Elasticsearch】Elasticsearch 存储桶聚合
  7. 【kafka】Kafka JMX监控报错 Failed to get broker metrics for BrokerIdentity
  8. 【elasticsearch】 document 查询原理
  9. 【Spark】大数据+AI mettup【视频笔记】
  10. 【Kafka】Kafka WARN Property ssl.keystore.location is not valid (kafka.utils.VerifiableProperties)