publicclassTestQuery {publicstaticvoidmain(String[] args)throwsIOException, ParseException {

Hits hits=null;//搜索内容自己换String queryString="根据国务院的决定";

Query query=null;

IndexSearcher searcher=newIndexSearcher("d:\\index");//这里注意索引存放的路径Analyzer analyzer=newStandardAnalyzer();try{

QueryParser qp=newQueryParser("body", analyzer);/*** 建索引的时候我们指定了body建立为内容,我们搜索的时候也是针对body的,所以

*   QueryParser qp = new QueryParser("body", analyzer);

*   这句和建立索引时候

Field FieldBody = new Field("body", temp, Field.Store.YES,

Field.Index.TOKENIZED,

Field.TermVector.WITH_POSITIONS_OFFSETS);

*的这句的"body"是对应的。*/query=qp.parse(queryString);

}catch(ParseException e) {

System.out.println("异常");

}if(searcher!=null) {

hits=searcher.search(query);if(hits.length()>0) {

System.out.println("找到:"+hits.length()+"个结果!");for(inti=0; i

Document document=hits.doc(i);

System.out.println("contents:"+document.get("body"));//同样原理这里的document.get("body")就是取得建立在索引文件里面的额body的所有内容//你若想输出文件路径就用document.get("path")就可以了}

}else{

System.out.println("0个结果!");

}

}

}

java检索txt文本_lucene索引word/pdf/html/txt文件及检索(搜索引擎)相关推荐

  1. lucene索引word/pdf/html/txt文件及检索(搜索引擎)

    2009-07-02 15:31 因为lucene索引的时候是将String型的信息建立索引的,所以这里必须是将word/pdf/html等文件的内容转化问字符型. lucene的jar包自己去下载. ...

  2. python 利用jieba读取txt文本进行分词后存入新txt

    python 利用jieba读取txt文本进行分词后存入新txt import jieba txt = open("news.txt",encoding='UTF-8').read ...

  3. python合并txt文本_Python实现将目录中TXT合并成一个大TXT文件的方法

    本文实例讲述了Python实现将目录中TXT合并成一个大TXT文件的方法.分享给大家供大家参考.具体如下: 在网上下了一个dota的英雄攻略,TXT格式,每个英雄一个文件,看得疼,就写了一个小东西,合 ...

  4. C#读取txt文本(或者可以用记事本打开的文件)

    第一种: txt有多少行就会返回长度为多少的List<string> /// <summary>/// 读取txt文件内容/// </summary>/// < ...

  5. android app内部打开word pdf .doc类型文件的两种方式

    1.是集成了x5内核的webview使用的是腾讯的tbs 这种的直接上github找一个demo集成一下就可以了 2.直接接入第三方 sdk进行开发 https://github.com/Office ...

  6. Asp.net实现直接在浏览器预览Word、Excel、PDF、Txt文件(附源码)

    功能说明 输入文件路径,在浏览器输出文件预览信息,经测试360极速(Chrome).IE9/10.Firefox通过 分类文件及代码说明  DemoFiles 存放可测试文件 Default.aspx ...

  7. 批量TXT文本转PDF-PYTHON

    最近眼睛不好,想着少看着点手机,于是将闲置吃灰好多年的kindle4拿出来,这个电纸书是kindle是淘宝上买的,美版,在阅读TXT时碰到很多问题,多次前后翻页后页码会乱,有时文本里有非法字符,会直接 ...

  8. Python爬虫数据存储之TXT文本

    前言:获取数据后可以选择多种存储方式,可以是TXT纯文本形式,也可以为JSON格式.CSV格式等.TXT文本几乎兼容任何平台,但不利于检索的缺点也暴露无遗.若是对检索和数据结构的要求不高,追求方便的情 ...

  9. C#使用NPOI将txt文本批量转为excel文件

    1.下载NPOI     NPOI是一个开源的C#读写Excel.WORD等微软OLE2组件文档的项目.可以在没有安装Office的情况下对Word或Excel文档进行读写操作.     可从NPOI ...

最新文章

  1. Direct2D (23) : 复合几何对象之 ID2D1GeometryGroup
  2. [NOIP2017]逛公园 最短路+拓扑排序+dp
  3. React系列---React+Redux工程目录结构划分
  4. C# WPF 表单更改提示
  5. jsoup爬虫教程技巧_Jsoup V的幕后秘密:优化的技巧和窍门
  6. C++Lambda表达式作为参数
  7. 结队编程思路及感悟(python、tkinter、mysql、腾讯云短信等)
  8. Traceview命令
  9. jane street market prediction 冠军方案 经验分享 (1/3)
  10. word 职称计算机考试大纲,全国职称计算机考试Word2003大纲(1)
  11. 产品经理——从一块钱看产品推广方案
  12. C语言程序设计第六次作业——循环结构(2)
  13. cas112-79-4/中介四(3-羟基苯基)卟吩/5,10,15,20-四(3-羟基苯基)卟啉/MESO-四(间-苯酚)卟啉/3,3‘,3‘‘,3‘‘‘-(卟啉-5,10,15,20-四基)四酚
  14. 英语日常用语900句(3)
  15. 电池的类型,你真的了解吗?
  16. bp配置 sap_SAP HANA BP主数据增强-对标准字段客户化检查
  17. 腾讯新闻php面试题,腾讯PHP面试题及参考答案
  18. 咸鱼带你学计算机网络—概论
  19. 最高级微型计算机,「简讯」曜越发布CPU、内存一体式水冷;realme X50t曝光……...
  20. 外卖小哥莫名成10家公司监事 企业登记存监管漏洞

热门文章

  1. 关于React Router v4的虚张声势指南
  2. 测试常用——linux 基础命令
  3. Linux安装samba组件,CentOS7安装samba服务
  4. macOS安装配置Java
  5. mysql远程访问错误
  6. mac开发配置手册(全)
  7. Python copy模块浅拷贝和深拷贝
  8. 【CCF】201409-2 画图
  9. Visual Studio 2015 和 Apache Cordova 跨平台开发入门(一)
  10. 好大夫王航:长尾开发者应尽快接入百度轻应用