Lucene 学习笔记（一）

2019独角兽企业重金招聘Python工程师标准>>>

最近，由于需要做到搜索功能，但是搜索功能里面，涉及的关系比较复杂，如果通过sql语言来查询，效率十分低下，所以便开始研究了下java开源搜索引擎lucene 。

Lucene入门起来了解其使用规则并不难，他是围绕索引Index来进行创建，查询等操作。而索引是存放在Directory中，Directory有很多种类，不过主要分成两种：

一、存放在运行内存中的RAMDirectory，既然放在内存中，也就说明他的声明周期极其短，不过，另一方面也表明他的读取存取速度快。

二、存放在物理磁盘中的FileSwitchDirectory, FSDirectory, MockDirectoryWrapper, NRTCachingDirectory ，除了FSDirectory外，其他几种是根据环境会发挥出不同的性能的，而FSDirectory相对要智能很多，他会根据目前的环境自行决定他的确切存储方式。

而Lucene的基本使用流程为：

一、声明指定Directory ，如：

Directory directory = new RAMDirectory();

二、创建索引并放入指定Directory，如：

IndexWriter writer = null;try {writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)));writer.deleteAll();Document doc = null;doc = new Document();doc.add(...); //在此文档添加信息属性等writer.addDocument(doc);//创建文档索引} catch (CorruptIndexException e) {e.printStackTrace();} catch (LockObtainFailedException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();} finally {try {if(writer!=null)writer.close();} catch (CorruptIndexException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}}

三、读取索引，进行查询：

try {IndexReader reader = IndexReader.open(directory);IndexSearcher searcher = new IndexSearcher(reader);TermQuery query = new TermQuery(new Term(指定属性,查询内容));
//获得查询数据，条数为自定义，以下为10条TopDocs tds = searcher.search(query, 10);for(ScoreDoc sd:tds.scoreDocs) {//查询到的数据进行数据的操作}reader.close();} catch (CorruptIndexException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}

以上为Lucene搜索的基本流程，更高效率的还要对内容进行分词，同义词处理等。

转载于:https://my.oschina.net/u/1024349/blog/147085

Lucene 学习笔记（一）相关推荐

Lucene学习笔记(1)
Lucene学习笔记可以搜索文本文件,理论上可以搜索任何类型的数据.只要先把数据转化为文本,就可以对数据进行索引和搜索. 使用了反向索引的机制,维护一个词/短语的表,对于每个词和短语都有一个链表描述 ...
lucene学习笔记_学习Lucene
lucene学习笔记我目前正在与一个团队合作,开始一个基于Lucene的新项目. 虽然大多数时候我会争论使用Solr还是Elasticsearch而不是简单的Lucene,但这是一个有意识的决定. ...
Lucene学习笔记
全文检索概述数据分类结构化数据:具有固定格式或者长度有限的数据,例如数据库中的表.[SQL语句] 非结构化数据:与结构化数据对立,例如:邮件.网页.word文档.[数据扫描.全文检索] 半结构化数 ...
搜索-Lucene学习笔记
1 全文检索和索引 1.1 索引将非结构化数据中的一部分信息取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的.这部分从非结构化数据中取出的 ...
Lucene学习笔记：Field.Store.* 域存储选项
2019独角兽企业重金招聘Python工程师标准>>> Store.YES: 指定存储域值.该情况下,原始的字符串值全部都被保存在索引中,并可以由IndexReader类恢复.该选项 ...
Hadoop学习笔记一简要介绍
Hadoop学习笔记一简要介绍这里先大致介绍一下Hadoop. 本文大部分内容都是从官网Hadoop上来的.其中有一篇介绍HDFS的pdf文档,里面对Hadoop介绍的比较全面了.我的这一 ...
基于Solr的空间搜索学习笔记
基于Solr的空间搜索学习笔记在Solr中基于空间地址查询主要围绕2个概念实现: (1) Cartesian Tiers 笛卡尔层 Cartesian Tiers是通过将一个平面地图的根据设定的层次 ...
学习笔记：The Log（我所读过的最好的一篇分布式技术文章
学习笔记:The Log(我所读过的最好的一篇分布式技术文章) 前言这是一篇学习笔记. 学习的材料来自Jay Kreps的一篇讲Log的博文. 原文很长,但是我坚持看完了,收获 ...
Solr 6.7学习笔记（04）-- Suggest
当我们使用baidu或者Google时,你输入很少的字符,就会自动跳出来一些建议选项,在Solr里,我们称之为Suggest,在solrconfig.xml里做一些简单的配置,即可实现这一功能.配置如 ...

Lucene 学习笔记（一）

Lucene 学习笔记（一）相关推荐

最新文章

热门文章