找了几个案例,最后选择把调研范围控制在较为主流的Elasticsearch、Solr和略偏门的Sphinx

Elasticsearch( https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html )的安装方式比较齐全,默认就是cluster分布式部署,RestfulAPI相当简洁,总体来讲感觉比较符合开发设计者的初衷:简单、易用、强大。

Solr( https://lucene.apache.org/solr/guide/6_6/ )的强项是默认就包含了WebUI,其他方面感觉几乎都要比Elasticsearch要复杂繁琐一点。

Sphinx( http://sphinxsearch.com/docs/latest/index.html ):它的文档首先说明的是它的弓虽与强大。Sphinx的文档内容量实际上也不算大,但是读起来感觉不是很易读,不知道是排版的原因,还是内容表述的问题。不过文档都看完以后,感觉总体机制复杂度还是可控的。同时他也提供了一个Web界面化Sphinx tools工具。

玩法:先看一遍文档,然后配置运行从头到尾实操一遍,然后试试基本技术流程,再根据项目需求开始具体实施+优化。

Sphinx的生产应用使用这个包:https://github.com/rutube/django_sphinxsearch,因为Sphinx使用MySQL方言,需要mysql包,所以装这个包需要:

sudo apt-get install libmysqlclient-dev

还有一个包叫 https://github.com/jorgecarleitao/django-sphinxql,不过后面这个包对语言版本有要求,必须Python3。候选这两个包的原因是这两个包近期有更新,特别是前者近期更新频繁,已经进入pypi。至于Sphinx官方Plugins目录里面的包大多已经too out甚至已经被废弃。

转载于:https://www.cnblogs.com/dhcn/p/7473921.html

全文检索引擎技术调研笔记相关推荐

  1. Elasticsearch--springcloud整合 high-level-client-测试-复杂检索---全文检索引擎ElasticSearch工作笔记025

    然后我们上一节搭建好了我们的这个springboot整合的es的操作client high-level-client.接下来我们要使用这个 high-level-client去执行一下,es中的复杂操 ...

  2. Elasticsearch--springcloud整合 high-level-client-测试-保存数据---全文检索引擎ElasticSearch工作笔记024

    然后我们再来继续看,可以看到上一节我们已经可以把springboot整合了elasticsearch的high-level-client了 然后我们就根据官方文档,去操作我们的es就可以了.使用hig ...

  3. Elasticsearch--分词-自定义扩展词库---全文检索引擎ElasticSearch工作笔记022

    然后我们再看,之前我们给"尚硅谷电商项目" 进行分词的时候 可以看到,我们知道尚硅谷是一个词,但是他没有给我们识别出来,而是,把尚分离了出来. 那怎么让他按照我们想的进行分词呢?, ...

  4. Elasticsearch--linux网络设置 开启密码访问---全文检索引擎ElasticSearch工作笔记021

    上一节我们网络不好用,现在我们设置一下让网络好用了后面我们在做的时候,就方便一些. 可以看到上面ping 不起作用 ping baidu.com 没有ping通 然后我们要修复网络,我们先进入 cd ...

  5. Elasticsearch--高级-分词 安装ik分词---全文检索引擎ElasticSearch工作笔记020

    然后我们再来看一下,es中的分词, 要知道tokenizer就是分词器,然后他会接收一个字符流,然后把字符流分成一个个独立的tokens,词元. 然后把tokens流再输出. 然后我们去看看,官网这个 ...

  6. Elasticsearch--高级-映射_修改映射 数据迁移---全文检索引擎ElasticSearch工作笔记019

    然后我们之前都添加映射,那么如果我们修改,映射,怎么修改呢? 我们可以直接修改嘛,比如,直接在mappings中修改,对应的类型,可以看到一执行报错对吧.不能直接修改. 可以看到,如果我们这里把这个e ...

  7. Elasticsearch--高级-映射mapping_添加行的字段映射---全文检索引擎ElasticSearch工作笔记018

    然后我们再来看一下,我们添加新的字段映射,前面我们已经在my-index这个索引下,添加了一些映射了, 然后我们,怎么样再那些基础上再添加映射呢? 我们可以直接写在原来的基础上嘛? 不可以,报错了对吧 ...

  8. Elasticsearch--高级-映射mapping 创建---全文检索引擎ElasticSearch工作笔记017

    然后我们再来看一下这个,es中的映射,这个映射的意思其实就是,我们说 es中,有索引,相当于mysql中的数据库,然后类型相当于mysql中的数据表,然后 一个文档,相当于mysql中的一行数据,然后 ...

  9. Elasticsearch--进阶-aggregations聚合分析_ES的强大的数据分析能力厉害啊---全文检索引擎ElasticSearch工作笔记016

    然后我们开始来看es提供的aggregations 执行聚合,实际上就是数据的分析能力,很厉害 比如我们要找所有员工的地址包含了mill的所有人,然后这些人,比如35岁的有多少人,36岁的有多少人,找 ...

最新文章

  1. 3的三个整数立方和有多少个解?全球40万台计算机助力,MIT研究登上PNAS
  2. ASP.NET MVC Bundles 用法和说明(打包javascript和css)
  3. SQL Server创建视图——视图的作用
  4. linux系统内核流转浅析
  5. 怎么通过media foundation将图像数据写入虚拟摄像头_不知道怎么挑手机?性价比神机绝对适合你...
  6. elasticsearch 第五篇(文档操作接口)
  7. clear linux 图形界面,Clear Linux准备迁移到GNOME 3.36,放弃其桌面自定义设置
  8. 树的Prufer 编码和最小生成树计数
  9. python 廖雪峰数据分析统计服_廖雪峰Python总结1
  10. Abp 0.18.0 正式发布! -ABP CLI,新模板和其他功能
  11. HTTP 请求消息头部实例:
  12. .NET:事务、并发、并发问题、事务隔离级别、锁等相关资料整理
  13. imooc数据结构探险-栈篇 栈应用括号匹配二 由群友启发改良james_yuan老师算法
  14. PDFcrack暴力破解pdf密码
  15. ubuntu安装文泉驿字体
  16. 码出高效,码出质量:阿里Java开发手册正式发布!
  17. 随机字符 php,PHP生成随机字符
  18. SPEOS—光学产品设计及仿真工具
  19. sql语句日期格式转换
  20. PS2018下载PSCC2018安装教程

热门文章

  1. 使用wkhtmltopdf导出pdf增加页码解决方案
  2. 股市大盘走势图是怎么去看
  3. canvas实现按轨迹运动(我们的回忆)功能
  4. Variable Expansion in Applescript
  5. Endnote的安装和使用问题
  6. [Python-Twisted] 协议基类源码分析。
  7. proe指定服务器安装,ucs-c系列服务器安装配置-v1
  8. 利用Python对NBA SportUV数据进行可视化及分析
  9. C++学习(五):SOL2库的使用
  10. Windows与网络基础-19注册表维护与优化