sphinx是国外的一款搜索软件。

coreseek是在sphinx的基础上,增加了中文分词功能,换句话说,就是支持了中文。

Coreseek发布了3.2.14版本和4.1版本,其中的3.2.14版本是2010年发布的,它是基于Sphinx0.9.9搜索引擎的。而4.1版本是2011年发布的,它是基于Sphinx2.0.2的。Sphinx从0.9.9到2.0.2还是有改变了很多的,有很多功能,比如sql_attr_string等是在0.9.9上面不能使用的。

可以同时安装sphinx,coreseek,不会互相冲突。

环境:centos6.5 + mysql5.6 + other。

首先安装sphinx:

1. 下载安装包 http://sphinxsearch.com/downloads/    (目前最新版本是2.2.10)

2  ./configure --prefix=/usr/local/sphinx --with-mysql=/usr/local/mysql        (mysql其实不用指定,默认已经支持)           make && make install

3.安装完成后,在 /usr/local/sphinx目录下会有4个目录 

4.打开example.sql ,执行上面的sql.这是测试用例。

5.进入etc目录,拷贝配置文件, cp  sphinx-min.conf.dist  sphinx.conf  (这里不拷贝sphinx.conf.dist ,因为这文件只是比前者多了一堆注释)

6.打开sphinx.conf  修改下配置文件,如果使用的是步骤4的用例,那在这里只需要修改一下数据库配置就行。

7. 生成索引 /usr/local/sphinx/bin/indexer --all

8.测试 /usr/local/sphinx/bin/search linux

没错,你会看到这行提示,我们根本就没这个命令软件。。。。。只有一个searchd,但是这个searchd的用途根本不是这个,所以这里就先不测试了,我们去安装coreseek吧!

安装coreseek

1.首先下载软件,打开 官网 coreseek.cn

没错,你会看到这个提示。

根据笔者观察,该网站已经N久打不开了,该站长已经N久没去备案了。

那只能从别的地方下载安装包咯。

2.解压oreseek里有2个文件夹 一个是mmseg中文分词包 还有一个是csft(其实就是sphinx)包 都要安装

首先安装mmseg中文分词
./configure --prefix=/usr/local/mmseg
编译时可能会报错config.status: error: cannot find input file: src/Makefile.in
通过automake来解决
首先检查是否安装了libtool如果没有 
yum -y install libtool
automake
如果automake报错 原因可能是下列
Libtool library used but `LIBTOOL' is undefined
The usual way to define `LIBTOOL' is to add `AC_PROG_LIBTOOL'
to `configure.ac' and run `aclocal' and `autoconf' again.
If `AC_PROG_LIBTOOL' is in `configure.ac', make sure
its definition is in aclocal's search path.

如果以上步骤都没成功,那么试下以下办法(把下面的命令都执行一遍,就好了)

3.然后继续mmseg的安装

./configure --prefix=/usr/local/mmseg
make && make install

4.安装csft
./configure --prefix=/usr/local/coreseek --with-mysql=/usr/local/mysql --with-mmseg=/usr/local/mmseg --with-mmseg-includes=/usr/local/mmseg/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg/lib/
make && make install
安装完毕后 注意 coreseek 中的配置文件也是csft.conf 而不是 sphinx.conf
cd /usr/local/coreseek/etc
cp sphinx.conf.dist csft.conf
vim csft.conf

5.修改配置csft.conf,增加对中文支持

打开csft.conf

在index test1 段下面,增加

charset_type = zh_cn.utf-8
charset_dictpath =/usr/local/mmseg/etc/

6.配置完成,测试一下吧

保存配置
建立索引
cd /usr/local/coreseek/bin
./indexer --all
./search 别再等

看看是不是已经出来效果了呢 (备注,原始测试的sql,都是英文,需要自己添加一些中文的记录哦)。

转载于:https://www.cnblogs.com/gaosf/p/11255312.html

sphinx和coreseek相关推荐

  1. 基于php的Sphinx以及coreseek的全文搜索,中文分词的使用(一)

    基于php的Sphinx以及coreseek的全文搜索,中文分词的使用(一) ##1.sphinx简介 1.什么是sphinx Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检 ...

  2. Sphinx到Coreseek安装全解

    此次采用的是CentOS6.5 32位 如有出入,请参阅相关配置手册说明 --@Author云天河Blog Sphinx部分 简介 Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,Po ...

  3. sphinx (coreseek)——2、区段查询实例

    首先需要知道区段查询的定义: 索引系统需要通过主查询来获取全部的文档信息,一种简单的实现是将整个表的数据读入内存,但是这可能导致整个表被锁定并使得其他操作被阻止(例如:在MyISAM格式上的INSER ...

  4. Sphinx以及coreseek的安装及使用

    检索结构 php -> sphinx -> mysql 非结构化数据又叫全文数据,非固定长度字段例如文章标题搜索这类适用sphinx全文数据搜索: 1 顺序扫描 : 如like查找 2 索 ...

  5. Sphinx 之 Coreseek、Sphinx-for-chinaese、Sphinx+Scws 评测

    http://www.wubiao.info/292 Sphinx是一个基于SQL的全文检索引擎:普遍使用于很多网站:但由于中英文的差异,其本身,对中文的支持并不好. 主要体现在对一段话断词:英文只需 ...

  6. sphinx全文检索之PHP使用教程

    sphinx全文检索之PHP使用教程 http://www.php100.com/html/php/lei/2013/0916/6188.html 以上一篇的email数据表为例: 数据结构: vie ...

  7. sphinx万能数据源:python数据源

    sphinx万能数据源:python数据源 来源:http://www.kaishixue.com/tech/sphinx/sphinx-python/ coreseek为了扩展,增加了python数 ...

  8. sphinx与全文搜索

    一.sphinx简介: Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索. ...

  9. 全文索引Sphinx+binlog日志+Grant用户授权+读写分离和主从复制

    一.全文索引Sphinx 1.什么是Sphinx Sphinx是由俄罗斯人Andrew Aksyonoff开发的一个全文检索引擎.它是基于C语言开发出来的.中文翻译为斯芬克司斯芬克司. Sphinx最 ...

最新文章

  1. 基于mybatis声明SQL Session对象
  2. 刚刚,生物学横扫诺贝尔3大奖,两名女性获奖!化学奖授予试管中的“进化论”...
  3. suse linux enterprise desktop iso,SUSE Linux Enterprise Desktop 10
  4. 以下哪些是oracle预定义角色,Oracle中预定义角色有哪些?
  5. AB1601开机运行后死机
  6. 项目经济规模的估算方法_估算英国退欧的经济影响
  7. error: ‘XXX‘ is defined but never used (no-unused-vars)报错的解决方案
  8. javascript和python的关系_JavaScript是否越来越像Python?
  9. phpcms图片无法上传
  10. [JLOI2014]松鼠的新家 倍增LCA+树上差分
  11. POJ 1192 最优连通子集(树形DP)
  12. Android基站定位源代码
  13. Matlab图形的线型、标记、颜色
  14. 5GNR解调分析手持式频谱分析仪
  15. react框架设计原理及生命周期
  16. html超链接为变量,如何向超链接添加变量值
  17. 扩展Win7虚拟机硬盘
  18. winform自定义控件无法显示在工具箱中以及显示但使用时出错的解决办法
  19. 推荐几款基于 Markdown 在线制作简历的网站
  20. 错误: 在类 Hello 中找不到 main 方法, 请将 main 方法定义为: public static void main(String[] args)

热门文章

  1. Oracle中procedure和function创建举例
  2. psp前景与范围文档
  3. 为使用mysql而配置codeblocks工程
  4. 常见的6种JavaScript设计模式
  5. @Scheduled
  6. javascript --- 使用ajax与服务器进行通信
  7. Python高级特性:列表生成式
  8. 简单实现仿某宝地址选择三级联动样式
  9. Linux下进行Web服务器压力(并发)测试工具http_load、webbench、ab、Siege、autobench简单使用教程(转)...
  10. 2017 省赛选拨 想打架吗?算我一个!所有人,都过来!(3) 递推 斐波拉数列的应用...