Sphinx在windows下如何安装使用

时间:2009-11-08 11:07:52 点击:6077

核心提示:一、关于SphinxSphinx 是一个在GPLv2 下发布的一个全文检索引擎,商业授权(例如, 嵌入到其他程序中)需要联系作者(Sphinxsearch.com)以获得商业授权。一般而言,Sphinx是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx...一、关于Sphinx

Sphinx 是一个在GPLv2 下发布的一个全文检索引擎,商业授权(例如, 嵌入到其他程序中)需要联系作者(Sphinxsearch.com)以获得商业授权。

一般而言,Sphinx是一个独立的搜索引擎,意图为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成。

当前系统内置MySQL和PostgreSQL 数据库数据源的支持,也支持从标准输入读取特定格式的XML数据。通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS的原生支持)。

搜索API支持PHP、Python、Perl、Rudy和Java,并且也可以用作MySQL存储引擎。搜索API非常简单,可以在若干个小时之内移植到新的语言上。

Sphinx特性:

* 高速的建立索引(在当代CPU上,峰值性能可达到10MB/秒);

* 高性能的搜索(在2–4GB的文本数据上,平均每次检索响应时间小于0.1秒);

* 可处理海量数据(目前已知可以处理超过100GB的文本数据,在单一CPU的系统上可处理100M文档);

* 提供了优秀的相关度算法,基于短语相似度和统计(BM25)的复合Ranking方法;

* 支持分布式搜索;

*

提供文件的摘录生成;

*

可作为MySQL的存储引擎提供搜索服务;

*

支持布尔、短语、词语相似度等多种检索模式;

*

文档支持多个全文检索字段(最大不超过32个);

*

文档支持多个额外的属性信息(例如:分组信息,时间戳等);

*

停止词查询;

*

支持单一字节编码和UTF-8编码;

*

原生的MySQL支持(同时支持MyISAM和InnoDB);

*

原生的PostgreSQL支持.

中文手册可以在这里获得(酷勤网备用下载地址:sphinx_doc_zhcn_0.9.pdf)。

二、Sphinx在windows上的安装

1.直接在http://www.sphinxsearch.com/downloads.html找到最新的windows版本,我这里下的是Win32 release binaries with MySQL support,下载后解压在D:\sphinx目录下;

2.在D:\sphinx\下新建一个data目录用来存放索引文件,一个log目录方日志文件,复制D:\sphinx\sphinx.conf.in到D:\sphinx\bin\sphinx.conf(注意修改文件名);

3.修改D:\sphinx\bin\sphinx.conf,我这里列出需要修改的几个:

type        = mysql # 数据源,我这里是mysql

sql_host    = localhost # 数据库服务器

sql_user    = root # 数据库用户名

sql_pass    = '' # 数据库密码

sql_db      = test # 数据库

sql_port    = 3306 # 数据库端口

sql_query_pre   = SET NAMES utf8 # 去掉此行前面的注释,如果你的数据库是uft8编码的

index test1

{

# 放索引的目录

path   = D:/sphinx/data/

# 编码

charset_type  = utf-8

#  指定utf-8的编码表

charset_table  = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F

# 简单分词,只支持0和1,如果要搜索中文,请指定为1

ngram_len    = 1

# 需要分词的字符,如果要搜索中文,去掉前面的注释

ngram_chars   = U+3000..U+2FA1F

}

# index test1stemmed : test1

# {

# path   = @CONFDIR@/data/test1stemmed

# morphology  = stem_en

# }

# 如果没有分布式索引,注释掉下面的内容

# index dist1

# {

# 'distributed' index type MUST be specified

# type    = distributed

# local index to be searched

# there can be many local indexes configured

# local    = test1

# local    = test1stemmed

# remote agent

# multiple remote agents may be specified

# syntax is 'hostname:port:index1,[index2[,...]]

# agent    = localhost:3313:remote1

# agent    = localhost:3314:remote2,remote3

# remote agent connection timeout, milliseconds

# optional, default is 1000 ms, ie. 1 sec

# agent_connect_timeout = 1000

# remote agent query timeout, milliseconds

# optional, default is 3000 ms, ie. 3 sec

# agent_query_timeout  = 3000

# }

# 搜索服务需要修改的部分

searchd

{

# 日志

log     = D:/sphinx/log/searchd.log

# PID file, searchd process ID file name

pid_file   = D:/sphinx/log/searchd.pid

# windows下启动searchd服务一定要注释掉这个

# seamless_rotate  = 1

}

4.导入测试数据

C:\Program Files\MySQL\MySQL Server 5.0\bin>mysql -uroot test

5.建立索引

D:\sphinx\bin>indexer.exe –all

Sphinx 0.9.8-release (r1533)

Copyright (c) 2001-2008, Andrew Aksyonoff

using config file ‘./sphinx.conf’…

indexing index ‘test1′…

collected 4 docs, 0.0 MB

sorted 0.0 Mhits, 100.0% done

total 4 docs, 193 bytes

total 0.101 sec, 1916.30 bytes/sec, 39.72 docs/sec

D:\sphinx\bin>

6.搜索’test’试试

D:\sphinx\bin>search.exe test

Sphinx 0.9.8-release (r1533)

Copyright (c) 2001-2008, Andrew Aksyonoff

using config file ‘./sphinx.conf’…

index ‘test1′: query ‘test ‘: returned 3 matches of 3 total in 0.000 sec

displaying matches:

1. document=1, weight=2, group_id=1, date_added=Wed Nov 26 14:58:59 2008

id=1

group_id=1

group_id2=5

date_added=2008-11-26 14:58:59

title=test one

content=this is my test document number one. also checking search within

phrases.

2. document=2, weight=2, group_id=1, date_added=Wed Nov 26 14:58:59 2008

id=2

group_id=1

group_id2=6

date_added=2008-11-26 14:58:59

title=test two

content=this is my test document number two

3. document=4, weight=1, group_id=2, date_added=Wed Nov 26 14:58:59 2008

id=4

group_id=2

group_id2=8

date_added=2008-11-26 14:58:59

title=doc number four

content=this is to test groups

words:

1. ‘test’: 3 documents, 5 hits

D:\sphinx\bin>

都所出来了吧。

6.测试中文搜索

修改test数据库中documents数据表,

UPDATE `test`.`documents` SET `title` = ‘测试中文’, `content` = ‘this is my test document number two,应该搜的到吧’ WHERE `documents`.`id` = 2;

重建索引:

D:\sphinx\bin>indexer.exe –all

搜索’中文’试试:

D:\sphinx\bin>search.exe 中文

Sphinx 0.9.8-release (r1533)

Copyright (c) 2001-2008, Andrew Aksyonoff

using config file ‘./sphinx.conf’…

index ‘test1′: query ‘中文 ‘: returned 0 matches of 0 total in 0.000 sec

words:

D:\sphinx\bin>

貌似没有搜到,这是因为windows命令行中的编码是gbk,当然搜不出来。我们可以用程序试试,在D:\sphinx\api下新建一个foo.php的文件,注意utf-8编码

require ’sphinxapi.php’;

$s = new SphinxClient();

$s->SetServer(’localhost’,3312);

$result = $s->Query(’中文’);

var_dump($result);

?>

启动Sphinx searchd服务

D:\sphinx\bin>searchd.exe

Sphinx 0.9.8-release (r1533)

Copyright (c) 2001-2008, Andrew Aksyonoff

WARNING: forcing –console mode on Windows

using config file ‘./sphinx.conf’…

creating server socket on 0.0.0.0:3312

accepting connections

执行PHP查询:

php d:/sphinx/api/foo.php

作者:不详 来源:网络

mysql sphinx windows安装_Sphinx在windows下如何安装使用相关推荐

  1. Mongodb学习(安装篇): 在centos下的安装

    安装篇 ###下载解压文件 [root@192 lamp]# wget http://fastdl.mongodb.org/linux/mongodb-linux-i686- 2.2.2.tgz ## ...

  2. mysql sphinx windows安装_Sphinx在windows下安装使用[支持中文全文检索]

    前一阵子尝试使用了一下Sphinx,一个能够被各种语言(PHP/Python/Ruby/etc)方便调用的全文检索系统.网上的资料大多是在 linux环境下的安装使用,当然,作为生产环境很有必要部署在 ...

  3. Windows 10 64位系统下Neo4j安装教程(2021.1.13)

    Win 10安装Neo4j图数据库 1.Neo4j简介 2.Neo4j安装 2.1 查看安装好的JDK版本 2.1.1 JDK 11下载与安装 2.1.2 JDK8和JDK11共存 2.2 安装Neo ...

  4. mysql 5.7.4 m14_win7 64位下如何安装配置mysql-5.7.4-m14-winx64(安装记录)_MySQL

    win7 win7 64位下如何安装配置mysql-5.7.4-m14-winx64 1. mysql-5.7.4-m14-winx64.zip下载 2.解压到D:/mysql.(路径自己指定) 3. ...

  5. mysql 5.7.4 m14_win7 64位下如何安装配置mysql-5.7.4-m14-winx64

    win7 64位下如何安装配置mysql-5.7.4-m14-winx64 1.mysql-5.7.4-m14-winx64.zip下载 官方网站下载地址:http://dev.mysql.com/g ...

  6. liunx tar安装mysql_在Linux下,安装Mysql(tar)

    在Linux下,安装Mysql(tar) # cd /home/tmp (进入压缩包所在目录) # groupadd mysql (建立mysql组) # useradd -g mysql mysql ...

  7. 【MySQL】在centos7 纯IPv6环境下,安装mysql5.7

    参考链接:https://mirrors6.tuna.tsinghua.edu.cn/help/mysql/ 服务器环境: Centos7 纯IPv6环境(不能与IPv4互通) 按照 https:// ...

  8. mysql在linux下的安装_mysql在linux下的安装

    3.添加用户组和用户 #添加用户组 groupadd mysql #添加用户mysql 到用户组mysql useradd -g mysql mysql 4.安装 cd /usr/local/mysq ...

  9. mysql 2000 无法安装_MySQL在Win2000下的安装_MySQL

    一.MySQL简介 MySQL是一个关系型数据库管理系统(RDBMS).它可以很好地组织和管理大量的数据,也使得我们可以很容易地通过象PHP这样的服务器端脚本语言来管理和获取信息.MySQL是完全免费 ...

  10. linux php mysql安装包下载_在linux下手动安装 apache, php, mysql--终极版

    卸载dnf安装的httpd: 纯文本照样可以做到 "有格式的", 通过 "缩进, 空格, tab, 连字符如- , : , ... 等" . 有一个基本原则就是 ...

最新文章

  1. 去除文件名中的'.'符号
  2. 自学python转行-转行Python,应该如何短期自学,达到就业水平
  3. PostgreSQL非交互式键入密码
  4. 重磅!百度研究院发布2021年十大科技趋势预测
  5. nginx平滑升级make upgrade出错的解决办法
  6. Mongo DB命令简介
  7. TypeError: 'str' object is not callable
  8. android的底部弹出框炫酷的样式,Android自定义底部弹出框ButtomDialog
  9. DORADO实现动态拼装查询条件
  10. vue 初识MVC与MVVM,及其与vue基本代码之间的关系
  11. 数电第二版 潘松 陈龙 第一章 答案
  12. 豆丁 道客巴巴 千图网 千库网 包图网 我图网 摄图网 巧办网 万方设计 中国知网 VIP会员一个月开通方法,十网通用
  13. 火影忍者 动漫 全集目录 分章节 精彩打斗剧集 思维导图整理
  14. Adobe Experience Cloud落地中国,Adobe、微软与世纪互联共庆三方合作
  15. 手游虚拟机服务器,手游大话西游虚拟机镜像一键服务端+配套客户端+启动教程+GM后台...
  16. 查询数据库中表名的SQL语句
  17. 华为静态NAT、动态NAT、NAPT、Easy NAT配置实例
  18. cpu2017的526.blender编译出错原因
  19. Selenium 设置带账号密码的socks5代理
  20. Red Hat Enterprise Linux Server 7.3 离线安装Podman

热门文章

  1. emc re 整改 超标_EMC电磁兼容RE辐射超标整改策略
  2. Flutter支付宝授权登录
  3. 数据分析各省高考难度,河南两广山西 最难
  4. 计算机网络在信息时代中的作用
  5. 用C++语言写游戏——打飞机
  6. 【GCN-CTR】端到端的GNN-CTR:Dual Graph enhanced Embedding Neural Network for CTR Prediction (KDD‘21)
  7. 使用facebook账号登录
  8. 如果能重来,我不会选择北漂——初见北京
  9. Vue实现状态的不同颜色
  10. 芭蕉树上第十八根芭蕉-- Qt图片绘图类QPixmap/QImage/QPicture