简介

安装和命令行操作可以参考手册


索引
none 不做索引,所有的搜索匹配均与本字段无关,这个字段只用于排序或搜索结果展示用到。
self 字段索引,可以在搜索时用 field:XXX 来检索本字段
mixed 混合区索引,不标明字段的默认搜索也可以检索本字段
both 相当于 self + mixed,两种情况均索引
字段类型
string 字符型,适用多数情况,也是默认值
numeric 数值型,包含整型和浮点数,仅当字段需用于以排序或区间检索时才设为该类型,否则请使用 string 即可
date 日期型,形式为 YYYYmmdd 这样固定的 8 字节,如果没有区间检索或排序需求不建议使用
id 主键型,确保每条数据具备唯一值,是索引更新和删除的凭据,每个搜索项目必须有且仅有一个 id 字段,该字段的值不区分大小写
title 标题型,标题或名称字段,至多有一个该类型的字段
body 内容型,主内容字段, 即本搜索项目中内容最长的字段,至多只有一个该类型字段,本字段不支持字段检索


配置文件简介
project.name = keys 指定项目名称,最好跟ini配置文件同名
project.default_charset = UTF-8 指定项目默认字符集
[kid]
type = id 指定id字段,每个项目只能有一个id字段,id字段的值不能重复
[value]
type = string 指定一个string字段,string也是默认字段类型
index = both 设置索引为both;不设置索引的字段,不会被检索
[pinyin]
type = string
index = both
[type]
type = numeric 指定一个数字字段

编写配置文件时要特别注意:需要索引的字段一定要指定索引类型,因为字段默认是无索引(none)

使用PHP api调用迅搜
构造一个迅搜对象
$xs=new XS('keys’);
所有操作都要基于一个迅搜对象,创建对象需要指定具体的项目名称
获取一个索引对象
$index=$xs->getIndex();
索引对象可以添加,更新数据
获取一个查询对象
$search=$xs->search;
查询对象内置所有查询相关方法
构造一个文档对象
迅搜所有的操作都要基于文档,文档概念贯穿整个迅搜软件
$doc = new XSDocument();
索引对象增、改操作需要传一个文档对象,而查询方法会返回一个文档对象

例:
插入数据

try{$_indexNumber=time().rand(1, 100);$data=array('kid'=>$_indexNumber,'value’=>'测试数据','pinyin’=>'ceshi','type’=>1,);//插入分词词库$index=$xs->getIndex();//索引对象$doc = new XSDocument(); //创建文档对象$doc->setFields($data);if($index->add($doc)) //将文档添加到索引{printLine('保存成功');}else {printLine('ERR');}}catch(XSException $e){echo $e->getMessage();
}catch(Exception $e){echo $e->getMessage();
}
例:
查询数据

$keywords=trim($_POST['keywords']);
try{$xs=new XS('keys');//获取搜索对象$search=$xs->search;//生成key数组,单条生成$keywords=empty($keywords)?'':$keywords;$keywords=explode(',', $keywords);//设置多条语句if(!is_array($keywords)){$search->setQuery($keywords);}else if(is_array($keywords)){foreach($keywords as $val){$search->setQuery($val);}}$docs_c=$search->count();//执行$docs=$search->search();}catch(XSException $e){echo $e->getMessage().'<br />';
}catch(Exception $e){echo $e->getMessage().'<br />';
}

迅搜中文分词简明教程相关推荐

  1. xunsearch(迅搜中文全文搜索引擎)的简单使用

    Xunsearch (中文名:迅搜)是一套免费开源的专业中文全文检索解决方案,简单易用而且 功能强大.性能卓越能轻松处理海量数据的全文检索.它包含后端索引.搜索服务程序和前端 脚本语言编写的开发工具包 ...

  2. Ansj中文分词使用教程

    摘要: ansj是一个基于n-Gram+CRF+HMM的中文分词的java实现. ansj分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 Ansj目前实现了.中文 ...

  3. byteofpython中文gitbook_GitBook 简明教程

    Modern book format and toolchain using Git and Markdown 这是 GitBook 项目主页上对 GitBook 的定义. GitBook 是一个命令 ...

  4. linux xunsou_Linux下的迅搜(xunsearch)安装使用教程,并设置成开机启动服务

    1.到 /usr/local/src 目录,运行下面指令下载.解压安装包cd /usr/local/src wget http://www.xunsearch.com/download/xunsear ...

  5. linux xunsou_mysql中文分词全文搜索索引讯搜的安装

    迅搜是开源免费.高性能.多功能简单易用的专业全文检索技术方案,帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎.全文检索可以帮助您降低服务器搜索负荷.极大程度的提高搜索速度和用户体 ...

  6. 讯搜 配置mysql_实例讲解帝国cms整合xunsearch(迅搜)教程

    实例讲解帝国cms整合xunsearch(迅搜)教程 来源:51酷酷 编辑:广告联盟评测网 时间:2017-11-28 16:50:18 帝国CMS安装迅搜_linux系统下 安装迅搜记录 目的:由于 ...

  7. 简明Jieba中文分词教程(分词、关键词提取、词性标注、计算位置)

    目录 0 引言 1 分词 1.1 全模式和精确模式 1.2 搜索引擎模式 1.3 HMM 模型 2 繁体字分词 3 添加自定义词典 3.1 载入词典 3.2 调整词典 4 关键词提取 4.1 基于 T ...

  8. mysql sphinx 中文搜索_MySQL中文全文搜索用迅搜还是Sphinx?

    大家好, 本人在MySQL里建立搜索的fulltext,但因为对中文支持度差,所以需要专用更好的插件. 网上有人推荐:Sphinx.mysqlcft和迅搜. http://lostphp.com/bl ...

  9. 编写简单的中文分词程式-.NET教程,Asp.Net研发

    几个月之前,在网上找到了一个中文词库素材(几百k),当时便想写一个分词程式了.我对汉语分词没有什么研究,也就凭自己臆想而写.若有相关方面专家,还请多给意见. 一.词库 词库大概有5万多词语(googl ...

最新文章

  1. C++C#外挂(内存修改)
  2. python 同步 事件 event 简介
  3. HTML5中video标签与canvas绘图的使用
  4. 艾特某人代码实现_Vue@某人,At某人,仿新浪微博@某人,@user,艾特,艾特某人...
  5. 函数dup和dup2
  6. 物联网专科专业必修课程_江西自考专科物联网技术专业的考试课程/科目
  7. docker pull理解误区
  8. 剑指offer面试题[22]-栈的压入、弹出序列
  9. linux学习笔记(三):文件系统结构
  10. python面向对象的特殊方法和单例模式
  11. 将HTML网页存储为图片 区域截图 截长屏 截全屏
  12. Android自定义消息推送
  13. Google 2017 上海开发者大会 总结
  14. 设置单独进程打开资源管理器有效防止电脑假死!
  15. Teambition X 2019 校招
  16. DRM DUMB相关说明
  17. 安卓开发中获取服务器网络延迟(ping)
  18. 没有公网IP远程访问群晖nas
  19. 02-nation.sql
  20. 继百果园、鲜丰水果后,洪九果品凭什么冲击“水果上市第一股”?

热门文章

  1. 企业邮箱WebMail协助办公功能盘点
  2. 网络共享存储器巴法罗BUFFALO的LS-WXL/E出现EM模式的解决方案
  3. ppt复现CVPR顶会流程图
  4. 图表嵌入到数据表格下方_Excel中进行图表下方显示数据表的操作技巧
  5. 将echarts图表数据导出成表格
  6. 【读书笔记】《牧羊少年奇幻之旅》
  7. easyUI 1.3 中文 API
  8. [读书笔记]精力管理(The Power of Full Engagement)
  9. 我的世界服务器无限漏斗,我的世界漏斗bug 我的世界怎么刷东西
  10. android:completionthreshold=1,android:completionThreshold=1是哪个组件的属性( )