迅搜中文分词简明教程
简介
安装和命令行操作可以参考手册
project.name = keys 指定项目名称,最好跟ini配置文件同名
project.default_charset = UTF-8 指定项目默认字符集
[kid]
type = id 指定id字段,每个项目只能有一个id字段,id字段的值不能重复
[value]
type = string 指定一个string字段,string也是默认字段类型
index = both 设置索引为both;不设置索引的字段,不会被检索
[pinyin]
type = string
index = both
[type]
type = numeric 指定一个数字字段
使用PHP api调用迅搜
例:
try{$_indexNumber=time().rand(1, 100);$data=array('kid'=>$_indexNumber,'value’=>'测试数据','pinyin’=>'ceshi','type’=>1,);//插入分词词库$index=$xs->getIndex();//索引对象$doc = new XSDocument(); //创建文档对象$doc->setFields($data);if($index->add($doc)) //将文档添加到索引{printLine('保存成功');}else {printLine('ERR');}}catch(XSException $e){echo $e->getMessage();
}catch(Exception $e){echo $e->getMessage();
}
$keywords=trim($_POST['keywords']);
try{$xs=new XS('keys');//获取搜索对象$search=$xs->search;//生成key数组,单条生成$keywords=empty($keywords)?'':$keywords;$keywords=explode(',', $keywords);//设置多条语句if(!is_array($keywords)){$search->setQuery($keywords);}else if(is_array($keywords)){foreach($keywords as $val){$search->setQuery($val);}}$docs_c=$search->count();//执行$docs=$search->search();}catch(XSException $e){echo $e->getMessage().'<br />';
}catch(Exception $e){echo $e->getMessage().'<br />';
}
迅搜中文分词简明教程相关推荐
- xunsearch(迅搜中文全文搜索引擎)的简单使用
Xunsearch (中文名:迅搜)是一套免费开源的专业中文全文检索解决方案,简单易用而且 功能强大.性能卓越能轻松处理海量数据的全文检索.它包含后端索引.搜索服务程序和前端 脚本语言编写的开发工具包 ...
- Ansj中文分词使用教程
摘要: ansj是一个基于n-Gram+CRF+HMM的中文分词的java实现. ansj分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 Ansj目前实现了.中文 ...
- byteofpython中文gitbook_GitBook 简明教程
Modern book format and toolchain using Git and Markdown 这是 GitBook 项目主页上对 GitBook 的定义. GitBook 是一个命令 ...
- linux xunsou_Linux下的迅搜(xunsearch)安装使用教程,并设置成开机启动服务
1.到 /usr/local/src 目录,运行下面指令下载.解压安装包cd /usr/local/src wget http://www.xunsearch.com/download/xunsear ...
- linux xunsou_mysql中文分词全文搜索索引讯搜的安装
迅搜是开源免费.高性能.多功能简单易用的专业全文检索技术方案,帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎.全文检索可以帮助您降低服务器搜索负荷.极大程度的提高搜索速度和用户体 ...
- 讯搜 配置mysql_实例讲解帝国cms整合xunsearch(迅搜)教程
实例讲解帝国cms整合xunsearch(迅搜)教程 来源:51酷酷 编辑:广告联盟评测网 时间:2017-11-28 16:50:18 帝国CMS安装迅搜_linux系统下 安装迅搜记录 目的:由于 ...
- 简明Jieba中文分词教程(分词、关键词提取、词性标注、计算位置)
目录 0 引言 1 分词 1.1 全模式和精确模式 1.2 搜索引擎模式 1.3 HMM 模型 2 繁体字分词 3 添加自定义词典 3.1 载入词典 3.2 调整词典 4 关键词提取 4.1 基于 T ...
- mysql sphinx 中文搜索_MySQL中文全文搜索用迅搜还是Sphinx?
大家好, 本人在MySQL里建立搜索的fulltext,但因为对中文支持度差,所以需要专用更好的插件. 网上有人推荐:Sphinx.mysqlcft和迅搜. http://lostphp.com/bl ...
- 编写简单的中文分词程式-.NET教程,Asp.Net研发
几个月之前,在网上找到了一个中文词库素材(几百k),当时便想写一个分词程式了.我对汉语分词没有什么研究,也就凭自己臆想而写.若有相关方面专家,还请多给意见. 一.词库 词库大概有5万多词语(googl ...
最新文章
- C++C#外挂(内存修改)
- python 同步 事件 event 简介
- HTML5中video标签与canvas绘图的使用
- 艾特某人代码实现_Vue@某人,At某人,仿新浪微博@某人,@user,艾特,艾特某人...
- 函数dup和dup2
- 物联网专科专业必修课程_江西自考专科物联网技术专业的考试课程/科目
- docker pull理解误区
- 剑指offer面试题[22]-栈的压入、弹出序列
- linux学习笔记(三):文件系统结构
- python面向对象的特殊方法和单例模式
- 将HTML网页存储为图片 区域截图 截长屏 截全屏
- Android自定义消息推送
- Google 2017 上海开发者大会 总结
- 设置单独进程打开资源管理器有效防止电脑假死!
- Teambition X 2019 校招
- DRM DUMB相关说明
- 安卓开发中获取服务器网络延迟(ping)
- 没有公网IP远程访问群晖nas
- 02-nation.sql
- 继百果园、鲜丰水果后,洪九果品凭什么冲击“水果上市第一股”?
热门文章
- 企业邮箱WebMail协助办公功能盘点
- 网络共享存储器巴法罗BUFFALO的LS-WXL/E出现EM模式的解决方案
- ppt复现CVPR顶会流程图
- 图表嵌入到数据表格下方_Excel中进行图表下方显示数据表的操作技巧
- 将echarts图表数据导出成表格
- 【读书笔记】《牧羊少年奇幻之旅》
- easyUI 1.3 中文 API
- [读书笔记]精力管理(The Power of Full Engagement)
- 我的世界服务器无限漏斗,我的世界漏斗bug 我的世界怎么刷东西
- android:completionthreshold=1,android:completionThreshold=1是哪个组件的属性( )