自定义词典

全文检索功能在构建索引和查询时,都需要对文档或待查询语句进行分词,分词结果直接影响索引构建及查询结果。AliNLP在大部分场景下可以得到理想的分词结果,但在一些特定的场景下,分词结果会造成查询结果差异,并不能满足业务实际需求,自定义词典提供的灵活扩充词库能力,可以很好的解决这个问题。

AnalyticDB MySQL版 3.0的全文检索支持自定义词典,您可以对词典表进行增加和删除以达到维护词典的目的,也可以按需创建多张词典表,以达到不同的应用场景使用不同词典的目的。

创建自定义词典表

AnalyticDB MySQL版 3.0中,具体的创建语法如下:CREATE TABLE `ext_dict` (

`value` varchar(255) NOT NULL COMMENT '扩展词/停止词值',

`type` varchar(4) NOT NULL DEFAULT 'main' COMMENT 'main表示扩展词, stop表示停止词(暂不支持停止词)',

PRIMARY KEY (`value`,`type`)

) COMMENT='用户词典表'

FULLTEXT_DICT = 'Y';

约束:

词典只能有两个字段:value和type;

value和type字段都为varchar类型,并且不能为空;

词典表主键必须同时包含value和type字段;

字段解释:

value字段表示具体的词条内容;

type字段用来标记词条类型,比如扩展词和停止词,在目前的应用场景中,只有扩展词(main)是合法的,其他类型的词条可以写入,但不会生效。

AnalyticDB MySQL版对可以创建的全文词典的数量进行了限制。目前一个逻辑库可以创建一个全文词典表,一个物理库中可以创建最多十个全文词典表。

更新自定义词典

词典本身是一张表,读写操作与普通表无异,具体约束为:

词典表不允许执行Online DDL;

不支持update和truncate;

不支持禁用索引;

不支持使用全文索引、自定义词典、自定义分词器;

词典表在被其他索引使用时禁止删除。

插入一个词条:INSERT INTO ext_dict (`value`) VALUES ('浙A');

删除一个词条:DELETE FROM ext_dict WHERE `value` = '浙A' AND `type` = 'main';

一个词典默认最多允许插入1w条记录,如果需要调整插入记录数,请提交工单。

您插入或者删除词典中的词条后,词典会立刻生效,对于新写入数据表的数据,将使用自定义词典最新的词条进行分词。

使用自定义词典

创建全文索引时,可以指定全文索引使用的自定义词典,以在线创建全文索引为例:ALTER TABLE `test` ADD FULLTEXT INDEX t_idx(`title`) WITH DICT [logical_schema.]table;

使用with dict指定使用的自定义词典,指定的自定义词典必须满足以下条件:

是一个自定义词典表;

当前用户具备对应自定义词典表的SELECT权限。

自定义词典中的单个词条如果是中英文混合,例如车牌号前缀 “浙A”,在指定自定义词典时需要同时指定使用AliNLP分词器,例如:ALTER TABLE `test` ADD FULLTEXT INDEX t_idx(`title`) WITH DICT ext_dict WITH ANALYZER alinlp;

oracle 自定义分词器,自定义分词器和自定义词典相关推荐

  1. 中文分词工具jieba分词器的使用

    1.常见的中文分词工具 中科院计算所的NLPIR 哈工大LTP 清华大学THULAC 斯坦福分词器 Hanlp分词器 jieba分词 IKAnalyzer 2.jieba分词算法主要有以下三种: 1. ...

  2. 与自定义词典 分词_使用jieba库进行中文分词、关键词提取、添加自定义的词典进行分词...

    jieba库在中文分词中很常用,做一个简单的介绍和运用~ 需求1:打开本地的十九大报告文本,并采用jieba分词器进行分词,最后将分词结果存入名为segresult的文本文件中. 注释:①jieba库 ...

  3. CentOS安装Elasticsearch_IK分词器拼音分词器_部署kibana_部署es集群

    CentOS安装Elasticsearch_IK分词器_部署kibana_部署es集群 一.部署单点es ①:创建网络 因为我们还需要部署kibana容器,因此需要让es和kibana容器互联.这里先 ...

  4. ES自定义Analyzer扩展IK分词

    IPS产品关键词搜索需求要对英文标题.品牌(英文).规格属性(英文).产品型号.描述属性.商品特征.关键搜索词等字段进行模糊匹配搜索 前期由于拿不到数据也不清楚具体数据是什么样的,并且线上集群也没有安 ...

  5. Android应用--简、美音乐播放器获取专辑图片(自定义列表适配器)

    Android应用--简.美音乐播放器获取专辑图片(自定义列表适配器) 2013年7月3日简.美音乐播放器开发 第二阶段已增加功能: 1.歌词滚动显示 2.来电监听 3.音量控制 4.左右滑动切换歌词 ...

  6. 扩展springmvc组件——当页面跳转时,需要在Controller里面创建一个空方法去跳转或者是创建一个配置类  ||日期格式化说明||自定义格式化器||消息转化器扩展fastjson

    在容器中注册视图控制器 当页面跳转时,我们需要在Controller里面创建一个空方法去跳转,那么有没有别的配置方法呢 创建一个WebMvcConfig的配置类   实现WebMvcConfigure ...

  7. java kafka 设置分区_Java kafka如何实现自定义分区类和拦截器

    Java kafka如何实现自定义分区类和拦截器 2.producer配置文件指定,具体的分区类 // 具体的分区类 props.put(ProducerConfig.PARTITIONER_CLAS ...

  8. ML之LiR:利用LiR线性回归算法(自定义目标函数MSE和优化器GD)对Boston房价数据集(两特征+归一化)进行回归预测

    ML之LiR:利用LiR线性回归算法(自定义目标函数MSE和优化器GD)对Boston房价数据集(两特征+归一化)进行回归预测 目录 利用LiR线性回归算法(自定义目标函数MSE和优化器GD)对Bos ...

  9. 【SpringBoot】SpringBoot拦截器实战和 Servlet3.0自定义Filter、Listener

    =================6.SpringBoot拦截器实战和 Servlet3.0自定义Filter.Listener ============ 1.深入SpringBoot2.x过滤器Fi ...

  10. Struts2 自定义拦截器(方法拦截器)

    转自:http://05061107cm.iteye.com/blog/365504 struts2系统自带了很多拦截器,有时需要我们自己定义,一般有两种方式: 一.实现Interceptor接口 J ...

最新文章

  1. env: zh_CN.GB2312:: No such file or directory
  2. Linq 通过反射动态查询对象
  3. 解决Winform程序在不同分辨率系统下界面混乱问题
  4. 后端技术:MyBatis 知识点整理,值得收藏!
  5. [MyBatisPlus]常用注解_@TableName_@TableId_@TableField_@TableLogic通过全局配置配置主键生成策略
  6. C/C++ 线程三种并发方式比较(传统互斥量加锁方式, no lock不加锁的方式, 原子函数方式)
  7. android asmack调用MultiUserChat.getHostedRooms方法出现空指针的异常解决方案
  8. 第十七周项目4 - 日期结构体(是当年的第几天)
  9. 服务器显示屏出现白屏,远程服务器桌面 显示白屏
  10. 如何在Cell里画出虚线?
  11. java线程栈日志_Java线程堆栈
  12. 无穷级数求和7个公式_这些的公式是怎么得到的?
  13. python-pptx 操作PPTx幻灯片文件删除并替换图片
  14. python音频 降噪_python降噪_python音频降噪_python图片降噪 - 云+社区 - 腾讯云
  15. Android调试工具ADB
  16. 练习:随机点名器案例
  17. WordPress怎么使用支持注册用户上传自定义头像功能?
  18. CHM格式文件无法打开的解决方法。
  19. php+mysql问答系统_WeCenter一个开源免费的php+mysql社区问答系统
  20. 很全面的 Docker 教程,从入门到精通(建议收藏)

热门文章

  1. Spring Boot基础教程 - 程序猿DD
  2. 【Python】ID3算法的实现
  3. 主流地信遥感数据导航
  4. SHT20温湿度传感器工作原理
  5. Dell安装Ubuntu教程
  6. 怎样用计算机10,win10计算器怎么用_win10如何打开计算器
  7. 平面设计在现实生活中有哪些用途
  8. c语言precede函数怎么构造,数据结构——栈的应用(表达式求值)(C语言)
  9. Oracle函数之listagg函数
  10. 【书评】《IPD 华为研发之道》(著者:刘选鹏)