文章目录

  • ES-分词
    • PS:
    • 1. 全局分析方式(_analyze)
    • 2. 指定字段分析方式(索引名/_analyze)
  • ES-五种内置分词器介绍
    • 1 标准分词器 standard
    • 2 非字母分词器 simple
    • 3 空格拆分分词器 whitespace
    • 4 智能化分词器(会去掉英文中无意义的词a/an/is/the等) stop
    • 5 关键字分词器(内容不会进行拆分) keyword

ES-分词

PS:

内置默认的分词器是不支持中文的, 中文的话会将每个字进行拆分

1. 全局分析方式(_analyze)

POST: http://192.168.92.140:9200/_analyze

{"analyzer": "standard","text": "I study at home"
}

2. 指定字段分析方式(索引名/_analyze)

POST: http://192.168.92.140:9200/my_doc/_analyze

{"analyzer":"standard","text": "My name is Peter Parker, I am a Super Hero. "
}

ES-五种内置分词器介绍

1 标准分词器 standard

2 非字母分词器 simple

3 空格拆分分词器 whitespace

4 智能化分词器(会去掉英文中无意义的词a/an/is/the等) stop

5 关键字分词器(内容不会进行拆分) keyword

架构师成长记_第八周_10_ES-分词与五种内置分词器相关推荐

  1. 架构师成长记_第八周_04_ES-head 与 postman基于索引的基本操作

    文章目录 ES-head 与 postman基于索引的基本操作 1. ES-head 2. postMan 3. 基本操作 1. 创建索引 方式一: 方式二: 2. 查询集群健康 3. 删除一个索引 ...

  2. 架构师成长记_第八周_11_ES- ik中文分词器与自定义中文词库

    文章目录 ik中文分词器 1. 安装ik中文分词器(7.4.2版本) 2. 使用ik中文分词器 2.1 分词器: ik_max_word 2.1 分词器: ik_smart 自定义中文词库 自定义词库 ...

  3. 架构师成长记_第六周_11_Redis 主从复制(读写分离) 搭建

    文章目录 Redis 主从复制(读写分离) 搭建 1. 三台虚拟机都进入Redis服务器 PS: `info replication` 查看主从复制信息 2. 进入我们的138从节点修改配置 PS: ...

  4. 架构师成长记_第四周_09_Nginx的模块解析及conf配置解析

    Nginx模块解析 nginx.conf 配置解释 #user nobody; // 默认由 nobody 调用 worker 进程, 可以修改为 root worker_processes 2; / ...

  5. JAVA资深架构师成长路线

    文章目录 JAVA资深架构师成长路线 架构师筑基必备技能 并发编程进阶 JVM性能深度调优 网络编程与高效IO 深入Tomcat底层 MySql深度优化 架构基础必备Linux 设计思想 六大原则 种 ...

  6. 架构师成长之旅_第一篇:插件与框架是什么?

    架构师成长之旅_第一篇:c++插件开发 目录 踏入工作前的准备 框架是什么? 多人开发 一.踏入工作前的准备 在即将踏入工作时,最主要的是你的代码量和你编码能力,最重要的是你的代码质量,在编码界代码质 ...

  7. WEB架构师成长之路-摘录

    一 .学习面向对象的基础知识,那你的编程之路注定是在做原始初级的重复! 很多程序员都知道类.方法.抽象类.接口等概念,但是为什么要面向对象,好处在哪里,要解决什么问题 降低软件开发的复杂度 提高软件开 ...

  8. Java架构师成长之路

    目录导航 前言 一.源码分析专题 1.1 设计模式详解 1.2 Mybatis源码分析 1.3 Spring5源码分析 二.分布式架构专题 2.1 漫谈分布式架构 2.2 分布式架构的基础 2.3 分 ...

  9. 如何成为一名架构师,架构师成长之路

    技术人人都是xx 父文章 人人都是面试_个人渣记录仅为自己搜索用的博客-CSDN博客 我的成长之路_个人渣记录仅为自己搜索用的博客-CSDN博客 相关文章 架构师好书推荐_个人渣记录仅为自己搜索用的博 ...

最新文章

  1. 在Ubuntu 14.04 64bit上安装lua5.2
  2. android怎么将editext的文本,android – 如何将文本添加到editext
  3. Java序列化 - 分析不同序列化方式的优劣
  4. 微软Silverlight==跨浏览器、跨客户平台的技术
  5. Nodejs 了解web服务器
  6. 95-35-010-Topic-Topic 扩容 源码解析
  7. 使用 IntraWeb (41) - 数据控件速查
  8. linux下PowerDNS不完全配置
  9. paip.提升安全性---防止敏感文件被下载
  10. HTML资产负债表和收入支出表(可动态更新)
  11. 北斗导航 | 北斗卫星导航系统用户终端通用数据接口
  12. 计算机丢失MSVCR71.dll处理方法
  13. web3应用与dApp理解
  14. 微信绑定的卡服务器,微信将迎来重大更新,微信绑定银行卡的用户请注意!建议进行使用...
  15. 未来,谁在革通信设备商的命?
  16. Java如何进行文件上传与下载
  17. 斯坦福SCI写作公开课目录
  18. 算法模版:模拟数据结构之绪论【沈七】
  19. 微信小程序|icon列表跳转不同界面
  20. 《MATLAB语音信号分析与合成(第二版)》:第4章 语音信号的线性预测分析

热门文章

  1. 《疯狂菌团》第2回-美食菌团探鲜之旅!
  2. 【系统认识张量(一)】基础篇:什么是张量?
  3. Ubuntu开机只有桌面背景和鼠标,没有菜单栏和软件启动栏
  4. 学习记录07:python中创建文件
  5. ERROR executor.CoarseGrainedExecutorBackend: RECEIVED SIGNAL TERM的一种解决方案
  6. 设计《大学生暑期社会实践调查问卷》
  7. SWUST OJ 1052: 输出利用先序遍历创建的二叉树中的指定结点的双亲结点
  8. 夥涉为王 vs 伙涉为王
  9. 59 pandas 时间序列-BusinessHour营业时间及自定义营业时间(tcy)
  10. 高通相机bringup guide