前言

这篇文章详细介绍了如何创建索引和某个类型的映射。

下文中[address]指代elasticsearch服务器访问地址(http://localhost:9200)。

1       创建索引

1.1     简单创建语句

curl -XPUT [address]/blog

1.2     带参数的创建语句

curl -XPUT [address]/blog/ -d '{

"settings":{

"number_of_shards":1,     //设置分片数量

"number_of_replicas":2,  //设置副本数量

//自定义索引默认分析器

"index":{

"analysis":{

"analyzer":{

"default":{

"tokenizer":"standard",     //分词器

"filter":[ //过滤器

"asciifolding",

"lowercase",

"ourEnglishFilter"

]

}

},

"filter":{

"ourEnglishFilter":{

"type":"kstem"

}

}

}

}

}

}'

2       创建映射(扁平结构)

2.1     简单创建语句

curl -XPUT [address]/blog/_mapping/article?pretty -d '{

"properties":{

"id":{"type":"long"},

"name":{"type":"string"},

"published":{"type":"date"}

}

}'

2.2     带参数的创建语句

curl -XPUT [address]/blog/_mapping/article?pretty -d '{

"dynamic":"false",  //关闭自动添加字段,关闭后索引数据中如果有多余字段不会修改mapping,默认true

"_id":{"index":"not_analyzed","store":"no"},        //设置文档标识符可以被索引,默认不能被索引。可以设置为"_id":{"path":"book_id"},这样将使用字段book_id作为标识符

"_all":{"enabled":"false"},       //禁用_all字段,_all字段包含了索引中所有其他字段的所有数据,便于搜索。默认启用

"_source":{"enabled":"false"},        //禁用_source字段,_source字段在生成索引过程中存储发送到elasticsearch的原始json文档。elasticsearch部分功能依赖此字段(如局部更新功能),因此建议开启。默认启用

"_index":{"enabled":"true"},  //启用_index字段,index字段返回文档所在的索引名称。默认关闭。

"_timestamp":{"enabled":"true","index":"not_analyzed","store":"true","format":"YYYY-mm-dd"},                  //启用时间戳并设置。时间戳记录文档索引时间,使用局部文档更新功能时,时间戳也会被更新。默认未经分析编入索引但不保存。

"_ttl":{"enabled":"true","default":"30d"},     //定义文档的生命周期,周期结束后文档会自动删除。

"_routing":{"required":"true","path":"name"}      //指定将name字段作为路由,且每个文档必须指定name字段。

"properties":{

"id":{

"type":"long",

//公共属性

"store":"yes",

//数值特有属性

"precision_step":"0"       //指定为该字段生成的词条数,值越低,产生的词条数越多,查询会更快,但索引会更大。默认4

},

"name":{

"type":"string",

//公共属性

"store":"yes",

"index":"not_analyzed", //analyzed:编入索引供搜索、no:不编入索引、not_analyzed(string专有):不经分析编入索引

"boost":"1",    //文档中该字段的重要性,值越大表示越重要,默认1

"null_value":"jim",  //当索引文档的此字段为空时填充的默认值,默认忽略该字段

"include_in_all":"xxx"      //此属性是否包含在_all字段中,默认为包含

//字符串特有属性

"analyzer":"xxx",     //定义用于索引和搜索的分析器名称,默认为全局定义的分析器名称。可以开箱即用的分析器:standard,simple,whitespace,stop,keyword,pattern,language,snowball

"index_analyzer":"xxx",           //定义用于建立索引的分析器名称

"search_analyzer":"xxx",        //定义用于搜索时分析该字段的分析器名称

"ignore_above":"xxx"      //定义字段中字符的最大值,字段的长度高于指定值时,分析器会将其忽略

},

"published":{

"type":"date",

//公共属性

"store":"yes",

//日期特有属性

"precision_step":"0",      //指定为该字段生成的词条数,值越低,产生的词条数越多,查询会更快,但索引会更大。默认4

"format":"YYYY-mm-dd"          //指定日期格式,默认为dateOptionalTime

}

}

}'

3       创建映射(非扁平结构)

在第二章我们讲解了创建映射的语句。所创建的是简单的扁平结构映射。这一章我们看看如何创建非扁平结构映射。

3.1     树形结构

树形结构的作用是为索引层级路径提供便利。例如一家汽车店中可能会有如下路径:/cars/passenger/sport、/cars/passenger/camper、/cars/delivery_truck,我们想在搜索cars的时候返回三条记录,搜索cars/passenger的时候返回前两条记录,可以这样建立映射:

curl -XPUT [address]/path -d '{

"settings":{

//定义一个路径分析器

"index":{

"analysis":{

"analyzer":{

"path_analyzer":{"tokenizer":"path_hierarchy"}

}

}

}

},

"mappings":{

"category":{

"properties":{

"category":{

"type":"string",

"fields":{

//定义多字段对象,使用category.path进行查询时将启用路径分析匹配指定路径下的所有文档,使用category.name进行查询时将精确匹配指定路径的文档,略过结构更深的文档。

"name":{"type":"string","index":"not_analyzed"},

"path":{"type":"string","analyzer":"path_analyzer","store":true}

}

}

}

}

}

}'

3.2     对象

先执行curl –XPUT [address]/extend_mapping,创建extend_mapping索引

创建一个带有对象属性author的类型book:

curl –XPUT [address]/extend_mapping/_mapping/book –d ‘{

"properties":{

"title":{"type":"string","index":"not_analyzed"},

"author":{

"type":"object",

"properties":{

"firstName":{"type":"string","index":"not_analyzed"},

"lastName":{"type":"string","index":"not_analyzed"}

}

}

}

}’

3.3     嵌套对象

嵌套对象允许我们连接一个主文档和多个附属文档,下面通过一个例子来说明嵌套对象的应用场景。

现在我们有一个服装店,需要设计一个数据结构来存储服装店里的服装信息。例如现在有一种名字为”cloth”的服装,这件服装现有两件存货,一件XXL的红色和一件XL的黑色,请设计一个数据结构来存储该服装信息。

我们可能会把数据结构设计成这样:

{

“name”:”cloth”,

“variation”:[

{“size”:”XXL”,”color”:”red”},

{“size”:”XL”,”color”:”black”}

]

}

直观的来看,这个数据结构是能够表现我们所描述的服装信息的,我们依据这个结构创建以下映射(发送rest请求语句略):

{

"properties":{

"name":{"type":"string","index":"not_analyzed"},

"variation":{

"properties":{

"size":{"type":"string","index":"not_analyzed"},

"color":{"type":"string","index":"not_analyzed"}

}

}

}

}

建立映射后索引以下数据:

{

"name": "cloth",

"variation": [

{

"size": "XXL",

"color": "red"

},

{

"size": "XL",

"color": "black"

}

]

}

下面我们查询一下我们的服装信息库,看看是否有尺寸为XXL,颜色为black的服装:

{

"filter": {

"and": [

{

"term": {

"variation.size": "XXL"

}

},

{

"term": {

"variation.color": "black"

}

}

]

}

}

出乎意料的是,该查询返回了结果:

{

......(此处信息略去)

"hits": {

"total": 1,

"max_score": 1,

"hits": [

{

"_index": "extend_mapping",

"_type": "unnested_cloth",

"_id": "AVACnlA-8eAUpvGq_eZa",

"_score": 1,

"_source": {

"name": "cloth",

"variation": [

{

"size": "XXL",

"color": "red"

},

{

"size": "XL",

"color": "black"

}

]

}

}

]

}

}

这与我们的预期不符,我们只有XXL红色和XL黑色两件服装,并没有所查询的XXL黑色服装。

这是因为按照我们之前定义的映射结构,尺寸信息(“size”:”XXL”,”size”:”XL”)和颜色信息(“color”:”red”,”color”:”black”)都存在同一个文档中,ES无法将XXL和red、XL和black绑定在一起,因此在查询时造成了混淆。

解决的方法就是使用嵌套对象,将variation对象的类型指定为嵌套:

重新创建以下映射:

{

"properties":{

"name":{"type":"string","index":"not_analyzed"},

"variation":{

“type”:”nested”,

"properties":{

"size":{"type":"string","index":"not_analyzed"},

"color":{"type":"string","index":"not_analyzed"}

}

}

}

}

索引之前的测试数据:

{

"name": "cloth",

"variation": [

{

"size": "XXL",

"color": "red"

},

{

"size": "XL",

"color": "black"

}

]

}

现在我们通过”type”:”nested”将variation对象指定为嵌套对象,需要注意的是,如果我们对新映射执行类似之前的查询,将无任何文档返回。因为对于嵌套映射,必须要使用专用的查询语法,如下:

{

"filter": {

"nested": {

"path": "variation",

"filter": {

"and": [

{

"term": {

"variation.size": "XXL"

}

},

{

"term": {

"variation.color": "black"

}

}

]

}

}

}

}

这次的查询如我们的预期,没有返回结果。这是因为使用嵌套结构后,当我们索引测试数据时,事实上ES生成了3个文档,一个cloth的主文档,和两个variation对象的附属文档,这样就分离存储了两件服装存货,避免了尺寸和颜色的混淆。

from: http://www.cnblogs.com/sheeva/p/4837881.html

Elasticsearch创建索引和映射结构详解相关推荐

  1. mysql数据库存储引擎和索引的描述_Mysql InnoDB引擎的索引与存储结构详解

    前言 在Oracle 和SQL Server等数据库中只有一种存储引擎,所有数据存储管理机制都是一样的. 而MySql数据库提供了多种存储引擎.用户可以根据不同的需求为数据表选择不同的存储引擎,用户也 ...

  2. elasticsearch创建索引映射

    1.我们这里通过google自带的工具postman来创建索引,这里我们创建一个:vclogdb,看到返回"acknowledged": true,表示创建成功: 2.通过elas ...

  3. 【elasticsearch】Elasticsearch 7.X Scripting 脚本使用详解

    1.概述 转载:Elasticsearch 7.X Scripting脚本使用详解 0.题记 除了官方文档,其他能找到的介绍Elasticsearch脚本(Scripting)的资料少之又少. 一方面 ...

  4. [java] 虚拟机(JVM)底层结构详解[转]

    [java] 虚拟机(JVM)底层结构详解[转] 本文来自:曹胜欢博客专栏.转载请注明出处:http://blog.csdn.net/csh624366188 在以前的博客里面,我们介绍了在java领 ...

  5. 怎么创建python django项目_创建Django项目图文实例详解

    本文实例讲述了创建Django项目的方法.分享给大家供大家参考,具体如下: 创建Django项目 创建一个HelloDjango项目 GitHub地址:https://github.com/liang ...

  6. 【java学习之路】(java框架)004.Mybatis SQL映射文件详解

    02Mybatis SQL映射文件详解 ​ 在之前我们学习了mybatis的全局配置文件,下面我们开始学习mybatis的映射文件,在映射文件中,可以编写以下的顶级元素标签: cache – 该命名空 ...

  7. Linux TC 流量控制与排队规则 qdisc 树型结构详解(以HTB和RED为例)

    1. 背景 Linux 操作系统中的流量控制器 TC (Traffic Control) 用于Linux内核的流量控制,它规定建立处理数据包的队列,并定义队列中的数据包被发送的方式,从而实现对流量的控 ...

  8. Python基础------几种循环结构详解

    Python基础------几种循环结构详解 在所有的编程语言中,循环结构是必不可少了,Python也一样.在python主要有一下几种循环结构:for-in-.while.range()三种最为常见 ...

  9. ElasticSearch——Spring Boot 集成 ES 操作详解

    文章目录 ElasticSearch--Spring Boot 集成 ES 操作详解 1.SpringBoot 集成 ES 2.索引的API操作详解 3.文档的API操作详解 ElasticSearc ...

最新文章

  1. SQL begin end 块作用
  2. mac  安装brew时报错的问题及解决方式
  3. easyloging 获取日志文件名字_愉快地学Java语言:第十五章 断言与日志
  4. [jQuery] 你知道自定义事件吗?jQuery里的fire函数是什么意思,什么时候用?
  5. 编写第一个OpenACC程序
  6. resizableImageWithCapInsets:方法的探析 (转载笔记)
  7. 关于5G你所需要知道的一切
  8. java 视频压缩_Java视频压缩有人会吗?
  9. 用无线局域网设置服务器,无线局域网如何配置
  10. 愿你一直能够撑下去!
  11. SDCC编译器简明使用教程
  12. CSDN 2018博客之星活动报名开始了!
  13. ps怎么给图片加透明边框
  14. MISRA-C那些事儿
  15. Android电视kodi安装失败,电视提示“解析包出现错误” ?四种方法教你轻松解决...
  16. Mac 最好的网页视频下载工具
  17. cpout引脚是干什么的_A3936芯片引脚图
  18. 语音芯片如何选型?这篇文章告诉你
  19. 为什么学不好编程?——好文章一网打尽
  20. Windows10 WIFI网络列表不显示 无法连接网络 解决办法

热门文章

  1. Linux服务器性能评估与优化--转
  2. Keepalived 使用指南
  3. linux下动态链接问题(so文件的编写与调用)
  4. 章磊回答: 姚期智提出的百万富翁难题被破解? 多方安全计算MPC到底是个什么鬼?
  5. 中国人民银行:关于防范代币发行融资风险的公告
  6. 多核学习在图像分类中的应用
  7. 计网 - 流和缓冲区:缓冲区的 flip 是怎么回事?
  8. Linux-编写Shell的几个技巧_02
  9. arm el2与el3_ARMv8的学习笔记
  10. python如何使用apriori_python-如何加快基于Apriori框架的速度,以仅生...