ElasticSearch

分布式的搜索引擎和数据分析引擎

应用场景

1.可以处理海量数据
2.elk

优点

1.ES有分片的概念,一个大的索引会被自动分成多个分片来进行存储数据,使用分布式的架构对分片进行并行搜索

缺点

1.ES没有事务的处理
2.相对于MYSQL ES不适用于定位某一个唯一值(如用会员id找会员)时并不需要es
所以在实际项目中一般MYSQL和ES连用,MYSQL数据库应该是基础数据来源并导入ES索引。 如果异常情况发生(节点丢失,中断或误操作 )导致丢失了索引,您将能够完全恢复它。 一般的用法是另外的数据库比如MySQL里面有一份,然后实时同步到ES(通过ElasticSearch-jdbc同步),这样一个用于键值查询(MYSQL),一个用于各种其他查询(ES)

理论

索引(index)

类似MYSQL的数据库

类型(type)

类似MYSQL的表(在es5.0后一个索引下只能建一个类型)

文档(Document)

类似MYSQL的一条记录

分词??

节点(node)

一个运行中的 Elasticsearch 实例称为一个节点,而集群是由一个或者多个拥有相同cluster.name配置的节点组成, 它们共同承担数据和负载的压力

分片(Shard)

一个索引中的数据保存在多个分片中,相当于水平分表。一个分片便是一个Lucene 的实例,它本身就是一个完整的搜索引擎(所以es的分布式就是体现在分片上的(前提是只有一个节点))。我们的文档被存储和索引到分片内,但是应用程序是直接与索引而不是与分片进行交互。

ES实际上就是利用分片来实现分布式。分片是数据的容器,文档保存在分片内,分片又被分配到集群内的各个节点里。 当你的集群规模扩大或者缩小时, ES会自动的在各节点中迁移分片,使得数据仍然均匀分布在集群里。

一个分片可以是主分片或者副本分片。 索引内任意一个文档都归属于一个主分片,所以主分片的数目决定着索引能够保存的最大数据量。一个副本分片只是一个主分片的拷贝。 副本分片作为硬件故障时保护数据不丢失的冗余备份,并为搜索和返回文档等读操作提供服务。

在索引建立的时候就已经确定了主分片数,但是副本分片数可以随时修改。默认情况下,一个索引会有5个主分片,而其副本可以有任意数量。

主分片和副本分片的状态决定了集群的健康状态。每一个节点上都只会保存主分片或者其对应的一个副本分片,相同的副本分片不会存在于同一个节点中。如果集群中只有一个节点,则副本分片将不会被分配,此时集群健康状态为yellow,存在丢失数据的风险。

ES的数据类型

text
当一个字段需要用于全文搜索(会被分词), 比如产品名称、产品描述信息, 就应该使用text类型.
text的内容会被分词, 可以设置是否需要存储: “index”: “true|false”.
text类型的字段不能用于排序, 也很少用于聚合.

PUT website
{"mappings": {"blog": {"properties": {"summary": {"type": "text", "index": "true"}}}}
}

keyword
当一个字段需要按照精确值进行过滤、排序、聚合等操作时, 就应该使用keyword类型.
keyword的内容不会被分词, 可以设置是否需要存储: “index”: “true|false”.

PUT website
{"mappings": {"blog": {"properties": {"tags": {"type": "keyword", "index": "true"}}}}
}

text和keyword的区别

Elasticsearch实战---------相关名词介绍相关推荐

  1. SDH/E1/T1/E3/T3/STM/TDM相关名词介绍

    SDH/E1/T1/E3/T3/STM/TDM相关名词介绍 2009-08-13 21:21:32 标签:SDH E1 T1 T3 E3 [推送到技术圈]   SDH/E1/T1/E3/T3/STM/ ...

  2. VWware Vsphere 实战记录一、vsphere简介及相关名词介绍

    一.核心组件 vSphere5 中(取代原ESX), ESXi与Citrix 的XenServer 相似,它是一款可以独立安装和运行在祼机上的系统,因此与其他我们以往见过的VMware Worksta ...

  3. ES6-ES11新特性_ECMAScript相关名词介绍_---JavaScript_ECMAScript工作笔记002

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 然后我们来了解一下ECMAScript中的一些名词. 艾克马...ECma 可以看到ECMA有很多 ...

  4. GNSS相关名词介绍

    SBAS :(satellite based augmentation systems),基于卫星的增强系统: SBAS可用于测量应用,以改善启动参考站时的单点定位或RTK无线电链路断开时的位置. 应 ...

  5. python数据分析相关流程名词介绍

    数据分析相关流程名词介绍 第一部分.指标详解 复购率和回购率 复购率:复购(某段时间有2次及以上购买行为)用户的占比.复购率能反映用户的忠诚度,监测周期一般较长. 回购率:回购率一般监测周期较短,可以 ...

  6. elasticsearch实战三部曲之三:搜索操作

    elasticsearch实战三部曲之三:搜索操作 2019年01月13日 21:35:18 博陵精骑 阅读数:1367 标签: elasticsearch 更多 个人分类: elasticsearc ...

  7. ElasticSearch实战-入门

    1.概述 今天接着<ElasticSearch实战-日志监控平台>一文来给大家分享后续的学习,在<ElasticSearch实战-日志监控平台>中给大家介绍一个日志监控平台的架 ...

  8. elasticsearch实战三部曲之二:文档操作

    本文是<elasticsearch实战三部曲>系列的第二篇,上一篇文章我们动手熟悉了索引相关的基本操作,现在一起来熟悉文档相关的操作: 系列文章链接 <elasticsearch实战 ...

  9. elasticsearch实战三部曲之一:索引操作

    从本章开始,我们一起来实战elasticsearch,熟悉相关操作和命令,为后续的深入学习打好基础: 三部曲介绍 整个系列由以下三篇文章构成: 索引操作实战,也就是本文的主要内容: 文档操作实战: 搜 ...

最新文章

  1. Python基础03-运算符
  2. libsndfile动态库在VS2010下面的调用
  3. PowerDesigner显示mysql数据表注释
  4. 商丘网络推广浅析如何分析竞争对手的网站,制定更优秀的优化方案?
  5. 为什么你投出去的简历,都石沉大海了?
  6. Angular 星级评分组件
  7. spring学习(3):获取bean对象
  8. ad采样做按键开关_磐石按键测试机解决各种按键测试问题
  9. 不再单打独斗?中国移动联合多企业组建医疗数据公司
  10. 设计模式 责任链模式
  11. db2有主键时默认hash分区_Spark RDD依赖关系以及分区属性
  12. 用唯一的颜色id编号实现OpenGL选择功能(OpenGL Selection Using Unique Color IDs )
  13. ECMAScript 2021 特性
  14. Excel做的慢?学会这些Excel技巧和26个快捷键,让你效率翻十倍!
  15. 基于JAVA和MySQL的离散数学题库管理系统
  16. 企业微信 Android端开发
  17. 平凡的岗位做不平凡的事
  18. 沈园恋之沈园诗,自创诗
  19. 腾讯秀丽江山之长歌行服务器维护,37长歌行5月15日合服维护公告
  20. python读取图片像素矩阵

热门文章

  1. cad打印去掉边框_win7系统怎么去掉CAD打印图纸时图框的白边
  2. 数据结构 第一章 数据结构绪论
  3. 金蝶K3如何根据生产领料情况控制产品入库
  4. Windows下实现快速访问GitHub
  5. 正则匹配以什么开头、以什么结尾,以非什么开头,以非什么结尾
  6. hadoop 错误锦集
  7. echarts+高德地图绘制散点+流线图
  8. html5 驾考 答题样式,驾考在线答题
  9. 利用ES实现酒店搜索功能
  10. 2万5千字大厂面经 | 掘金技术征文