https://www.elastic.co/guide/cn/elasticsearch/guide/current/_add_failover.html

一个运行中的 Elasticsearch 实例称为一个节点,而集群是由一个或者多个拥有相同 cluster.name 配置的节点组成, 它们共同承担数据和负载的压力。当有节点加入集群中或者从集群中移除节点时,集群将会重新平均分布所有的数据。

当一个节点被选举成为 主 节点时, 它将负责管理集群范围内的所有变更,例如增加、删除索引,或者增加、删除节点等。 而主节点并不需要涉及到文档级别的变更和搜索等操作,所以当集群只拥有一个主节点的情况下,即使流量的增加它也不会成为瓶颈。 任何节点都可以成为主节点。我们的示例集群就只有一个节点,所以它同时也成为了主节点。

作为用户,我们可以将请求发送到 集群中的任何节点 ,包括主节点。 每个节点都知道任意文档所处的位置,并且能够将我们的请求直接转发到存储我们所需文档的节点。 无论我们将请求发送到哪个节点,它都能负责从各个包含我们所需文档的节点收集回数据,并将最终结果返回給客户端。 Elasticsearch 对这一切的管理都是透明的。

当第二个节点加入到集群后,3个 副本分片 将会分配到这个节点上——每个主分片对应一个副本分片。 这意味着当集群内任何一个节点出现问题时,我们的数据都完好无损。

所有新近被索引的文档都将会保存在主分片上,然后被并行的复制到对应的副本分片上。这就保证了我们既可以从主分片又可以从副本分片上获得文档。

应对故障

https://www.elastic.co/guide/cn/elasticsearch/guide/current/_coping_with_failure.html

多大是太大了?

整个批量请求都需要由接收到请求的节点加载到内存中,因此该请求越大,其他请求所能获得的内存就越少。 批量请求的大小有一个最佳值,大于这个值,性能将不再提升,甚至会下降。 但是最佳值不是一个固定的值。它完全取决于硬件、文档的大小和复杂度、索引和搜索的负载的整体情况。

幸运的是,很容易找到这个

最佳点 :通过批量索引典型文档,并不断增加批量大小进行尝试。 当性能开始下降,那么你的批量大小就太大了。一个好的办法是开始时将 1,000 到 5,000 个文档作为一个批次, 如果你的文档非常大,那么就减少批量的文档个数。

密切关注你的批量请求的物理大小往往非常有用,一千个 1KB 的文档是完全不同于一千个 1MB 文档所占的物理大小。 一个好的批量大小在开始处理后所占用的物理大小约为 5-15 MB。

你可能觉得由于 Elasticsearch 主分片数量是固定的会使索引难以进行扩容。实际上当你需要时有很多技巧可以轻松实现扩容。我们将会在扩容设计一章中提到更多有关水平扩展的内容。

Lucene第一天入门

第一步1.分词器
简单来说,分词器(分析器)就是 用来对用户的输入的内容,进行拆解然后组装成好几个词语的工具

2.解决了什么?

第二步需求分析


从非结构化数据中提取出来的,然后重新组织的信息,我们叫做 索引

先建立索引,在对索引进行搜索的过程叫做全文检索

Lucene 与 Elastic相关推荐

  1. Lucene 和 Elastic

    理性经济学的假设:第一个就是假设人都是理性的,不光是假设每个人都是理性的,还假设我知道你是理性的,还知道你也知道我是理性的,所以说他是非常多层的理性的概念. 第二个假设就是这些人能够做优化,能够顾最大 ...

  2. 基于lucene语法的实时文本搜索与匹配--Tripod

    Tripod是一款基于lucene语法实现的,可对文本数据进行实时匹配的开源工具,其工程路径为https://github.com/colorknight/tripod.git.在一定场景中,使用它, ...

  3. 2知识图谱的生命周期

    知识图谱的生命周期 @知识图谱 知识建模--建立本体ontolog 建什么 概念.实体的类型 概念/实体的关联关系 要求:可靠性 方法 自顶向下--专家手工形成数据模式 自底向上--实体--类 利用现 ...

  4. 算法工程师分类与要求

    (一)图像算法/计算机视觉工程师 包括 图像算法工程师,图像处理工程师,音/视频处理算法工程师,计算机视觉工程师 要求: 专业: 计算机.数学.统计学相关专业: 技术领域: 机器学习,模式识别 技术要 ...

  5. 告警流量分析:Cobalt Strike(默认实验文)

    文章目录 前言 从去除流量特征反推 分析流量包 200815084549005001_tmp.pcap - 无有用信息 200929112751005001_tmp.pcap - 无有用信息 流量包协 ...

  6. 女朋友问小灰:什么是数据仓库?什么是数据湖?什么是智能湖仓?

    首先,我们来讲一讲什么是数据库. 作为程序员,我们写的大多数商业项目,往往都需要用到大量的数据.计算机的内存,可以实现数据的快速存储和访问. 但是,内存的空间是有限的,也无法长期保存有用的数据.对于那 ...

  7. LuceneElasticSeachKafka

    Lucene&ElasticSeach&Kafka Lucene&ElasticSeach 1 什么是全文检索 1.1 数据分类 生活中的数据总体分为两种:结构化数据和非结构化 ...

  8. 漫话:什么是数据仓库?什么是数据湖?什么是智能湖仓?

    首先,我们来讲一讲什么是数据库. 作为程序员,我们写的大多数商业项目,往往都需要用到大量的数据.计算机的内存,可以实现数据的快速存储和访问. 但是,内存的空间是有限的,也无法长期保存有用的数据.对于那 ...

  9. 【转】算法工程师应该学哪些

    一.算法工程师简介 (通常是月薪15k以上,年薪18万以上,只是一个概数,具体薪资可以到招聘网站如拉钩,猎聘网上看看) 算法工程师目前是一个高端也是相对紧缺的职位: 算法工程师包括 音/视频算法工程师 ...

最新文章

  1. Console-算法-一个偶数总能表示为两个素数之和
  2. 缓存和web缓存分别是什么?
  3. Python,你应该小心的逗号!一步错步步错
  4. 00后MIT美女学霸获2022年罗德奖学金!4位中国学霸入学牛津
  5. php.ini centos,CentOS下修改php.ini后不生效的方法
  6. Android 系统提供的文件下载
  7. C# 参考之访问关键字:base、this
  8. 【PL/SQL的优点】
  9. 打开组策略时提示inetres.admx管理模板解析出错解决方法
  10. 堆的C语言实现——堆与堆排序(二)
  11. mysql之库操作_创建用户_修改用户权限_修改用户密码
  12. 在.NET中excel导出方法汇总(收集)
  13. MNIST机器学习入门
  14. matlab在循环中保存jpg格式_Matlab如何循环读取文件
  15. 算法学习之路|反转链表
  16. matlab直观数据处理,霍尔效应实验数据处理 [霍尔效应实验的MATLAB数据处理]
  17. weblogic部署静态资源文件html,weblogic部署静态html
  18. allegro铜皮倒圆角
  19. 如何手动启动消防广播_消防应急广播应如何规范设置
  20. 剖析Linux的守护神

热门文章

  1. js检查数据类型的方法
  2. dos命令行设置网络优先级_网络安全之木马病毒的防范以及攻击
  3. Javascipt超详细版思维导图+基础语法导航
  4. 栈的应用——表达式求值(双栈)
  5. CentOS7安装mysql8并配置
  6. ip申请 web应用_网络协议端口TCP/IP概览
  7. redis分片_Redis的持久化操作
  8. TCP/IP具体解释学习笔记——地址解析协议ARP
  9. 深刻理解HDFS工作机制
  10. 很容易学习的JQuery库 : (八) 杂项 noConflict() 方法