简介:常见的数据库都会提供备份的机制,以解决在数据库无法使用的情况下,可以开启新的实例,然后通过备份来恢复数据减少损失。

作者介绍

魏彬,普翔科技 CTO,开源软件爱好者,中国第一位 Elastic 认证工程师,《Elastic日报》和 《ElasticTalk》社区项目发起人,被 elastic 中国公司授予 2019 年度合作伙伴架构师特别贡献奖。对 Elasticsearch、Kibana、Beats、Logstash、Grafana 等开源软件有丰富的实践经验,为零售、金融、保险、证券、科技等众多行业的客户提供过咨询和培训服务,帮助客户在实际业务中找准开源软件的定位,实现从 0 到 1 的落地、从 1 到 N 的拓展,产生实际的业务价值。

原文链接:https://developer.aliyun.com/article/767043?utm_content=g_1000151932

常见的数据库都会提供备份的机制,以解决在数据库无法使用的情况下,可以开启新的实例,然后通过备份来恢复数据减少损失。虽然 Elasticsearch 有良好的容灾性,但由于以下原因,其依然需要备份机制。

1、数据灾备。在整个集群无法正常工作时,可以及时从备份中恢复数据。

2、归档数据。随着数据的积累,比如日志类的数据,集群的存储压力会越来越大,不管是内存还是磁盘都要承担数据增多带来的压力,此时我们往往会选择只保留最近一段时间的数据,比如1个月,而将1个月之前的数据删除。如果你不想删除这些数据,以备后续有查看的需求,那么你就可以将这些数据以备份的形式归档。

3、迁移数据。当你需要将数据从一个集群迁移到另一个集群时,也可以用备份的方式来实现。

Elasticsearch 做备份有两种方式,

1、将数据导出成文本文件,比如通过 elasticdump、esm 等工具将存储在 Elasticsearch 中的数据导出到文件中。
2、以备份 elasticsearch data 目录中文件的形式来做快照,也就是 Elasticsearch 中 snapshot 接口实现的功能。

第一种方式相对简单,在数据量小的时候比较实用,当应对大数据量场景效率就大打折扣。

我们今天就着重讲解下第二种备份的方式,即 snapshot api 的使用。备份要解决备份到哪里、如何备份、何时备份和如何恢复的问题,那么我们接下来一个个解决。

一、备份到哪里

在 Elasticsearch 中通过 repository 定义备份存储类型和位置,存储类型有共享文件系统、AWS 的 S3存储、HDFS、微软 Azure的存储、Google Cloud 的存储等,当然你也可以自己写代码实现国内阿里云的存储。我们这里以最简单的共享文件系统为例,你也可以在本地做实验。

首先,你要在 elasticsearch.yml 的配置文件中注明可以用作备份路径 path.repo ,如下所示:

path.repo: ["/mount/backups", "/mount/longterm_backups"]

配置好后,就可以使用 snapshot api 来创建一个 repository 了,如下我们创建一个名为 my_backup 的 repository。

PUT /_snapshot/my_backup
{"type": "fs","settings": {"location": "/mount/backups/my_backup"}
}

之后我们就可以在这个 repository 中来备份数据了。

二、如何备份

有了 repostiroy 后,我们就可以做备份了,也叫快照,也就是记录当下数据的状态。如下所示我们创建一个名为 snapshot_1 的快照。

PUT /_snapshot/my_backup/snapshot_1?wait_for_completion=true

wait_for_completion 为 true 是指该 api 在备份执行完毕后再返回结果,否则默认是异步执行的,我们这里为了立刻看到效果,所以设置了该参数,线上执行时不用设置该参数,让其在后台异步执行即可。

执行成功后会返回如下结果,用于说明备份的情况:

{"snapshots": [{"snapshot": "snapshot_1","uuid": "52Lr4aFuQYGjMEv5ZFeFEg","version_id": 6030099,"version": "6.3.0","indices": [".monitoring-kibana-6-2018.05.30",".monitoring-es-6-2018.05.28",".watcher-history-7-2018.05.30",".monitoring-beats-6-2018.05.29","metricbeat-6.2.4-2018.05.28",".monitoring-alerts-6","metricbeat-6.2.4-2018.05.30"],"include_global_state": true,"state": "SUCCESS","start_time": "2018-05-31T12:45:57.492Z","start_time_in_millis": 1527770757492,"end_time": "2018-05-31T12:46:15.214Z","end_time_in_millis": 1527770775214,"duration_in_millis": 17722,"failures": [],"shards": {"total": 28,"failed": 0,"successful": 28}}]
}

返回结果的参数意义都是比较直观的,比如 indices 指明此次备份涉及到的索引名称,由于我们没有指定需要备份的索引,这里备份了所有索引;state 指明状态;duration_in_millis 指明备份任务执行时长等。

我们可以通过 GET _snapshot/my_backup/snapshot_1获取 snapshot_1 的执行状态。

此时如果去 /mount/backups/my_backup 查看,会发现里面多了很多文件,这些文件其实都是基于 elasticsearch data 目录中的文件生成的压缩存储的备份文件。大家可以通过 du -sh . 命令看一下该目录的大小,方便后续做对比。

三、何时备份

通过上面的步骤我们成功创建了一个备份,但随着数据的新增,我们需要对新增的数据也做备份,那么我们如何做呢?方法很简单,只要再创建一个快照 snapshot_2 就可以了。

PUT /_snapshot/my_backup/snapshot_2?wait_for_completion=true

当执行完毕后,你会发现 /mount/backups/my_backup 体积变大了。这说明新数据备份进来了。要说明的一点是,当你在同一个 repository 中做多次 snapshot 时,elasticsearch 会检查要备份的数据 segment 文件是否有变化,如果没有变化则不处理,否则只会把发生变化的 segment file 备份下来。这其实就实现了增量备份。

Elasticsearch 的资深用户应该了解 force merge 功能,即可以强行将一个索引的 segment file 合并成指定数目,这里要注意的是如果你主动调用 force merge api,那么 snapshot 功能的增量备份功能就失效了,因为 api 调用完毕后,数据目录中的所有 segment file 都发生变化了。

另一个就是备份时机的问题,虽然 snapshot 不会占用太多的 cpu、磁盘和网络资源,但还是建议大家尽量在闲时做备份。

四、如何恢复

所谓“养兵千日,用兵一时”,我们该演练下备份的成果,将其恢复出来。通过调用如下 api 即可快速实现恢复功能。

POST /_snapshot/my_backup/snapshot_1/_restore?wait_for_completion=true
{"indices": "index_1","rename_replacement": "restored_index_1"
}

通过上面的 api,我们可以将 index_1 索引恢复到 restored_index_1 中。这个恢复过程完全是基于文件的,因此效率会比较高。

虽然我们这里演示的是在同一个集群做备份与恢复,你也可以在另一个集群上连接该 repository 做恢复。我们这里就不做说明了。

五、其他

由于 Elasticsearch 版本更新比较快,因此大家在做备份与恢复的时候,要注意版本问题,同一个大版本之间的备份与恢复是没有问题的,比如都是 5.1 和 5.6 之间可以互相备份恢复。但你不能把一个高版本的备份在低版本恢复,比如将 6.x 的备份在 5.x 中恢复。而低版本备份在高版本恢复有一定要求:

1、5.x 可以在 6.x 恢复
2、2.x 可以在 5.x 恢复
3、1.x 可以在 2.x 恢复

其他跨大版本的升级都是不可用的,比如1.x 的无法在 5.x 恢复。这里主要原因还是 Lucene 版本问题导致的,每一次 ES 的大版本升级都会伴随 Lucene 的大版本,而 Lucene 的版本是尽量保证向前兼容,即新版可以读旧版的文件,但版本跨越太多,无法实现兼容的情况也在所难免了。

六、继续学习

本文只是简单对 snapshot 功能做了一个演示,希望这足够引起你的兴趣。如果你想进一步深入的了解该功能,比如备份的时候如何指定部分索引、如何查询备份和还原的进度、如何跨集群恢复数据、如何备份到 HDFS 等,
可以详细阅读官方手册
https://www.elastic.co/guide/en/elasticsearch/reference/current/modules-snapshots.html

声明:本文由原文《Elasticsearch snapshot 备份的使用方法》作者“魏彬”授权转载,对未经许可擅自使用者,保留追究其法律责任的权利。


【阿里云Elastic Stack】100%兼容开源ES,独有9大能力,提供免费X-pack服务(单节点价值$6000)

相关活动


更多折扣活动,请访问阿里云 Elasticsearch 官网

阿里云 Elasticsearch 商业通用版,1核2G ,SSD 20G首月免费
阿里云 Logstash 2核4G首月免费


原文链接:https://developer.aliyun.com/article/767043?

版权声明:本文中所有内容均属于阿里云开发者社区所有,任何媒体、网站或个人未经阿里云开发者社区协议授权不得转载、链接、转贴或以其他方式复制发布/发表。申请授权请邮件developerteam@list.alibaba-inc.com,已获得阿里云开发者社区协议授权的媒体、网站,在转载使用时必须注明"稿件来源:阿里云开发者社区,原文作者姓名",违者本社区将依法追究责任。 如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件至:developer2020@service.aliyun.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

【最佳实践】Elasticsearch Snapshot 备份的使用方法相关推荐

  1. MSSQL · 最佳实践 · SQL Server备份策略

    摘要 在上一期月报中我们分享了SQL Server三种常见的备份技术及工作方式,本期月报将分享如何充分利用三者的优点来制定SQL Server数据库的备份和还原策略以达到数据库快速灾难恢复能力. 上期 ...

  2. PostgreSQL 最佳实践 - 在线增量备份与任意时间点恢复

    背景 冷备份, 以及逻辑备份都是某一个时间点的备份, 没有增量的概念. 如果数据库在运行过程中发生故障, 使用逻辑备份只能将数据库还原到备份时刻, 无法恢复到故障发生前的那个时刻. 又或者在使用过程中 ...

  3. SAP BPC最佳实践-BPC系统备份及恢复

    BPC系统作为基于BW的产品,但是由于在维度.属性等若干概念上与BW的差别,在传输.复制.备份恢复方面都难以沿用BW的传统策略.举一个例子,如果我们需要在生产系统中恢复某一个时间点的BPC Cube中 ...

  4. linux备份和还原设置密码,AnyBackup Linux操作系统备份与恢复最佳实践手册(33页)-原创力文档...

    / / / Linux 操作系统定时备份恢复最佳实践 Linux 操作系统定时备份恢复最佳实践 -- 爱数备份容灾家族 目录 目 彔III 第一章 概述1 目标读者1 本文档适用范围1 Linux 系 ...

  5. 关于Python环境下WindowsMac 升级pip的方法最佳实践(附pip常用命令)

    升级pip的最佳实践 升级pip有很多种方法,以下列举我使用的两种方法,并对它们的优缺点进行总结: Mac电脑中操作 使用pip install --user --upgrade pip命令升级pip ...

  6. MSSQL-最佳实践-如何监控备份还原进度

    title: MSSQL · 最佳实践 · 如何监控备份还原进度 author: 风移 摘要 本期月报是SQL Server备份还原专题分享系列的第六期,打算分享给大家如何监控SQL Server备份 ...

  7. [转]在 Azure 云服务上设计大规模服务的最佳实践

    本文转自:http://technet.microsoft.com/zh-cn/magazine/jj717232.aspx 英文版:http://msdn.microsoft.com/library ...

  8. 前端性能优化最佳实践(转)

    转载请注明: 转载自WEB前端开发(www.css119.com)-关注常见的WEB前端开发问题.最新的WEB前端开发技术(webApp开发.移动网站开发).最好的WEB前端开发工具和最全的WEB前端 ...

  9. 让Salesforce用户管理变得更加容易的几种最佳实践

    管理Salesforce用户看起来不困难,但是今天我们还是会介绍下管理Salesforce用户的最佳实践.使用不正确的方法管理用户和许可证可能导致企业数据完整性出现问题.最佳实践应用于Salesfor ...

最新文章

  1. 运维企业部分学习开篇
  2. (0043) iOS 开发之Xcode相关路径
  3. 二分查找的实现---java版本
  4. Androd开发之通过ComponentName和setComponent以及scheme打开外部应用 | 打开任意页面 | 打开指定页面
  5. 深入理解 Node.js 中 EventEmitter源码分析(3.0.0版本)
  6. kindeditor图片上传
  7. html script 设置编码,HTML Script text用法及代码示例
  8. HashTable 简述
  9. mac刷新dns、windows刷新dns、刷新dns缓存命令
  10. Nginx设置404错误页面跳转
  11. 开发网页微信登入获取微信用户信息
  12. 计算机win7设置用户密码,Win7怎么设置密码 win7设置开机密码教程
  13. python迷宫地图代码_[内附完整源码和文档] 基于python实现的迷宫游戏
  14. AppCan MVVM框架简单介绍
  15. 币图告诉你如何解决双花问题
  16. 空间几何-欧拉角、四元数、重投影误差
  17. 学习js的第五天【作用域,递归,对象,数组】
  18. 3D游戏建模教程:Maya如何隐藏灯光
  19. TMC5160 静音驱动器
  20. 【题解】poj1738石子合并 区间DP 加西亚瓦克斯算法

热门文章

  1. GitHub趋势榜第一:超级命令行工具Semantic,比较解析源代码
  2. 浅谈 Python 中的多线程。
  3. 100流明相当于多少w_1990年的100元,相当于2020年的多少钱?
  4. PyTorch基础-softmax函数mnist数据集识别-03
  5. c语言 结构体里使用动态数组_PHP 语法六数组使用及内部结构
  6. oraclemt 无法启动服务_电脑文件无法设置共享的解决方法
  7. 计算机控制系统从本质上看,计算机控制系统测试题.doc
  8. 20175221曾祥杰 实验四《Android程序设计》
  9. 2019.02.11 bzoj4818: [Sdoi2017]序列计数(矩阵快速幂优化dp)
  10. Spring Boot(十七):使用Spring Boot上传文件