摘要:本文将详细介绍GaussDB(DWS)重要运维管理功能“升级”的原理和使用。

运维管理模块是任何软件产品最基础和重要的一部分。是软件产品的门户,也是用户接触和使用软件产品的和前提和基础。如安装部署能让用户快速上手使用,升级能让产品平滑更新,扩容能让产品扩充能力,故障修复能让产品快速恢复,监控告警能让产品提前预知或及时排除故障。其在可用性,易用性,可靠性,可维护性、在线运维方面都有较高的要求。本文将详细介绍GaussDB(DWS)重要运维管理功能“升级”的原理和使用。

前言

不断更新和演进是软件的一个重要行为,升级是软件更新的重要保证。伴随着新特性不断推出和历史问题修复,软件升级和打补丁显得格外重要。升级和打补丁需要满足如下要求:

  • 软件版本的无缝、平滑过渡。
  • 业务中断时间尽量少,以至于在线。
  • 用户体验前向兼容。

而数据库升级比其他软件升级更为复杂,不光是软件本身的更新,还要支持其管理的数据的升级。数据库升级需要考虑如下因素:

  • 软件升级,即软件本身的更新。
  • 元数据升级,即软件管理数据的方式的更新。
  • 业务数据升级,即软件管理的数据的升级。

随着数据库版本的快速演进,升级愈显重要,其可靠性、性能、业务中断、易用性急需改善。

升级演进

GaussDB(DWS)升级经过多个版本的演进,其性能,可靠性逐步提升。并提供了不同场景的各种升级方式。如下是演进过程:

大版本全量升级:新版本重建数据库,元数据导入导出,业务数据全量mv方式。依赖于数据库对象个数和业务数据量大小、业务数据表文件数。已在V1R8停用。

就地升级:原地替换二进制,修改系统表方式。依赖于系统表的逻辑大小(数据对象个数)和物理大小(系统表脏页)及数据库个数。

小版本离线升级:停机,替换二进制,启动集群。业务中断时间是一次集群的重启时间。

小版本滚动升级:保留老二进制文件,新目录安装新二进制,按照组件(om_monitor,cm_agent,ETCD,CN,dummy DN,standby DN/GTM/CM,master DN/GTM/CM)滚动切换到新二进制,然后主备切换。整个升级过程中涉及两次switchover,业务中断时间依赖于在线switchover和CN retry能力。

小版本闪断升级:基于小版本滚动升级基础,保留老二进制文件,新目录安装新二进制,先切换管理组件(om_monitor、cm_agent、ETCD、cm_server),再一次性切换业务组件(GTM、CN、DN),只闪断一次业务。目前DWS已使用。

就地升级原理介绍

目前8.0主要使用的升级方式是就地升级。其已经支撑现网线下和公有云多套集群成功升级到新版本。

1、公有云升级流程

DWS服务升级主要分2部分,管控面升级和租户面升级:

各个region的管控面升级回滚主要通过CDK平台完成,升级后组件自行功能验证。

升级实例的信息:

租户面升级在ServiceCM平台由SRE操作,操作可分为DWS Guest升级和数据库内核升级:

主要流程如下所示:

2、线下updatetool升级

通过登录UpdateService操作界面,创建升级工程,进行一键式升级。

3、数据库内核升级流程

数据库内核升级是通过替换二进制+更新元数据的方式进行升级。

包括初始阶段,准入检查,环境准备,停机,备份,升级,update catalog,提交8个阶段。

升级性能目标

升级问题定位

升级过程日志概览见下表:

UpdateService的日志分为审计日志和调试日志,位置见下表:

结语

在数据仓库产品使用过程中,升级和打补丁是使用频率较高的功能。本文中仅仅介绍了GaussDB(DWS)升级的大致流程和基本原理,及性能目标。如果现网变更中遇到升级相关问题,还需联系相关技术支持。

点击关注,第一时间了解华为云新鲜技术~

技术实践丨GaussDB(DWS)运维管理功能“升级”的原理和使用相关推荐

  1. 实践丨GaussDB(DWS)资源管理排队原理与问题定位

    摘要:GaussDB(DWS)提供了资源管理功能,用户可以根据自身业务情况对资源进行划分,将资源按需划分成不同的资源池,不同资源池之间资源互相隔离. 本文分享自华为云社区<GaussDB(DWS ...

  2. 如何使用众安科技智能化运维管理平台提高企业效率

    数字化时代企业对于运维管理的需求越来越迫切.传统的手动运维方式已经无法满足企业对高效.可靠的运维管理的需求.众安科技作为一家科技公司,提供智能化运维管理平台,为企业提供全面的运维解决方案.本文将详细介 ...

  3. 物联网运维-前端设备运维管理设计及解决方案

    一.前端设备运维管控业务分析 大多物联网系统部署完后,前端设备在线率下降的很快,主要因为前端设备通常部署在工况复杂.供电通信不稳.野外场所等场景下,而甲方维护人员对于前端设备运行工况常常无法获取知,又 ...

  4. 安科瑞电力系统运维服务方案,电力运维管理软件变电站监控系统

    安科瑞 王晶淼/司红霞 摘要:引发电力系统故障的原因有很多,主要是人为因素和自然因素,而且随着电力行业的发展,故障的种类逐渐增多,须及时加以处理,将故障的损失控制到小的范围内.因此,电力企业一方面需要 ...

  5. 222页8万字智慧园区IOC平台运维管理平台解决方案

    目 录 第一章 项目概述 7 1.1 园区格局的变化 7 1.1.1 传统安防面临的不足与挑战 7 1.1.2 园区安防未来的发展趋势 7 1.2 需求分析 8 1.2.1 平台集成化 8 1.2.2 ...

  6. 运维侠客行杭州站沙龙回顾 | 云时代下的运维管理实践(附干货下载)

    我们处在一个巨变的时代,在云计算.大数据和物联网等新技术.新理念不断更新的大背景下,企业同时面临着数字化和"互联网+"转型的双重挑战,企业对于"稳态IT"和&q ...

  7. 2015年中国网络管理技术大会落幕 锐捷RIIL摘获“IT运维管理首选品牌”

    日前,由中国电子信息产业发展研究院主办.<网络运维与管理>杂志社与IT运维网共同承办的2015年(第十三届)中国网络管理技术大会圆满落幕.大会公布了"2015中国网络产品与技术调 ...

  8. IT运维管理基础知识:运维人员应该必备的五大技术

    本文转自:http://www.betasoft.com.cn/btzsk/2010-07-21/448.html 下面将IT运维管理基础知识必须要学习或能让你运维任务加分的技艺稍做简介.最先我们假定 ...

  9. 下载丨 MySQL运维管理+编程开发大全

    墨天轮文档:<MySQL运维管理+编程开发大全>:https://www.modb.co/doc/2340(复制到浏览器中或者点击"阅读原文"立即下载) 本文篇幅有限, ...

最新文章

  1. 2018年计算机学校迎新标语,2018大学新生开学迎新标语大全 创意迎新横幅标语
  2. SpringBoot 集成 thumbnailator (图片缩放,区域裁剪,水印,旋转,保持比例)保姆级教程(含代码)
  3. 国产数据库占央采九成份额
  4. golang key map 所有_Map的底层实现 为什么遍历Map总是乱序的
  5. Part7 继承与派生 7.4派生类的构造和析构
  6. 刷新iframe页面
  7. (剑指Offer)面试题37:两个链表的第一个公共结点
  8. 单片机入门--常见单片机PIC\STM32
  9. 极智资讯 | 一文看尽今年的云栖大会 有哪些好玩的
  10. pytorch系列教程(四)-自定义损失函数
  11. python数据函数定义的规则是什么_Python自定义函数基础概念
  12. PyTorch:生态简介
  13. 用python-sklearn做广州房价预测——以此为例说明如何使用python做简单的数据分析
  14. 匿怨而友其人,左丘明耻之,丘亦耻之。我不是圣人,我假装什么都没发生。
  15. 2018.10.04 codeforces1060E. Sergey and Subway(树形dp)
  16. 21Maven - 从私服下载jar包
  17. 【CSS】元素的伪类
  18. html网页制作教程课件,第2章 HTML入门(网页制作案例教程课件).ppt
  19. 关于c3p0连接池使用xml配置出现的一些错误
  20. Cypher语句总结

热门文章

  1. CSS 制作下拉导航
  2. es6 Object.getOwnPropertyDescriptors()
  3. H264参数SPS(序列参数集)和PPS(图像参数集)说明
  4. 一键安装mysql5.6_一键安装MySQL5.6.43脚本
  5. linux 关闭防火墙 centos7,centos7关闭防火墙和selinux
  6. 读取数据库并写入excel表中 发送邮件
  7. 一些移动端的ui框架
  8. Unity3D 5.x 简单实例 - 发射炮弹
  9. openstack 排错
  10. 服务器多网站布置,如何在一台服务器上实现多个web站点的方法