10月,由嘉为科技携手腾讯蓝鲸智云联合主办的智慧生长·研运未来暨2021年研运治理实践大会在北京成功召开

在下午进行的智能化运维分论坛上,来自嘉为蓝鲸的解决方案架构师李方园同与会嘉宾探讨了IT运维团队如何应对数字化转型中,企业业务爆发式增长、应用架构越来越复杂等情况,并带来了《基于SRE理论,建设企业业务连续性管理体系》的专题演讲。

一、SRE运维剖析

作为近年热词的SRE自被提出以来,引起了各方的关注和思考。随着技术的迭代,在基础运维、云计算运维的基础上,SRE工程师更多地关注工具化、流程化的建设,更进而地去思考平台化,体系化,全面化的技术栈设计。在业务侧的推动下,企业对敏态效率和稳态安全的全面关注;对保障稳定和质量同时控制成本、提升价值和效率等多方面的需求都对SRE在企业的内部落地提出了更高和更针对性的要求。

美国的数字化服务公司Mikey Dickerson对SRE运维体系架构提出了以下的金字塔理论。总的来说,SRE运维是以用户体验为最终目标,在保证持续沟通的基础上以业务为导向,为企业数字化赋能。

注:图片来源于美国数字服务公司

因此,SRE工程师的工作重点可以总结为以下四点:

  1. 预防和事故应对;
  2. 保证业务连续性;
  3. 具备从业务视角思考问题的能力,实现运维从技术到业务的提升;
  4. 建立高度的工具化和自动化。

二、基于SRE的业务连续性管理体系建设方法

从根本上看,提升业务联系性可以通过两个方式:

  • 加强应用及架构健壮性管理,即令连续时间更长,减少无故障时间;
  • 保证运维有效性管理,即令不可连续时间更短,降低故障持续时间。

建设的关键步骤可以分为以下几点:

关键一:构建运维管理基石—配置管理

标准化是后续自动化、数据化、智能化的基础。优先建设好CMDB,关注配置数据是为构建运维管理打下的坚实基石。而CMDB作为在CI、CD和CO领域共需的架构,以业务为导向,搭建一套可视、可信、可管、可用的配置管理体系。

关键二:建设可观测的监控能力—监控中心

在有效获取数据后,需要建设一个“抓得到、看得见、搞得定”的监控体系。将底层不同的设备对象进行全面覆盖,同时整合既有监控告警工具,实现一体化管理,向上以有效的方式进行展示和处理。

关键三:构建故障全生命周期管理提升业务连续性

在业务连续性管理场景下,企业可以围绕故障预防、故障处置、故障运营,建立数字化管理,实现运维服务闭环,提升全局故障治理能力。

关键四:个性化开发工具助力SRE平台设计

SRE运维的关键在于高度的工具化和自动化,同时工具需要满足企业灵活多变的业务需求场景和个性化的建设要求,所以需要构建一套门槛低、灵活性强的工具开发能力。

三、嘉为蓝鲸业务连续性管理解决方案

围绕业务连续性需求及关键点,嘉为蓝鲸基于腾讯蓝鲸智云平台构建了如下能力:

  • 构建全局可视化,展示业务稳定性全局视图
  • 构建统一数据中心
  • 统一监控告警中心
  • 业务运维中心能力
  • 工单中心,建设敏捷流程
  • 蓝鲸PaaS工具,助力个性化工具构建

方案特点

  • 融合联动:有效融合资源管理、监控告警、工单、知识库、自动化的能力,实现故障全生命周期管理;
  • 简单易用的一站式运维平台;
  • 运维知识与最佳实践驱动:包括常见CMDB模型、标准监控插件、最优告警策略、故障处置预案、脚本库及知识库;
  • 持续改进:基于腾讯蓝鲸智云的生态可持续发展,以及嘉为蓝鲸300+行业头部企业落地经验的持续回流。

若你对该分享的PPT感兴趣,可以私我。码字不易,如果你觉得对你有所帮助,欢迎点赞评论加关注,后续还会出更多优质文章。

SRE理论:企业业务连续性管理体系该如何建设?相关推荐

  1. 浅析商业银行“业务连续性管理体系”的构建

    当前世界所面临的风险有恐怖袭击.黑客. 网络侵袭.电脑病毒.自然灾害.大规模停电.罢工.环保.市场恶性竞争.企业倒闭等,近年来发生的"9.11"."SARS"事 ...

  2. 业务连续性管理体系建设

    GDS是国内较早提供灾难恢复和业务连续性服务的专业服务提供商.GDS根据多年的实践经验和理论基础,总结出了一套行之有效的BCM(业务连续性管理/Business Continuity Manageme ...

  3. 毁灭还是生存?业务连续性管理考验公司基业常青-系统体系风险防范

    业务连续性管理(BusinessContinuityManagement,简称BCM),是一项综合管理流程,使企业认识到潜在的危机和相关影响,制订响应.业务和连续性的恢复计划,其总体目标在于提高企业的 ...

  4. 运维的进击“转型”:阿里业务连续性管理最佳实践

    公众号回复:干货,领取价值58元/套IT管理体系文档 公众号回复:ITIL教材,领取最新ITIL4中文教材 说明:本文根据付来文老师在 GOPS 全球运维大会 2021 · 深圳站的演讲速记整理而成. ...

  5. 银行业灾备及业务连续性管理:从混沌走向清明

    <金融时报>记者 潘竑 2007-01-17     每每提及灾难备份与业务连续性管理,银行业总是被誉为行业中的"领头羊".这不仅是由于其起步早,上世纪90年代末,部分 ...

  6. 金融机构业务连续性管理

    目录 一.金融机构制定业务连续性计划的必要性 金融机构业务连续的意义 金融机构业务连续的目标 二.金融机构应该如何制定业务连续性计划 业务连续性管理框架 董事会.管理层责任以及审计要求 业务冲击分析和 ...

  7. 混沌工程实验室丨同创助力金融行业业务连续性管理

    近期,工业和信息化部印发了<'十四五'软件和信息技术服务业发展规划 >,明确了软件是信息技术关键载体和产业融合关键纽带,其中软件系统稳定性是促进软件行业高质量发展的基石.<证券期货业 ...

  8. 业务连续性管理峰会2007演讲记录

    业务连续性管理峰会2007演讲记录 2007-09-24 13:11 作者: 佚名 出处: 天极Yesky 责任编辑:黄惟冰 演讲一:从国际标准中看业务持续性管理的发展 申屠献忠 通标标准技术服务有限 ...

  9. 银行业“业务连续性”管理(上篇)

    近期,有些金融行业的客户咨询咨询"业务连续性"的相关问题,客户提问"信息科技部门的灾备管理是否就是业务连续性管理?如果不是,那么二者的区别是什么?"" ...

最新文章

  1. Django博客系统(首页用户名展示)
  2. django 完整日志配置
  3. Thymeleaf提取公共页面(从实例入手,以inspinia模板为例)
  4. Mybatis开发CRUD
  5. js如何监听元素事件是否被移除_JavaScript 监听元素是否进入/移出可视区域
  6. Java案例:利用JDBC连接Oracle数据库
  7. 大数据中心有什么作用
  8. html5表单与Jquery Ajax结合使用
  9. 这才是程序员该有的桌面壁纸!
  10. PHP 千图成像,千图成像,教你制作由无数图片组成的人像效果
  11. Android系统版本与版本代号中英文名字
  12. Photoshop快速抠图:使用蒙版工具
  13. ❤️「Python」初阶,必看系列, 万字只为你,建议点赞收藏~❤️
  14. 梁漱溟:人生的三种态度 | 合道的生活
  15. 使用mysqldump+WinRAR压缩备份数据库
  16. 如何在Windows上测试ip和端口
  17. fgetc、fputc、fputs、fgets的使用
  18. 启动tim时为我自动登录不能勾选(为灰色)
  19. Python批量word2pdf、ppt2pdf
  20. BGP(1):BGP 的基本机制

热门文章

  1. 自学Python不知道从哪里开始?这13个网站,能帮你省下好几个W的学费
  2. Python之定义类并创建实例(一)
  3. 1286. 太空电梯
  4. mysql客户端程序功能_MySQL——客户端工具简介
  5. 控制Boos缓慢的转向主角
  6. 从太平洋电脑城关张引发的思考
  7. mysql:安装版(解压版)MySQL下载、配置、安装以及解决MySQL服务无法启动问题
  8. Python · 实现鼠标绘画
  9. html期末大作业美食主题网页源码0006
  10. webservice和ajax区别,WebService简单介绍