【干货】运维,你是青铜还是王者?
传统的观点中、运维就是保障业务运行得稳定、高效、安全,但时至今日,这个运维的价值观恐怕早已过时了,我们希望运维能够成为公司的核心竞争力之一。
这就促使了运维向技术运营的转变,技术运营的能力建设以业务为中心,交付稳定、安全、高效的技术运营服务,从而有力支撑企业的持续发展和战略成功。技术运营不仅关注“稳定”、“安全”、“可靠”,更要关注“体验”、“效率”、“效益”。
一、我们从七个维度提出问题,探究你的技术运营转型之路处在什么水平,是青铜还是王者?
监控管理:仅仅是有基础的监控能力,还是已经实现高度智能化?
事件与变更管理:仅仅是有基本的事件规范和变更操作要求和处理风险能力,还是已经实现智能化支撑,具备无人化、自愈和自改进能力?
配置管理:仅仅是依靠人工保障配置记录的管理,还是已经实现智能化配置管理,支持场景智能生成配置对象的关联规则和提供准确的决策依据?
容量与成本管理:仅仅是具备基础预算、基础设施容量监控与业务的指标汇聚能力,还是已经实现智能化管理容量与成本?
高可用管理:仅仅是支持流量切换,硬件故障能及时回复,数据库备份可靠,还是已经实现全面自动化和智能化的高可用管理,并持续改进?
业务连续性管理:仅仅是具有基础的业务影响分析与业务风险分析能力,有基本的应急演练,故障恢复时间较长,还是已经实现整体 RTO(恢复时间目标) 达到99.995%,引入更多智能化技术,3分钟内完成问题解决?
用户体验管理:仅仅是具有快速处理用户体验的投诉问题,具备丰富的业务端的数据收集能力,还是已经引用AI技术,建立业务领域级别的用户体验类知识图谱或专家系统?
二、技术运营能力建设的5个段位,每上一个台阶都是质的飞跃。
青铜段位
有基础的监控,能满足对系统级(CPU等)的监控需求。
具有基本的事件规范和变更操作要求,可及时处理事件和管控部分变更风险。
依靠人工保障配置记录的管理。
具备基础预算、基础设施容量监控与业务的指标汇聚能力。
支持流量切换,硬件故障能及时回复,数据库备份可靠。
具有基础的业务影响分析与业务风险分析能力,有基本的应急演练,故障恢复时间较长。
具有快速处理用户体验的投诉问题,具备丰富的业务端的数据收集能力。
白银段位
有基础的监控,能满足对系统级(CPU等)的监控需求。
具有基本的事件规范和变更操作要求,可及时处理事件和管控部分变更风险。
依靠人工保障配置记录的管理。
具备基础预算、基础设施容量监控与业务的指标汇聚能力。
支持流量切换,硬件故障能及时回复,数据库备份可靠。
具有基础的业务影响分析与业务风险分析能力,有基本的应急演练,故障恢复时间较长。
具有快速处理用户体验的投诉问题,具备丰富的业务端的数据收集能力。
黄金段位
具有面向应用场景的告警与可视化平台,可实现常见故障自愈。
完善的事件与变更管理流程,与其他技术运营流程打通,具有平台化与可视化能力。
自动化配置管理平台,支持自动发现、灵活扩展和关联分析。
具备业务容量与基础设施容量关联分析能力、柔性服务能力,灵活成本管控的能力。
自动化动态扩容,采用分布式缓存、分表分库、跨库事务等技术,同城多机房实时数据备份,异地数据备份。
整体RTO达到99.95%,主动模拟注入故障并快速定位和解决,2分钟响应,5分钟定位并启动预案,10分钟完成问题解决。
具有自动跟踪及用户改善工具,5分钟内发现质量数据异常。
钻石段位
监控管理实现阈值动态调整等初步智能化,全网数据秒级上报,可实现自动化决策。
深度规范化,部分场景借助智能化技术实现管理与质量的降本增效。
智能识别配置对象的关联关系,配置信息能为技术运营活动提供决策支持。
支持全链路的容量管理能力,为技术和架构提供支持。
结合监控自动扩容缩容,系统拓扑结构自动梳理。
整体RTO达到99.99%,应急和危机处理组织结构完备,对故障基本能通过告警主动发现,1分钟响应,3分钟定位并启动预案,5分钟完成问题解决。
界定区分用户群体及单用户行为轨迹的完整链条的体验表现,触达运营指标,如回流用户转化率等。
王者段位
智能决策、推荐等高度智能化。
实现大部分场景的智能化支撑,具备无人化、自愈和自改进能力。
智能化配置管理,支持场景智能生成配置对象的关联规则和提供准确的决策依据。
智能化管理容量与成本。
实现全面自动化和智能化的高可用管理,并持续改进。
整体RTO达到99.995%,引入更多智能化技术,3分钟内完成问题解决。
引用AI技术,建立业务领域级别的用户体验类知识图谱或专家系统。
【干货】运维,你是青铜还是王者?相关推荐
- 运维必备生存指南 |《王者荣耀》乱象竟然也能反映出运维生存现状?
<王者荣耀>已成为社会现象级手游,随之问题接踵而来.部分小学生沉迷后为买游戏道具刷爆家长银行卡.为抢夺游戏中"buff(增益效果)"大打出手. 这些问题怎么产生? 责任 ...
- 青铜到王者,快速提升运维的 MySQL 数据库段位!
现在大多数人选择放松自己的方式就是玩游戏,最为突出的可能就要属手游"王者荣耀". 据说这款游戏上到70旬老者,下至小学生都玩,老张我也玩.段位低得可怜(PS:最近刚玩哈),刚刚白银 ...
- 【拒绝花里胡哨】运维实用手册shell篇(无废话,全程暴力干货)
目录 文件 sort排序 find查找 vim编辑器 归档解压缩 文件ACL权限控制{ svn 恢复rm删除的文件 openssl 软件 系统 文件 ls -rtl # 按时间倒叙列出所有目录和文件 ...
- 技术干货集中营——WOT 2017全球架构与运维技术峰会
技术干货集中营--WOT 2017全球架构与运维技术峰会等你来! WOT,World Of Tech专注互联网IT技术领域 三大章节,15大技术专场,60+国内外一线互联网精英大咖站台 打造兼顾技术视 ...
- 干货 | 网易大数据平台运维实战
本文整理自SACC2021中国系统架构师大会,是网易金川老师视频直播的文字版本,他分享的主题是"网易大数据平台运维实战" 各位SACC观众,大家好,感谢各位参加本次智能运维实践会场 ...
- python 自动化运维 读取交换机数据_技术干货|数据中心自动化运维技术探索之交换机零配置上线...
近几年来,互联网行业处于一个快速发展的快车道,一个又一个风口不断地涌向周边行业.共享单车的出现解决了人们出行***一公里的问题:新零售概念的提出,无人货柜的出现,更是将线上和线下的数据打通,优化了人们 ...
- 【干货】美团点评架构师私藏的内部Linux运维笔记!
最近不少小伙伴后台联系,希望能弄一些大厂的学习资料,我这边费了很大劲,联系到老朋友,原美团点评架构师张sir,问他要了些美团点评架构的内部资料. 这份资料含金量非常高,包含整个美团点评架构架构图,Li ...
- 【Linux云计算架构:第三阶段-Linux高级运维架构】第25章—— 搭建jumperserver管理王者荣耀数万台游戏服务器
本节内容: 34.1 Jumpserver堡垒机概述-部署Jumpserver运行环境 34.2 安装Coco组件 34.3 安装Web-Terminal前端-Luna组件-配置Nginx整合各组件 ...
- 干货 | Apache Doris在小米集团的运维实践
本期技术干货,我们邀请到了小米OLAP引擎研发工程师魏祚.小米存储计算引擎SRE工程师孟子楠,和大家从运维的角度分享Apache Doris在小米集团的应用实践. 一.背景 为了提高小米增长分析平台的 ...
最新文章
- 逻辑回归 + GBDT模型融合实战!
- [笔记]Linux内核学习之旅--软中断与tasklet
- 已知c语言程序有主程序模块prog.c,嵌入式系统试卷--A卷
- mysql开窗函数over_sql中的开窗函数over()
- 《剑指offer》最小的k个数
- CSS Scrollbar (滚动条)
- 如何让地面不起灰_什么是不发火地面,如何施工?
- 笔记本交还公司了,伴随了我两年的家伙。
- Orchard核心机制
- 51nod1242--斐波那契第n项--矩阵快速幂
- svg元素 标签增加、移除class名
- win8计算机关机时 重新配置windows 以后打印机不能用了,win8系统打印机发送打印任务后不打印自动消失的技巧介绍...
- springmvcHandlerMapping解析
- 4.2.2 屏幕保护程序
- 趣谈 | Acala 文化启蒙与设计
- Android keytool 不是内部或外部命令
- 【老达人吐血整理】800种绘本的小达人点读包下载
- Android通讯录开发之通讯录联系人搜索功能最新实现,kotlin入门到精通pdf
- uluaFramework--框架简单介绍
- 基于Opencv的汽车车牌识别