背景

最近和小伙伴们吐槽,发现在产品故障review,尤其是涉及到运维的故障review的时候有两个经常背锅的兄弟——“流程”和“监控”。

一般伴随着 发布流程有问题,变更流程不规范,工单流程错误等。

监控呢?基本上就是监控未覆盖,监控报警阈值不合理。

监控问题是运维的重心,这部分内容有机会展开,这几天主要思考了一下流程的问题就一些形而上的务虚的内容掰扯掰扯。

流程的四项基本论断

(本来是想写四项基本原则的怕被喝茶算了)

1 流程需要兼顾效率。

2 没有工具和平台支持的流程终将废弃。

3 流程/工具/平台 最终落实在人的身上。

4 闭环、闭环、闭环

论断1  流程需要兼顾效率

增加流程必须要评估带来的成本和降低的效率,成本提升\效率下降是增加/修改流程必然会带来的负面作用,而且是经常被忽视的。

必须要时刻提醒领导,增加流程会带来成本的增加和效率的降低,怎么说?

以增加审批流程为例,增加一道审批就增加了审批人的工作、并且降低了整体工作的完成效率。对于单个任务也许不明显但是对于量大的日常工单这部分的损耗不可忽略。

完善流程的动力——稳定性可靠性 这是老生常谈的话题,但是稳定性是需要和成本效率做衡量取舍的。

《SRE: Google运维解密》这本书里面明确指出了,不应该盲目的追求高可用性,从99.9% -->99.99%的也不付出的成本是巨大的。

但是也正如DEVOPS里面的墙理论,OPS考虑的是稳定性、DEV考虑的是效率,那么出现了这个流程问题,OPS倾向于增加流程,但是增加流程势必影响DEV的效率?

DEVOPS的实践理论是要推到这堵墙。

综上,当出现了故障,需要谈到增加和修改流程的时候,运维领导必须要考虑到由此带来的成本和降低的效率比较带来的稳定性提升到底是否划算。但是这个问题引发另外两个提问?

问题1: 如何评估上升的成本和降低的效率

问题2;如何评估业务稳定性提升了多少

无法量化无法比较,那无法决策,这个是个难题,这其实是运维的一大课题,如何量化日常运维的成本以及效率?(这得后期展开说了)

但是首先请在故障review的时候得谨慎回应完善流程。

论断2  没有工具和平台支持的流程终将废弃

有了流程,流程在哪?

有人说流程在wiki上,有人说流程在心里。我说流程应该内化在平台上。

信息论里面熵的定义都不陌生,熵让我理解了一件事,如果不施加外力影响,事物永远向着更混乱的状态发展,落在wiki和人心上面的流程也是一样。

流程的确立规范标准化需要人力维持,一旦人员变更,事有松懈,那么在wiki上面的流程区域混乱。

发布的流程、变更的流程需要工具和平台将流程内化在自动化平台内。

这是运维自动化、平台化的内涵,把一切流程内化涵盖,这也是论断1效率的要求。

论断3 流程/工具/平台 最终落实在人的身上

所有的问题都是人的问题,完善的流程、自动化的平台也挡不住低级错误不断的人的失误。

流程工具平台之外,对于运维人员素质培养意识提升是至关重要的。

哲学上看这部分属于主观能动性了,素质高的人员在小米加步枪的情况下也能取得胜利。

论断4 闭环、闭环、闭环

闭环啥意思?

强调三遍的意思在于,任何一个流程要能形成一个正反馈的闭环,流程自身有不断修正反馈问题的机制。

哪些环节的不断修正?

效率(流程的各个环境的效率统计)

成功率(流程各环节流转的成功率,比如发布成功,变更失败统计)

审批(审批时效等)

等等

以上其实涉及到了运维数据运营的范畴。

一个流程结束之后必然要能体现什么,反馈什么。

应用运维的价值体现

1 协助应用产品方设计使用合理的流程,合理体现在需要在稳定性与成本效率之间做好平衡,这个平衡也只有应用运维才好去把控。

2 推动产品相关流程的自动化平台化服务化,运维开发本身需要应用运维去确定流程,并且不同产品之间也需要组合不通的流程,平台化建设需要应用运维推动。

3 人的价值就是指应用运维的价值,在平台流程趋向完善之前,应用运维是稳定性和成本效率的摆渡人。(我在瞎扯请忽略)

4 闭环本身就是数据运营本身是应用运维的另一个价值点。

广告时间依旧:

网易运维与账号中心正在招聘包含了应用运维、系统运维、数据库运维、运维开发相关岗位:

有兴趣加入的伙伴请简历 hzluyang@corp.netease.com

转载于:https://www.cnblogs.com/hzluyang/p/9220532.html

什么,又是流程有问题?相关推荐

  1. MySql轻功-存储过程

    存储过程 一.存储过程概述 二.存储过程的参数 1.in 2.out 3.inout 三.存储过程中的变量 1.局部变量 2.用户变量 3.系统变量 四.存储过程的条件定义和处理 1.条件处理 2.条 ...

  2. 首席工程师揭秘:LinkedIn大数据后台是如何运作的

          原文转自:http://kb.cnblogs.com/page/518558/       摘要:Jay Kreps是来自LinkedIn的首席工程师,他表示日志几乎在计算机产生的时候就存 ...

  3. 每个软件工程师都应该知道的有关实时数据的统一概念

    转自:炼数成金 每个软件工程师都应该知道的有关实时数据的统一概念 我在六年前的一个令人兴奋的时刻加入到LinkedIn公司.从那个时候开始我们就破解单一的.集中式数据库的限制,并且启动到特殊的分布式系 ...

  4. 次世代游戏建模该如何开始学习呢?低模到高模角色模型的具体流程又是怎样的?

    首先,如果你想学习游戏建模,那么我建议你从3Dmax开始学起,熟悉软件后做做简单的道具,大概一到两个,武器什么的都是可以的. 然后开始场景,这个考虑的就比较多了,所以放在后面.大概自己练习两三个就行. ...

  5. 做一个PMC需要懂得哪些知识?PMC的流程又是什么?工作重点内容是什么?

    PMC代表Product Material Control的缩写形式,意思为生产及物料控制.通常它分为两个部分----PC&MC PC:生产控制或生产管制(台.日资公司俗称生管).主要职能是生 ...

  6. 武汉市小型微型企业创业创新示范基地申报条件是什么?申报流程以及材料又是什么?

    今天我给大家带来的是关于武汉市小型微型企业创业创新示范基地申报工作的讲解,内容包含示范基地的申报条件.申报材料.申报流程等相关内容,想要申报的可以来了解一下,同时对以下内容有疑惑的可以随时来提问: 一 ...

  7. 奢侈品典当价格以及流程又是如何的?现今哪些品牌的奢侈品押呗可以典当!

    现今可以典当物品包括很多,特别是奢侈品之类的,不过也不是所有的奢侈品品牌都可以典当,哪那些奢侈品品牌嫩典当呢?接下来为大家一一说明一下吧. 首先,我们先来了解一下能典当的手表品牌吧.一般像劳力士.百达 ...

  8. Rocksdb 写流程,读流程,WAL文件,MANIFEST文件,ColumnFamily,Memtable,SST文件原理详解

    文章目录 前言 Rocksdb写流程图 WAL 原理分析 概述 文件格式 查看WAL的工具 创建WAL 清理WAL MANIFEST原理分析 概述 查看MANIFEST的工具 创建 及 清除 MANI ...

  9. 2016cocoapods安装流程及使用

    一:参考安装流程:http://blog.csdn.NET/showhilllee/article/details/38398119/. 二:我的安装步骤. 1:安装cocoapods需要ruby,先 ...

  10. 一文搞定深度学习建模预测全流程(Python)

    作者 | 泳鱼 来源 | 算法进阶 本文详细地梳理及实现了深度学习模型构建及预测的全流程,代码示例基于python及神经网络库keras,通过设计一个深度神经网络模型做波士顿房价预测.主要依赖的Pyt ...

最新文章

  1. SAP SD基础知识之创建并处理外向交货单
  2. Linux 用户管理命令笔记
  3. oracle10g的rat模拟,Oracle 10g Logminer 研究及测试
  4. 工作231:给input动态赋值
  5. 项目管理学习总结(12)——世界上最好的十条研发管理经验
  6. [转载] wikipedia 维基百科 语料 获取 与 提取 处理 by python3.5
  7. C语言程序设计 授课日历 2010年春季
  8. [教程]Web自动化测试怎么做?Web网页测试全流程解析
  9. 迅雷上如何下载热映的电影大片~~
  10. 计算机声卡和显卡驱动,电脑系统会不会影响声卡和显卡程序
  11. linux图片编辑器下载软件,Pix图片编辑器
  12. Binomial Coefficient(二项式系数)的计算
  13. 计算机睡眠状态无法唤醒屏幕,电脑休眠后无法唤醒,可以用这个方法-华力学校...
  14. c语言中汉字编码,【C语言学习】C语言汉字编码。。。C语言中汉字的输入
  15. 一步步教你搭建Android开发环境(有图有真相)--“自吹自擂:史上最详细、最啰嗦、最新的搭建教程”
  16. oracle ora-03114
  17. 联想小新 Pad Plus 2023 款评测
  18. poco linux安装
  19. 大学里面必拿的证书四六级证书
  20. C++ Poco库编译方法

热门文章

  1. 使用tc对linux中某ip段限速
  2. 使用java创建kafka的生产者和消费者
  3. 【转载】 扫描二维码自动识别手机APP下载地址
  4. 软件设计是怎样炼成的(6)——打造系统的底蕴(数据库设计)(下篇)
  5. 招聘 | 浙大杨杰课题组-博士后与科研助理-医学AI/NLP
  6. ERNIE 3.0 | 刷榜了!60多项任务取得最好效果
  7. 【机器学习案例】酒店用机器学习,预测哪些客人会放鸽子
  8. 清北中科院12位大咖联手,带你入门AI热门领域NLP!限时只需199
  9. 本周论文推荐 -- 对抗生成网络、知识图谱补全、对话系统、文本生成
  10. 最新资源《机器学习图像算法与建模优化》免费开放下载!(含代码数据)