2020年4月10日上午,华为云出现了大面积故障,华为云平台承载了300多万用户,其中160万开发者,影响面积可想而知。

随着云计算技术的飞速发展,企业已经大概率选择上云,随着用户的增加,共有云出现故障的的概率也大大提高,作为一个云计算行业的从业者,下面就华为云出现大面积宕机情况进行一下可能情况分析。

背锅侠分析

背锅侠分析:肯定不是蝙蝠,也不是穿山甲,那背锅侠是谁?

第一背锅侠-农民工

对,就是农民工,更大可能还是个临时工,背锅侠的概率较高,背锅理由,机房光纤挖断断了,导致网络故障,影响面积:单个IDC节点的网络故障,服务器不会宕机,其他节点业务正常;这种情况出现概率:低,因为IDC机房的基本都是双路由,除非用了黑IDC机房,或者IDC机房外围被围拆了。2019年6月AWS就出现过一次《因光缆被切断,亚马逊中国 AWS 云服务断网 12 小时》,2019年7月谷歌云的光缆也被割了,《谷歌云瘫痪:因光缆断裂、目前未恢复》。

 光缆被切断?

第二背锅侠—实行生

 实习生

高科技企业都喜欢招聘实习生,不但便宜,还好用,关键的时候还能背锅,2017年2月28日,云计算鼻祖亚马逊AWS的云存储团队在调试时错输了一条指令,意外移除了大量服务器,导致进出AWS东一服务区基础设施的流量瞬间消失,停机长达3小时之久,背锅侠就是实习生;2018年6月27日,阿里云出现故障,流行的段子:刚刚找了两个实习生-误删了登陆服务。当然官方的回复还是比较诚恳,表达了希望保持更严谨工作态度。 

阿里云故障

这个问题的概率比较高,云计算属于高度自动化的产品,产品出现问题属于正常现象,所以云计算企业的实习生的招聘会长时间存在,因为未来的锅也不少。

第三背锅侠-黑客

黑客

黑客是的没错,就是他,谁让他干坏事,黑客的常用手法就是流量攻击,《AWS DNS服务器遭受DDoS严重攻击,瘫痪15个小时》,《由于突发大流量攻击 致阿里云域名解析服务异常》,怎么应对,购买高防IP,购买高防服务。我的天,价格好高。所以黑客的存在,导致了网络防护市场的繁荣和火爆,由于采用了公有云,所以作为业主,如果想降低被攻击的可能性,还是要管理好自己的服务器和业务系统,做到无懈可击。

第四背锅侠-工程师

 工程师

前面讲的实习生是背锅侠,当然,这么庞大的系统,工程师的存在是必不可少的,但是工程师也有出错的时候。2020年3月26日,3月16日,Microsoft Azure

微软Azure公有云出现超过8小时的存储可用性问题,主要影响到美国东部的客户。有些用户无法配置新的存储空间或访问本地现有资源。之后,一个微软工程团队确认原因为断电导致的存储集群不可用。

除此之外,微软还在Azure状态页上列出了一个软件错误,该错误影响跨多个服务的存储配置超过一个小时,是因为工程师添加服务器内存导致的。2017年3月16日,Microsoft Azure微软Azure公有云出现超过8小时的存储可用性问题,主要影响到美国东部的客户。有些用户无法配置新的存储空间或访问本地现有资源。之后,一个微软工程团队确认原因为断电导致的存储集群不可用。所以工程师作为一个高危职业真的需要更加谨慎,下手之前慎之又慎。

第五背锅侠硬件故障.......

第六背锅侠软件故障.......

第七背锅侠.........

华为云本次大面积宕机无非也就这些原因吧,期待华为官方的解释。

在全民上云的时代,安全很重要,鸡蛋不能放在同一个篮子里面,不管你的业务是大还是小,不管云服务商宣称的是99.9%,99.999%,99.99999999%的品质,但你都有可能变成最后面那个1。

华为云

所以重要的事情说三遍,鸡蛋不要放在一个篮子里面,你一定要选择多云。

主力的业务占可以选择一些大的云服务商,或者选择性价比高的云服务商,选择便宜的云服务商做备份。

当然,如果你的业务流量很大,你也可以选择便宜的云服务商做主力,节省你的成本,然后选择一个大的云服务商作为备份。除了两个备份,你也可以选择三个备份。在高科技平民化,云计算普遍化时代,多云的部署和维护成本很低,所以不要被你的CTO,CIO忽悠了:某某云是大品牌,出事也没事。当你的业务挂了,被K的是你这个CEO。

所以请注意,鸡蛋不要放在同一个篮子里面,否则你将是下一个背锅侠!

点击查看往期内容回顾

爱奇艺做空被实锤:不扎实报告可信吗?

立国之本——制造业,云计算、大数据助推升级中

长按二维码,关注我们

新睿云,让云服务触手可及

云主机|云存储|云数据库|云网络

华为云大面积宕机的原因思考-谁是下一个背锅侠?相关推荐

  1. RegionServer宕机的原因

    2019独角兽企业重金招聘Python工程师标准>>> HBase集群在运行的时候会出现RegionServer宕机,原因: 网络断开,心跳发送失败,尝试连接其他的zookeeper ...

  2. 华为云服务器宕机,阿里云无人撼动!

    华为云的宕机事件引起舆论轩然大波. 2022年4月10日上午9时左右,华为云"挂了"的话题频繁出现在微博等公众平台.在此次的事件中,除了华为云登录,管理后台无法访问外,还出现了服务 ...

  3. 有了堡垒机,运维工程师们不再是背锅侠啦

    众所周知,运维工程师的工作比较繁琐杂乱,且经常是背锅侠.所以要想舒舒服服做好IT运维工作,就要用堡垒机!用了堡垒机,从此告别背锅侠!下面我们小编就给大家简单讲解一下堡垒机的定义.作用.功能等等,希望可 ...

  4. MongoDB一次节点宕机引发的思考(源码剖析)【华为云分享】

    目录 简介 日志分析 副本集 如何实现 Failover 心跳的实现 electionTimeout 定时器 业务影响评估 参考链接 声明:本文同步发表于 MongoDB 中文社区,传送门: http ...

  5. MySQL本天早上8点到明早8点_似乎找到 OSChina 早上 8 点钟容易宕机的原因

    最近一段时间,OSChina 网站在早上 8 点出头的时候很容易因为数据库连接池爆满而导致网站宕机.表现的情况是数据库处理大量的查询,堆积大量并发连接,导致无法再连接到数据库,执行一个简单的查询速度也 ...

  6. java项目宕机出现原因,java服务宕机原因查询

    在JAVA服务项目上线之后经常会出现宕机的情况 常见原因 内存溢出 1.查到服务进程号 [root@wms ~]# ps -ef|grep java root 6399 6069 0 08:57 pt ...

  7. 服务器宕机的原因通常有哪些

    1.服务器环境的客观原因.比如机房断电导致的服务器断电.机房温度过高,导致的服务器死机.关机等.不过这种情况般很少发生,因为像亿速云机房等数据中心,通常都有很好预防措施,比如备用电路.备用发电机.全时 ...

  8. 说说阿里云大规模宕机

    背景 云服务市场是一块大蛋糕,从如今的各大巨头都纷纷出手想分得一杯羹就能看出.而国内巨头阿里爸爸早在2009年就看准了时机,这里当然少不了要提到阿里云创始人:王坚.破釜沉舟的方式用命换来的成就,阿里每 ...

  9. 范冰冰李晨分手让微博一度宕机的原因分析

    6月27日晚间,范冰冰.李晨通过微博正式宣布分手.然后微博就一度宕机了-- 阿明观察评论:对于微博来说,几次遭遇了明星事件而导致宕机,不知道微博的技术架构到底是什么样子的? 可能,微博技术运维管理员会 ...

最新文章

  1. 基于zookeeper的solrCloud集群搭建
  2. java最长类名_在java规范中类命名的字符长度是多少?
  3. 分布式事务 GTS 的价值和原理浅析
  4. c# mvc html.beginform,asp.net-mvc – 使用Html.BeginForm()与自定义路由
  5. MyBatis(4)动态SQL
  6. CSS 3 中的伪类选择器
  7. java inputstream字节流_Java输入输出流ByteArrayInputStream和ByteArrayOutPutStream
  8. CF 132E 费用流
  9. NOIp 2014 联合权值 By cellur925
  10. Python实现 N*N 乘法表
  11. 免费的Access数据库员工管理系统下载-IT技术网站 企业人员管理系统源码
  12. Ubuntu16.04 安装国内版火狐浏览器,同步标签
  13. windriver 自动生成pcie驱动
  14. HTML页面调用打印机打印pdf文件
  15. python saveas_如何使用Python SaveAs对话框
  16. 特别关注:“网络同居”热背后的心理学分析
  17. win10中如何找到隐藏的文件
  18. 密集创投迎来爆发期 今年会是链游之年么?
  19. 各类计算机接口标志,电脑usb3 USB4接口标准标识被英特尔重新规范
  20. 全要素分析与问题解决:以人为本,主次分明

热门文章

  1. android 刷机后熄屏断网
  2. 用微信小程序写一个计算器
  3. 申请计算机的ps,美国研究生申请材料 计算机PS范文参考
  4. 【刷题篇】领扣3171.找出1- n 中能被 x 整除的数(python)
  5. 数据的逻辑结构和存储结构
  6. 春校赛——求索溪的树枝
  7. Win11 WiFi功能消失解决方法之一
  8. 特殊的日子诞生我的第一篇博客!
  9. Spark:基于PySpark的逻辑回归和决策树模型对泰旦尼克号幸存者预测的机器学习流程
  10. 好东西大家分享: 微软界面设计指导