整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

打开一个网站,无法访问;换一个网站,又无法访问。

遇到这种情况的你,会认为是什么问题:断网了?可有些社交软件能正常使用;浏览器出 Bug?可换了浏览器也这样;网络设置问题?可调整过了还是无法访问。

这般令人摸不到头脑的情况昨日发生在了全球众多人身上:无数国外热门网站如 GitHub、谷歌、亚马逊、Reddit、Twitter 和 eBay 等,以及新闻媒体 CNN、卫报、纽约时报、BBC、金融时代,甚至包括英国政府的主要公共服务门户网站,昨日均崩了约一个小时,无法被访问。

分明是不同属性、不同地区的网站,却在同一时间故障,自然令人怀疑其背后是否有某种联系?

这个答案没过多久就浮出了水面:这些网站均由一家名为 Fastly 的云计算公司提供 CDN(Content Delivery Network)服务,而这次全球大范围网站的宕机正是由于 Fastly 修改了一项“服务配置”。

CDN 有多重要?

访问网站,仅需用户一个点击或者回车,但背后却蕴含着一个复杂的过程,其中可能就包括 CDN 服务。

CDN 即内容分发网络,是构建在现有网络基础之上的智能虚拟网络,依靠部署在各地的边缘服务器,使用户能就近获取所需内容,提高用户访问响应速度。

举个例子:你在澳大利亚想要浏览 BBC 网站(British Broadcasting Corporation,英国广播公司),即要与英国服务器连接。虽然通过互联网是有能力将网页从英国传输到澳大利亚,但其中必定存在延迟,这个延迟甚至可能达到几百毫秒,这对追求流畅体验的人而言是个不容忽视的缺点。

但如果有了 CDN 则完全不同。

CDN 会通过中心平台的负载均衡、内容分发、调度等功能模块,将远程站点的页面副本(或页面元素)保存在用户附近并实现按需交付,减少从用户发出请求到他们收到响应的延迟,使用户体验可以快十倍,因此 CDN 也被形象地称为“网络加速器”。

其实大多数人都无法清晰地辨别 200 毫秒和 20 毫秒之间的差距,但如今网站包含众多元素,包括图片、视频等,因此在众多元素的交付时间都加快十倍之后,CDN 的作用就显得尤为重要。

为了确保给全球各地的用户快速交付网页内容,CDN 通常在全球范围内工作,CDN 服务提供商也通常会在世界各地运营数据中心,在主要人口中心保存网页内容副本,以在每个地区都能及时交付内容。

可以说 CDN 的存在极大改善了互联网的服务质量,因而出现了许多纯粹的 CDN 网络运营商,如 Akamai、Cloudflare,还有这次全球网站大范围宕机的“罪魁祸首”——Fastly。

Fastly:原因仅是一个客户更改的“服务配置”

据 Fastly 关于此次全球范围内网站宕机的事件报告显示,这长达一个小时的故障原因就是其标题指明的“全球 CDN 中断”。

Fastly 昨日在 UTC 时间 09:58 发布了一条消息,称:“我们目前正在调查 CDN 服务对性能的潜在影响。”

彼时就已经有众多网友在推特上声称无法访问 BBC、CNN 等新闻网站,GitHub、Reddit 等全球热门网站也陆续无法打开,甚至波及到了英国政府官方网站。

在陷入混乱近一个小时后,Fastly 在 UTC 时间 10:44 更新状态报告:“问题已经确定,并正在实施修复。”Fastly 之后在推特说明道:“我们确定了一个在全球范围内触发中断的服务配置,并已禁用该配置。我们的全球网络正在恢复。”

不过 Fastly 在事件报告中也补充说:“用户可能会继续经历一段时间的源负载增加和缓存命中率(CHR)降低。”即页面响应时间会出现一定延迟。

Fastly 高级工程和基础设施高管 Nick Rockwell 事后写了一篇博文对此进行详细说明:

5 月 12 日,我们开始进行一个软件部署,该部署引入了一个 Bug,该 Bug 可能由特定环境下的特定客户配置触发。

6 月 8 日早些时候,一个客户推送了一个有效的配置更改,其中包括触发该 Bug 的特定情况,这导致我们 85% 的网络返回错误。

此外他也对此次 Fastly 引起的全球大范围网站宕机表达了歉意:“这次中断是广泛而严重的,我们对客户和所有受影响的人们表示诚挚的歉意。”

不容忽视的云服务风险

这并不是第一次发生全球 CDN 中断:2019 年 CDN 加速服务商 Cloudflare 也因为突发服务故障,导致求全范围内如 Coinbase、Discord、Shopify 和 Dropbox 等许多主要网站都崩了。

甚至连 Down Detector,一个专门跟踪哪家网站服务中断的网站,彼时也因为用了 Cloudflare 而无法被访问,导致人们都无法查看他们无法访问的网站是否是正常的。

可以看出,虽然 CDN 服务的确提供了非常有价值的网络浏览体验,但与此同时也需要付出相应的代价:CDN 服务提供商遇到故障时,不会只影响一个网站,而是影响其支持的所有网站。

因此,从这次事件也可以看出如今互联网的背后已是环环相扣,而备受依赖的云服务一旦出错,其连锁反应就不容忽视,像这次全球网站大范围宕机的背后就仅是因为一个变更的服务配置罢了。

对此,数字机构 Think3 的技术总监 Gaz Jones 感慨道:“当一半的互联网都依赖于像亚马逊、谷歌和 Fastly 这样的巨人来提供其所有服务器和网络服务时,就会发生这种情况。”

而关于这种情况该如何避免,CSDN 也询问了相关方面的专家。

  • 有赞技术中心开发支持工程师北洛(昵称):

“这是由于 CDN 厂商导致的问题。现在不论是中小型网站还是大型网站都依赖 CDN 服务来分发内容,提供网站的静态资源加载速度,但是带来的问题就是如果单纯依赖某一个服务商可能会存在服务宕机或像文中提到的变更配置导致的故障。

这种情况可以尝试融合 CDN,即企业同时采购多家厂商的 CDN 服务,然后类似于做负载均衡。当某一个厂商提供的服务不可用时,自动切换到其他服务商,当然前提是要先在其他服务商也做好资源的预热,否则也会导致资源加载慢的问题。不过这样会增加额外的成本,需要企业根据自己的实际情况选择。”

  • 微软顾问咨询服务大中华区 Cybersecurity 首席架构师张美波

“虽然云计算技术带来了按需服务、高扩展性、超大规模资源支持等优点,但是同样的,由于云计算平台的用户、应用和数据资源的高度集中,从而在云计算平台出现故障时,会导致更为严重的破坏和影响。

因此强烈建议大家在选择云计算服务平台时,尽量选择更安全的、更具有领先技术的全球领先云计算平台。

参考链接:

https://techcrunch.com/2021/06/08/numerous-popular-websites-are-facing-an-outage/

https://status.fastly.com/incidents/vpk0ssybt3bj

https://thenextweb.com/news/why-internet-went-down-outage-fastly-cdn

因一个 Bug,谷歌、GitHub、亚马逊等网站全球大范围宕机!相关推荐

  1. 对于华为,英特尔与微软表示继续提供支持;亚马逊亲证云计算服务出现宕机;中国移动5G套餐曝光,每月都含200G流量……...

    关注并标星星CSDN云计算 极客头条:速递.最新.绝对有料.这里有企业新动.这里有业界要闻,打起十二分精神,紧跟fashion你可以的! 每周三次,打卡即read 更快.更全了解泛云圈精彩news g ...

  2. 阿里巴巴宣布架构调整;英伟达放大招!重磅发布 ​TensorRT 7 ,支持超千种计算变换;苹果、谷歌和亚马逊罕见结盟……...

    戳蓝字"CSDN云计算"关注我们哦!  嗨,大家好,重磅君带来的[云重磅]特别栏目,如期而至,每周五第一时间为大家带来重磅新闻.把握技术风向标,了解行业应用与实践,就交给我重磅君吧 ...

  3. 读书笔记之——《谷歌和亚马逊如何做产品》

    入职第四个月,读了<谷歌和亚马逊如何做产品>,觉得书里描述的工作流程.各种注意事项还是比较符合我目前的工作状态,只是自己刚入行,做的事情还都比较小比较琐碎,战略这些比较宏观的方面还没有实战 ...

  4. 八成名校AI教授,都拿过谷歌微软亚马逊们的钱

    郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI AI圈儿的「产学研结合」火到了什么程度? 超过半数的顶尖牛校老师,都有来自产业界巨头的科研资金. 纵然这会让科学技术转化为生产力的进程加快 ...

  5. 星巴克、苹果、谷歌、亚马逊等巨头,为何同时做这件事?

    综合整理|<中国企业家>记者 周夫荣 编辑|马吉英 摘要:除了星巴克之外,苹果.谷歌.亚马逊等高科技公司也早已在可持续能源领域悄然布局.除了经济原因和社会责任,这些公司或许有更深远的考量. ...

  6. 《谷歌和亚马逊如何做产品》

    <谷歌和亚马逊如何做产品> 基本信息 原书名:Shipping greatness:practical lessons on building and launching outstand ...

  7. 【架构】研究谷歌和亚马逊的微服务案例,我们能学习到的经验

    产品复杂度与日俱增.想继续按以前的节奏去演进产品变得越来越困难了,是时候寻找一种更好的方法了.微服务架构承诺可以让团队快速前进... 但与此同时也带来了一系列全新的挑战. 在为Enchant搭建微服务 ...

  8. 谷歌、亚马逊全面开火,一场前所未有的AI芯片大战

    文章经授权转载自新智元(ID:AI_era) [导读]人工智能引发了亚马逊和谷歌之间的芯片军备竞赛,这场竞赛将改变从智能家居到云计算的一切,并且改变了行业玩家的格局,对产业链上下游进行重塑. AI出现 ...

  9. 经济学人:谷歌、亚马逊等巨头有数据技术优势,会接管麦肯锡、波士顿咨询手中业务

    人力资源的教育 其实人力资源(HR)部门这个名字起得很差.除了劳累过度的员工.笨重的技术和成堆的员工手册之外,这个部门没什么别的资源了. 受到各种干扰的招聘人员必须要对远超出岗位需求的申请人进行排序. ...

最新文章

  1. 直播回顾|结构光3D相机光机核心技术及3D成像性能分析
  2. R语言ggplot2可视化轴标签重叠问题解决实战:修改轴标签字体、轴标签垂直于坐标轴(或者旋转特定角度)
  3. 会计证考试《财经法规与职业道德》第三章精选题
  4. PHP核心技术笔记(2):面向对象的设计原则
  5. 读书笔记九:TCP/IP详解之广播和多播,IGMP协议
  6. oracle sql文字列函数,Oracle 数据库SQL中 decode()函数简介
  7. C#LeetCode刷题之#706-设计哈希映射(Design HashMap)
  8. [转]各种互斥量的总结
  9. Python 学习---------Day4
  10. 运筹优化学习19:Cplex中文教程与实例详解
  11. Html5用户注册页面
  12. 最新Java技术栈面试详细完整
  13. Adobe各种最新版本软件下载 PhotoShop Dreamweaver FW Ai Fl.....
  14. 斗破苍穹hd和java版区别_《斗罗大陆》和《斗破苍穹》的区别有哪些?
  15. Python 面向对象 (六) 实例学员管理系统
  16. 前端必会的anime动画库
  17. 如何使用Google Voice接收验证码?
  18. 利用声音传感器控制led灯功能_云中树莓派(4):利用声音传感器控制Led灯
  19. Allegro 灵巧手 -硅步机器人
  20. C语言停车场管理系统,使用栈和队列实现

热门文章

  1. 神经网络滤镜是啥功能,神经网络滤镜不能用
  2. (已上传源码)最近开发的一款应用,我选择了哪些框架 第三方库
  3. oracle 连接组件,[2021] node连接oracle数据库示例[使用oracle官方组件]
  4. 福特锐界2021plus保险盒保险丝说明
  5. [YNOI2017]由乃的商场之旅 莫队
  6. 内部版本号android,分享个老教程:修改手机型号、品牌、内部版本号、Android版本...
  7. 温习古文之念奴娇·赤壁怀古
  8. docke容器启动后立马退出,状态为 Exit(1)的解决
  9. pikachu漏洞练习平台XSS
  10. python 数组去重复