哔哩哔哩“2021.07.13 我们是这样崩的”报告的学习-1

这份报告是我学计算机两年来第一次真实看到大厂的员工到底在干什么。出现了很多专有名词,以及当前最先进的互联网企业的应用究竟是用什么语言,以及出现错误的处理过程。(还有加班到深夜的情况,可以理解出了事故再不加班就不对了)

原报告:2021.07.13 我们是这样崩的 - 哔哩哔哩 (bilibili.com)

尽管一知半解,还是把一些名词以及能搜索到的知识做一个笔记,万一以后就用到了呢。


2021年7月13日22:52,SRE收到大量服务和域名的接入层不可用报警

这里出现了第一个名词SRE。有关这个职业,有一本专门的书籍**《Site Reliability Engineering 》**是做的系统性的阐述。

下图文引用内容为知乎《SRE 是什么,不是什么》

SRE,Site Reliability Engineer,网络可靠性工程师。是Google创造的一个专有职业。网上可以搜索到相关job description。

(看得懂,但是只能看得懂一点点)

SRE 的首要工作任务是保证 SLA。(专有名词的解释里面套专有名词是吧)

SLA,service-level agreement,一般指的是系统的功能指标,比方说系统可用性(availability)达到 99.99%;对于 95% 的请求,响应延迟(latency)低于 200 毫秒等等。

但是根据评论区来看,上文只是对国外的情况进行了阐述,下文是国内SRE的具体职能。

下文引自于《以阿里为例,详解SRE的团队建设与职能分工》

Google SRE的工作主要包括但不限于如下:

  • 基础设施容量规划
  • 生产系统的监控
  • 生产系统的负载均衡
  • 发布与变更工程管理
  • on-call(轮值) 与 Firefighting(紧急故障救火)
  • 与业务团队协作,共同完成疑难问题的处理

而在国内,非常多的SRE部门与传统运维部门职责类似,本质来说负责的是互联网服务背后的技术运维工作。区别于传统的运维SRE,如何在业务研发团队落地SRE,我们做了一年多的探索与实践,笔者认为业务团队SRE的核心是:以软件工程的方法论重新定义研发运维,驱动并赋能业务演进。

关于SRE的具体职能,可在接下来的报告中见到部分。


基于报警内容,SRE第一时间怀疑机房、网络、四层LB、七层SLB等基础设施出现问题,紧急发起语音会议,拉各团队相关人员开始紧急处理

这里的四层LB七层SLB是专有名词,(我一开始读的时候我还以为是位于B站四楼和七楼的什么东西),我没在网络上找到这些东西的具体定义。

根据现在我的理解,这里所说的(当然不可能是具体楼层)是计算机网络的层次结构。

四层是运输层。

七层是应用层。

LBSLB是负载均衡。关于负载均衡可见知乎文章《什么是负载均衡?》 - 知乎 (zhihu.com)文章图文并茂还是不错的。

暂时更到这里,有时间会继续修改并且继续逐步学习的。

哔哩哔哩“2021.07.13 我们是这样崩的”报告的学习-1相关推荐

  1. 2021.07.13 我们是这样崩的

    至暗时刻 2021年7月13日22:52,SRE收到大量服务和域名的接入层不可用报警,客服侧开始收到大量用户反馈B站无法使用,同时内部同学也反馈B站无法打开,甚至APP首页也无法打开.基于报警内容,S ...

  2. 2021.07.13【B站】是这样崩的

    至暗时刻 2021年7月13日22:52,SRE收到大量服务和域名的接入层不可用报警,客服侧开始收到大量用户反馈B站无法使用,同时内部同学也反馈B站无法打开,甚至APP首页也无法打开.基于报警内容,S ...

  3. 2021.07.13 B站是这样崩的

    大家还记得去年这一天,B 站崩了的事情么? 就在昨天 B 站技术部发布了去年 B 站崩溃的事故报告,在这个迟来一年的报告中,简要介绍了故障产生的诱因.根因.处理过程和优化改进,大家可以看看 B 站程序 ...

  4. 项目实训2021.07.13

    下一阶段个工作重心放在了高并发处理上. 了解并学习了可应用于Flask框架的高并发处理方法.

  5. 2021.07.13 洛谷 P7392

    P7392 「TOCO Round 1」奇怪的排序 \color{green}{\texttt{P7392 「TOCO Round 1」奇怪的排序}} P7392 「TOCO Round 1」奇怪的排 ...

  6. b站崩了 呜呜呜 2021.07.13

    #看视频正看得起劲,你给我崩了? ??? 我家没了 >_< 如图 可以看到返回代码502: 其他的不知道了.. 结束. 坐等修复..

  7. 2021.07.17【R语言】丨扩增子课程学习——α多样性简介

    目录 α多样性简介 R语言的安装 R依赖包及需要命令 数据导入 数据导入注意事项 数据塑形 Alpha多样性指数的计算-计算和储存 数据可视化 可视化-数据导入 可视化-数据塑形(合并) 可视化-箱线 ...

  8. 哔哩哔哩(B 站)刚刚崩了

    2023 年 3 月 5 日晚 20:20 左右,许多网友表示在使用 B 站时,手机和电脑端都无法访问视频详情页,且手机端无法查看收藏夹与历史记录. 还有网友表示,首页能够正常加载,但全部是繁体字. ...

  9. 哔哩哔哩2021年Q4及全年财报:全年营收194亿元,同比增长62%

    北京时间3月3日(美东时间3月3日),哔哩哔哩(NASDAQ: BILI,HKEX:9626:以下简称"B站")公布了截至2021年12月31日的第四季度和全年未经审计的财务报告. ...

最新文章

  1. 记录输入框本地记录用户名效果
  2. nodejs服务端MVC架构介绍
  3. 深根固柢 云起磐石——移动云大云磐石服务器重磅推出
  4. java add方法实例_java.util.TreeSet.add()方法实例
  5. 解决Tuxera NTFS for Mac软件安装问题
  6. 推流至Wowza服务器要注意的问题
  7. FixFox 打包xpi扩展
  8. GoLang获取硬盘序列号
  9. vivos7和vivo6有什么区别(主要看配置参数对比)
  10. 有源蜂鸣器和无源蜂鸣器的区别
  11. 什么是射频信号发生器?信号发生器具有哪些特点?(二)
  12. 把sql中的image数据在网页中显示成图片
  13. uniapp上班考勤打卡情况日历展示
  14. 【高仿微信系列】02、消息列表ListView滑动删除
  15. 在c语言中 实参与其对应的形参各占独立的存储单元,以下正确的说法是( )。在C语言中: A.实参和与其对应的形参各占用独立的存储单元...
  16. 占位符语法-Scala
  17. MVC有哪几种过滤器?
  18. 哈工大软件构造笔记1
  19. 揭秘香港房地产,未来中国之我见
  20. 51单片机74ls273并行输出地址c语言程序,51单片机I/O口的扩展问题:使用 锁存器74LS273连接后还是只有8个端口,为什么说是扩展呢?...

热门文章

  1. unity 条目换位效果_Unity AI主题博客条目
  2. APS系统六大要素是什么?企业导入APS(高级生产计划与排程)有哪些好处?
  3. 山中无甲子,寒尽不知年
  4. 又双叕来分享实用的 好用的 方便的 网页转换器了
  5. js抓取今日头条文章
  6. pptpd搭建过程中 启动成功但不显示ppp0端口
  7. 二、CI框架之MCV模型
  8. 微信小程序笔记(三)
  9. python+tkinter+threading制作多线程简易音乐播放器(自动播放,上一曲,下一曲,播放,暂停,实时显示歌曲名并能自动切换歌曲的功能)
  10. 大厂裁员潮下,测试人员路在何方?