大型网站运维之道漫谈

网站运维绝不是某些人眼中安装系统、做几根网线那么简单: 除去应用开发和业务运营之外的保障网站能运转的事儿都可能是运维工作的职责范围。本系列是冯大辉(Fenng)的一个系列博文,从可用性、监控与报警机制、容量规划、流程规范、知识管理与积累、自动化管理等方面,探讨了大型网站运维需要考虑的因素。当然,有些理念对各种规模的网站都是通用的。
  更多内容可关注Fenng的博客dbanotes.net。

从可用性到自动化

网站运维之道 关于可用性
所谓网站可用性(availability)也即网站正常运行时间的百分比,这是每个运营团队最主要的 KPI (Key Performance Indicators ,关键业绩指标)。对于 Web 站点来说,传统的那个 24x7 的说法已经不是很适用了,现在业界更倾向用 N 个9 来量化可用性, 最常说的就是类似 "4个9(也就是99.99%)" 的可用性。

网站运维之道 监控与报警机制
多数网站都会倾向于利用开源软件自行搭建监控平台。笔者一向认为,即使网站只有一台服务器,也应该搭建监控工具,这是保障网站能持续改进的基石。有些公司的运维团队喜欢自己写监控工具而不是利用已有的第三方开源工具。这种重复发明轮子的做法笔者认为是不可取的。

网站运维之道 之容量规划
有效的监控能够避免绝大多数问题的扩大化,但是还是做不到防患于未然。所谓的容量规划,也就是一个公司为了满足商业目标的需求而决定生产能力的过程。

网站运维之道 之流程规范
对于相对正规的网站维护工作,所有网站的所有变更必须能做到有记录,可回溯。如果是单枪匹马作战,那么要实现这个目标并不是很难,只需要把好习惯培养起来就成了,可如果要面对一个团队,那么就必须要依赖流程规范来进行约束。

网站运维之道 之知识管理与积累
知识管理(KM, Knowledge Management)是干啥的? 这四个字说来话长,用我的土话说,要把信息沉淀下来并传递给更多的人用。一个人写的文档,团队其他的人要能看明白,要理解,要能拿着这文档做事情。

网站运维之道 之自动化管理
自动化管理是网站规模化之后必须要面对的问题。为什么要自动化?肯定不是为了炫技,针对一个发展中的网站来说,自动化的主要目的还是为了节省维护成本,提升运维成熟度能力。

投票调查

  • 你最想在怎样的公司做运维?
  • 大型网站(如网易、新浪)
  • 大型企业(如移动、联通)
  • 大型商务平台(如淘宝)
  • 大型游戏网站(如盛大)
  • IDC(到处都是)
  • 最好能在外企或出国
  • 无所谓

【大型网站运维之道 天道 人道 运维之道】相关推荐

  1. 大型网站运维工程师的职责和前景

    运维中关键技术点解剖: 1 大量高并发网站的设计方案 ; 2 高可靠.高可伸缩性网络架构设计; 3 网站安全问题,如何避免被黑? 4 南北互联问题,动态CDN解决方案; 5 海量数据存储架构 一.什么 ...

  2. 赠书 | 《大型网站运维:从系统管理到SRE》

    一年一度的双11活动已经成了一个全民狂欢的节日. 这一天,如何应对运营的各类指标压力,保障业务系统关键时候不挂,又成了研发和运维同学的梦魇. 临时抱佛脚肯定不行了,还是需要系统性的思考和组织相应的人力 ...

  3. 19道小米网运维工程师笔试真题

    <19道小米网运维工程师笔试真题,你能通关吗?> 题目转至:马哥Linux运维 第一部分:Linux基础 题目1: 有一百个图片文件,它们的地址都是 http://down.xiaomi. ...

  4. 读书笔记 之《软件架构设计: 大型网站技术架构与业务架构融合之道》

    大家好呀,我是小菜~ 帅哥美女,知道你们时间宝贵,那么就由小菜为你读好一本书,读一本好书,取其精华,与你共享~! 本文主要分享 <软件架构设计:大型网站技术架构与业务架构融合之道> 如有需 ...

  5. 软件架构设计 大型网站技术架构与业务架构融合之道

    前言 架构是一种综合能力,而不是某一方面的技能.也正因为如此,本书提供的是一个全面的解决方案.方法论.成体系的设计思维.因此,本书将从基础技术谈起,再到高层技术.再到业务.管理,提供一个架构能力的全局 ...

  6. 《大型网站技术架构》《K8S进阶实战》等书籍!送45本!读完工资多个0!

    学习如逆水行舟,不进则退.所以又来给各位读者送书了,这次送45本技术书,内容涉及深度学习.Python.Dubbo.Flutter等. 感谢本次活动的赞助商『电子工业出版社博文视点』 另外!急于购书的 ...

  7. 【面试精选】关于大型网站系统架构你不得不懂的10个问题

    该文已加入笔主的开源项目--JavaGuide(一份涵盖大部分Java程序员所需要掌握的核心知识的文档类项目),地址:github.com/Snailclimb/- .觉得不错的话,记得点个Star. ...

  8. 亿级流量网站架构核心技术_关于大型网站系统架构你不得不懂的10个问题

    来自:JavaGuide(微信号:JavaGuide) 下面这些问题都是一线大厂的真实面试问题,不论是对你面试还是说拓宽知识面应该都很有帮助.之前发过一篇8 张图读懂大型网站技术架构 可以作为不太了解 ...

  9. 大型网站技术架构:核心原理与案例分析pdf

    下载地址:网盘下载 编辑推荐 编辑 本书作者是阿里巴巴网站构建的亲历者,拥有核心技术部门的一线工作经验,直接体验了大型网站构建与发展过程中的种种生与死,蜕与变,见证了一个网站架构从幼稚走向成熟稳定的历 ...

最新文章

  1. 某程序员吐槽:回老家被乡镇公务员表哥怼,催他赶紧上岸!表哥月薪3800,而他年包90w!...
  2. Android与服务器端数据交互(转)
  3. PI实时数据库管理员须知-5
  4. c语言贪心算法合并箭,LeetCode刷题题库:贪心算法
  5. Linux培训教程 Git在linux下的使用
  6. java 403怎么抛出_django主动抛出403异常的方法详解
  7. comment desc显示表结构_MySQL 查看表结构简单命令
  8. ArrayList与String[]
  9. CCIE-LAB-第十六篇-NAT+OSPF下发默认路由+校验配置(模块一结束篇章)
  10. vue.js将本地文件上传到ftp服务器,vue项目使用FTP传输部署项目服务器,node命令编写...
  11. h5页面保存img_如何设计H5编辑器中的模版库并实现自动生成封面图
  12. H.264视频编码在VC .Net中的实现(H264全文)
  13. python 局域网服务器_Python一秒搭建ftp服务器,帮助你在局域网共享文件
  14. cocos2dx mysql_初次接触cocos2dx
  15. Android的ADT的安装
  16. C语言数据结构——用链表实现一个简单的电话号码簿
  17. java 读取字符串文件_Java读取文件为字符串
  18. Spring Cloud构建微服务架构(五)服务网关 原创 2016-07-12 翟永超 Spring Cloud 被围观 53984 次 通过之前几篇Spring Cloud中几个核心组件的介
  19. 科技的终极目标是什么
  20. 流媒体/流媒体文件格式详解

热门文章

  1. 更改oracle背景,Oracle 11gR2修改用户后导致系统HANG住
  2. 华为鸿蒙系统自动驾驶,华为高阶自动驾驶 + 华为鸿蒙 OS 车机系统体验
  3. Unexpected end of JSON input while parsing near '...kwrap:false,directo'
  4. 时间复杂度O(n^2)和O(nlog n)差距有多大?
  5. Flume+HBase+Kafka集成与开发
  6. HDU 5985 Lucky Coins 数学
  7. 内核终端判断,微信?QQ?ipad?IE?移动?Google?opera……
  8. 2016年 1月15号 cocoapods的导入
  9. SDN 前提知识:关于东西南北向接口
  10. jquery输入框按下回车提交表单