众所周知,开发和 IT 运营之间因为屁股决定脑袋,存在巨大的鸿沟,而网站可靠性工程师(SRE)在开发和 IT 运营之间建立了一座桥梁,SRE 会承担原本属于 IT 运营的一部分工作,不过 SRE 的工作方式和传统的 IT 运营很不相同,SRE 有很强的研发能力,他们通过创建可扩展和可靠的软件系统来解决问题。

        标准化和自动化是 SRE 工作的核心,特别是当系统迁移到云端时。因此,他们通常有软件或系统工程或系统管理的背景,有 IT 运营经验。

一、什么是网站可靠性工程?

在探讨网站可靠性工程师的角色和职责之前,我们先来定义一下什么叫网站可靠性工程。网站可靠性工程是一个由谷歌首次提出的术语,核心是 “把 IT 运营当作一个软件问题来对待”。

SRE 主要是为 IT 运营开发软件系统和自动化解决方案。SRE 做的是传统上由 IT 运营完成的工作,所不同的是,SRE 有软件专业知识,他们会利用这些知识来解决复杂的 IT 运营问题。

因此,网站可靠性工程可以被认为是一套实践,将软件工程的各个方面纳入 IT 运营,从而提高软件系统(IT 运营的运营对象)的效率和可靠性,改善工作流程。

二、SRE 与 DevOps

网站可靠性工程与 DevOps 密切相关,DevOps 是另一个将软件开发和运营联系起来的概念,可以被看作是 SRE 核心原则的概括。因此,SRE 在成功实施 DevOps 实践中发挥了很大作用。

此外,DevOps 和 SRE 都试图在运营和开发团队之间架起桥梁,以便更快地交付软件。

然而,谷歌的一篇文章对这两个术语进行了区分,指出 SRE “恰好体现了 DevOps 的理念,但对可靠性的度量和实现有更多的规范性,这些规范要在软件工程和 IT 运营工作中落地。换句话说,SRE 规定了如何在各种 DevOps 领域取得成功,尤其是在可靠性方面”。

三、网站可靠性工程师是做什么的?

网站可靠性工程师(SRE)在开发和运营之间工作。SRE 是一个具有 IT 运营经验和知识的软件开发人员。

这个角色的很多工作内容都是通过写代码来完成的,比如分析日志、测试生产环境,以及应对其他任何问题,所以 SRE 工程师将是一个编写代码的专家。

自动化做好了,业务研发人员就可以更专注在功能开发,就可以更快的把一些新的产品特性带入生产,让终端用户受益。

运营团队则会发现他们的工作量在减少,因为 SRE 会对任何反复出现的问题进行自动化解决。

SRE 工程师将在开发和 IT 运营工作之间进行转换,并保持两者之间的平衡。因为 SRE 工程师的主要工作是自动化,这意味着此类工程师会增强软件开发过程的性能、效率和监控。

四、所需的技能组合

SRE 致力于创建软件,以提高业务系统的可靠性,修复问题,并对事件和问题作出回应。因此,他们将需要各种技术技能。

他们将需要拥有各种自动化工具的知识,因为他们通常负责建立和整合软件工具,以提高组织系统的可靠性和可扩展性。

如上所述,SRE 将需要编码知识和大多数常见的编程语言,比如 Ruby, Javascript 和 PHP。

另外 SRE 还需要具备主要云供应商的专业知识,如 AWS 和谷歌云。

五、SRE 的日常角色和职责

1、自动化

如前所述,SRE 工程师建立自动化的工具来管理 IT 运营。因此,他们的目的不是手动执行这些功能,而是将它们自动化。这些功能包括

  • 持续集成和持续交付

  • 监测

  • 事件响应

  • 警报

2、监控

SRE 工程师负责确保底层基础设施的顺利运行,确保系统和工具按预期工作。他们还监测关键的应用程序和服务,以尽量减少停机时间并确保其可用性。

3、问题解决

这些工程师与开发人员紧密合作,特别是当问题出现时,他们将与开发人员合作,帮助排除故障,并在发出警报时提供咨询。

在开发人员遇到问题时,SRE 将进行调查,然后解决该问题。在事件解决后,SRE 将重新审视该问题并确定原因,以确保它不会再次发生。

4、跨团队协作

如上,SRE 需要跨团队协同,主要是 IT 运营人员和开发人员。通过建立可靠的系统为这些团队提供支持,这将使这些团队有更多的时间将注意力转移到建立新的功能上,从而更快地将这些功能推出给客户。

六、SRE 使用的常见工具

  • 监控:此类工具包括 AWS CloudWatch 和 NewRelic

  • 事件管理/待命:如 PagerDuty 和 VictorOps

  • 项目管理和问题跟踪:如 Jira 和 Trello

  • 基础设施协调:包括 Terraform 和 SaltStack

七、SRE 的收入是多少?

根据 payscale,这种类型的工程师在美国的年薪在 76,000 美元到 158,000 美元之间,平均年薪为 117,768 美元。

小结

SRE 工程师正在成为组织内一个越来越重要的角色。这是一个具有挑战性的角色,需要对编码和自动化有很高的热情。

在你的组织中拥有这样的工程师将有助于降低你的运营成本,同时提高系统的可靠性。

文章出处:https://www.cnblogs.com/ulricqin/p/17159620.html

IT行业新秀SRE都是做什么的相关推荐

  1. SEO(搜索引擎优化)是不是任何行业、产品都适合做SEO?

    总是会有人问我这么一个疑问:"我是做XX行业(XX商品)的,这合适做SEO吗?"其实任何行业.产品都适合做SEO. 理由很简单:任何行业.任何商品,都有人在搜索引擎上进行搜索查询. ...

  2. 我用爬虫爬取了腾讯招聘,康康他们每天都在做什么?

    需求分析 想知道在腾讯上班都要做什么工作,今天就来分析一下腾讯python招聘的岗位信息. 我们要获取的信息如下: 职位名称. 国家. 城市. 职位分类. 职位更新时间. 职位要求. 首先我们打开腾讯 ...

  3. 大厂架构都开始做机房多活了

    写在前面 B站挂了的那天,就想写写机房多活的文章,但考虑到这方面的技术面涉及比较广,一时无从下手就拖到了现在,未来会陆续基于"多活"这个话题聊一聊我的经验. 在互联网行业,一定规模 ...

  4. 无人车巨头每天都在做相同的事情:不惜血本做高精地图是为何?

    来源:腾讯科技 摘要:很多人都关注无人车的发展,殊不知无人车技术中,有十分重要的一环,是无人车的高精地图. 高精地图成为无人车竞赛中的关键一环 目前,很多家无人驾驶公司都在做着同样的事情:绘制同一个路 ...

  5. 都说做ToB商业模式,VR AR博物馆内容的矿或许可以挖下

    技术和人文的结合,或许是一个可以挖掘的商业发展模式. [编者按]作者: 李亚倢 有一种习惯在国内可能不明显,如果去国外旅游,博物馆和标志性景观建筑总是要去一下的.因为在这些地方汇聚着整个城市的文化积淀 ...

  6. 被5月GitHub Top20榜单惊呆了 原来区块链大佬都在做这个

    被5月GitHub Top20榜单惊呆了 原来区块链大佬都在做这个 GitHub 上项目的活跃指数,在一定程度上代表了这个项目的开发状态. 频繁更新代码的项目有可能正处于构建和完善中,而停止更新代码的 ...

  7. PMCAFF 微课堂 | 赶集、暴风影音这些优质App为什么都在做积分商城?

    报名方式 回复"报名"至PMCAFF公共账号,即可进入报名环节 时间:9月29日 20:00pm (周二) 地点:PMCAFF微信群 在竞争日益激烈的移动互联网领域,借助积分商城的 ...

  8. 阿里技术大神:你没做错啥,你错在啥都没做

    难受,那是因为你正在爬坡,正在成长 你有没有想过,如果你现在做的工作,能看到你10年后的样子,你愿意吗? 领着固定薪水,做着熟练到形成肌肉记忆的事情. 有一天,在舒适区里呆得太久,想跳出来,发现已经没 ...

  9. 美国教授北大演讲:并不是每个人都适合做学术

    学术是一个生活之道,学术生涯不是一个早九晚五的工作,而是一种让你持续思考的工作和生活.要不要选择学术,要看你是不是从这种学术工作里得到快乐,是不是愿意做这件事情.有一个说法,学术有三个功能:追求真理, ...

最新文章

  1. mysql常见关键字
  2. blog推荐 - 软件产品管理之Tyner Blain
  3. keras冻结_[开发技巧]·keras如何冻结网络层
  4. 深入浅出面向对象分析与设计
  5. 周末想找个地方敲代码_观看我们的代码游戏,全周末直播
  6. mysql分组查询统计求和
  7. 【实战Java高并发程序设计6】挑战无锁算法
  8. 优化配置ISA2006淹没缓解
  9. 论现场跟客户演示软件产品
  10. 乒乓球十一分制比赛规则_乒乓球11分制竞赛规则简单讲解
  11. 笔记本合上盖子怎么不休眠了?
  12. 一种将海康大华宇视等安防摄像机发布到H5网页微信进行直播的全终端无插件播放技术方案
  13. MNIST手写数字识别之MLP实现
  14. Python爬虫-安某某客新房和二手房
  15. mysql week函数参数_MySQL week()函数详解
  16. android培训学习班,常州android培训学习班
  17. 【零样本学习】Feature Generating Networks for Zero-Shot Learning
  18. Linux VIM常用命令总结
  19. 二年级上册计算题_2015年二年级上册数学期末考试卷
  20. day02-JavaScript-Vue

热门文章

  1. ofbiz与mysql_ofbiz 安装以及使用mysql数据库
  2. 【OpenGL ES】片段操作
  3. 监控oracle 数据更新,oracle 怎么 监控数据变化
  4. 100+队伍逐鹿大奖,创新编程挑战赛秋季赛圆满落幕
  5. HDMI、DVI和VGA之间的区别
  6. 重装系统操作步骤、批处理及注意事项
  7. K8S集群rook部署ceph集群
  8. 连接器信号完整性仿真教程 一
  9. 详细讲解架设FTP服务器的两种方法
  10. 使用selenium等待网页加载完成,lxml解析网页,利用urllib爬取图片