来源:https://zhuanlan.zhihu.com/p/100727539

1.1、Linux运维的主要工作内容

 1、什么是linux运维

  运维是指大型组织已经建立好的网络软硬件的维护,就是要保证业务的上线与运作的正常。

  在他运转的过程中,对他进行维护,他集合了网络、系统、数据库、开发、安全、监控于一身的技术。

  运维又包括很多种,有DBA运维、网站运维、虚拟化运维、监控运维、游戏运维等等。

  运维分类:

  1)开发运维:是给应用运维开发运维工具和运维平台的

  2)应用运维:是给业务上线、维护和做故障排除的,用开发运维开发出来的工具给业务上线、维护、做故障排查

  3)系统运维:是给应用运维提供业务上的基础设施,比如:系统、网络、监控、硬件等等

  2、基础运维常见工作内容

  服务监控技术:包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障

  服务故障管理:包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性

  服务容量管理:测量服务的容量,规划服务的机房建设,扩容、迁移等工作

  服务性能优化:从各个方向,包括网络优化、操作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验

  服务全局流量调度:接入服务的流量,根据容量和服务状态在各个机房间分配流量

  服务安全保障:包括服务的访问安全、防攻击、权限控制等

  服务自动发布部署:部署平台/工具的研发,及平台/工具的使用,做到安全、高效的发布服务

  服务集群管理:包括服务的服务器管理、大规模集群管理等

  服务成本优化:尽可能降低服务运行使用的资源,降低服务运行成本

  数据库管理(DBA):通过设计、开发和管理高性能数据库集群,使数据库服务更稳定、更高效、更易于管理。

  平台化的开发:类docker等平台的开发管理,及服务接入技术

1.2、Linux运维工作发展过程

  1、手工管理阶段

  1)业务规模

  业务流量不大,服务器数量相对较少,系统复杂度不高。

  对于日常的业务管理操作,大家更多的是逐台登录服务器进行手工操作,属于各自为战。

  每个人都有自己的操作方式,缺少必要的操作标准、流程机制,比如业务目录环境都是各式各样的。

  2)工作职责

  早期的运维团队在人员较少的情况下,主要是进行数据中心建设、基础网络建设、服务器采购和服务器安装交付工作。

  几乎很少涉及线上服务的变更、监控、管理等工作。

  这个时候的运维团队更多的属于基础建设的角色,提供一个简单、可用的网络环境和系统环境即可。

  2、工具批量操作阶段

  1)业务规模

  随着服务器规模、系统复杂度的增加,全人工的操作方式已经不能满足业务的快速发展需要。

  因此,运维人员逐渐开始使用批量化的操作工具,针对不同操作类型出现了不同的脚本程序。

  此时,虽然效率提升了一部分,但很快又遇到了瓶颈,操作的质量并没有太多的提升。

  我们开始建立大量的流程规范,比如复查机制,先上线一台服务器观察10分钟后再继续后面的操作,一次升级完成后至少要观察20分钟等。

  这些主要还是靠人来监督和执行,但在实际过程中执行往往不到位,反而降低了工作效率。

  2)工作职责

  这个时候的运维团队还会承担一些服务器监控的工作,同时会负责LVS、Nginx等与业务逻辑无关的4/7层运维工作。

  这个时候服务变更更多的是逐台的手工操作,或者有一些简单批量脚本的出现。

  监控的焦点更多的在服务器状态和资源使用情况上,对服务应用状态的监控几乎很少,监控更多的使用各种开源系统如Nagios、Cacti等。

  3、平台管理阶段

  1)业务规模

  在这个阶段,我们决定开始建设运维平台,通过平台承载标准、流程,进而解放人力和提高质量。

  这个时候对服务的变更动作进行了抽象,形成了操作方法、服务目录环境、服务运行方式等统一的标准。

  通过平台来约束操作流程,如上面提到的上线一台服务器观察10分钟,程序的启停接口必须包括启动、停止、重载等。

  在平台中强制设定暂停检查点,在第一台服务器操作完成后,需要运维人员填写相应的检查项,然后才可以继续执行后续的部署动作。

  2)工作职责

  由于业务规模和复杂度的持续增加,运维团队会逐渐划分为应用运维和系统运维两大块。

  应用运维开始接手线上业务,逐步开展服务监控梳理、数据备份以及服务变更的工作。

  随着对服务的深入,应用运维工程师有能力开始对服务进行一些简单的优化。

  同时,为了应对每天大量的服务变更,我们也开始编写各类运维工具,针对某些特定的服务能够很方便的批量变更。

  随着业务规模的增大,基础设施由于容量规划不足或抵御风险能力较弱导致的故障也越来越多,迫使运维人员开始将更多的精力投入到多数据中心容灾、预案管理的方向上。

 4、系统自调度阶段

  1)工作环境

  更大规模的服务数量、更复杂的服务关联关系、各个运维平台的林立,原有的将批量操作转化成平台操作的方式已经不再适合。

  需要对服务变更进行更高一层的抽象,将每一台服务器抽象成一个容器,由调度系统根据资源使用情况,将服务调度、部署到合适的服务器上。

  自动化完成与周边各个运维系统的联动,比如监控系统、日志系统、备份系统等。

  通过自调度系统,根据服务运行情况动态伸缩容量,能够自动化处理常见的服务故障。

  运维人员的工作也会前置到产品设计阶段,协助研发人员改造服务使其可以接入到自调度系统中。

  2)工作职责

  业务规模达到一定程度后,开源的监控系统在性能和功能方面,已经无法满足业务需求;

  大量的服务变更、复杂的服务关系,以前靠人工记录、工具变更的方式不管在效率还是准确性方面也都无法满足业务需求;

  在安全方面也出现了各种大大小小的事件,迫使我们投入更多的精力在安全防御上。

  逐渐的,运维团队形成之前提到的5个大的工作分类,每个分类都需要有专精的人才。

  这个时候系统运维更专注于基础设施的建设和运维,提供稳定、高效的网络环境,交付服务器等资源给应用运维工程师。

  应用运维更专注于服务运行状态和效率,数据库运维属于应用运维工作的细化,更专注于数据库领域的自动化、性能优化和安全防御。

  运维研发和运维安全提供各类平台、工具,MT5使用教程http://www.gendan5.com/mt5.html进一步提升运维工程师的工作效率,使业务服务运行得更加稳定、高效和安全。

1.3、Linux运维工作分类

 1、应用运维(SRE):

  应用运维负责线上服务的变更、服务状态监控、服务容灾和数据备份等工作,对服务进行例行排查、故障应急处理等工作

  工作职责如下:设计评审、服务管理、资源管理、例行检查、预案管理、数据备份。

 2、系统运维(SYS):

  负责IDC、网络、CDN和基础服务的建设(LVS、NTP、DNS);

  负责资产管理,服务器选型、交付和维修,网络建设、LVS负载均衡和SNAT建设

 3、运维开发

  是给应用运维开发运维工具和运维平台的

  主要包含的平台:工单系统、CMDB、监控系统、ELK日志系统、CI/CD、LDAP、FAQ、培训系统、OpenStack平台

 4、数据库运维(DBA):

  数据库运维负责数据存储方案设计、数据库表设计、索引设计和SQL优化,

  对数据库进行变更、监控、备份、高可用设计等工作,详细的工作内容如下

  设计评审、容量规划、数据备份与灾备、数据库监控、数据库安全、数据库高可用和性能优化

  自动化系统建设、运维研发、运维平台、监控系统、自动化部署系统

 5、运维安全(SEC):

  运维安全负责网络、系统和业务等方面的安全加固工作

  进行常规的安全扫描、渗透测试,进行安全工具和系统研发以及安全事件应急处理

  工作内容如下:安全制度建立、安全培训、风险评估、安全建设、安全合规、应急响应。

Linux运维工程师工作内容总结相关推荐

  1. linux运维工程师工作职责

    linux运维工程师工作职责 岗位职责 运维部门经理 职位描述: 1.负责部门规划和管理,包括完善内部运维团队,技术规划,团队建设等; 2.负责运维制度的制定,包括运维制度的细化和监督执行; 3.根据 ...

  2. 运维工程师工作内容整理

    运维工程师工作内容整理 稳定 安全 大性能 自动化 素养 团队沟通 其他 总结两句话: 1.保障业务长期稳定运行(如网站服务器.游戏服务器等). 2.保障数据安全可靠(如用户名密码.游戏数据.博客文章 ...

  3. linux运维工程师培训课程_Linux运维工程师工作内容总结!

    1.1 Linux运维的主要工作内容 1.什么是linux运维 运维是指大型组织已经建立好的网络软硬件的维护,就是要保证业务的上线与运作的正常. 在他运转的过程中,对他进行维护,他集合了网络.系统.数 ...

  4. linux运维每天工作内容,Linux运维工作清闲吗?每天需要干什么?

    运维工作清闲吗?每天都需要做什么?其实很多人都会关注这样的问题,小编为大家详细的介绍一下吧. 其实没有任何一份的工作是非常清闲的,想要在行业内拥有更好的发展,都需要不断地进步,真正清闲的工作是不挣钱的 ...

  5. idc服务器维护岗位,IDC运维工程师工作内容

    角色职责: 1) 为客户提供机房的7*24现场技术支持. 2) 用英语与客户进行沟通. 3) 在故障发生时对事故进行响应并与服务团队进行沟通解决. 4) 负责处理分配到团队内的工单,并更新工单系统及其 ...

  6. 2022年 linux运维日常工作内容

    群每日分享干货:经验和思想 技术的提升

  7. Linux运维工程师招人要求,从业Linux运维工程师岗位有哪些要求?负责哪些工作?

    随着社会的进步互联网的发展,Linux运维工程师变得越来越受欢迎了,其岗位也在企业中受到了足够的重视,薪资待遇也在不断的提升中,正因为这样越来越多的人想要加入Linux行列中,那么Linux运维工程师 ...

  8. Linux运维工程师主要做什么工作?

    Linux在现在社会发展是非常受欢迎的一个行业,对于从事Linux方面工作的人来说,属于互联网背后的英雄,没有他们的付出,就没有如今的互联网时代.而在Linux从事岗位之中,Linux运维工程师这样一 ...

  9. linux运维监控内容,Linux运维工程师要掌握的常用监控指标总结

    今天小编要跟大家分享的文章是关于Linux运维工程师要掌握的常用监控指标总结,正在从事Linux运维相关工作的小伙伴们来和小编一起看一看吧,希望本篇文章能够对大家有所帮助. 1. Linux运维基础采 ...

  10. linux运维工程师日常工作事务

    linux运维工程师日常都是什么工作? 1.操作系统状态监控 每天登陆系统查看系统运行的负荷如何,有无报错日志或报警日志. 2.操作系统故障排除 依据操作系统故障日志分析出现该报警或报错的原因,从而解 ...

最新文章

  1. 基于架构的上网行为管理产品界面对比
  2. ntrip获取源列表_Ntrip通讯协议怎么样?
  3. 智能实验室-杀马(Defendio) 4.16.0.840
  4. 5种ASP.NET页面间传递参数实例代码
  5. Rsync 同步搭建
  6. 怎么切麻花槽_水电怎么安装?这几点需牢记!
  7. ddm模型公式_两阶段增长模型
  8. 11、生成带参数二维码应用场景
  9. 惠普计算机进入安全模式,Windows10系统惠普电脑快速进入安全模式的方法
  10. SQL Server选择题40个
  11. APP设计:(一)app界面常用设计规范
  12. 『Citric』天空中的繁星 · DP
  13. 阿里巴巴:今年营收 5000 亿,明年GMV要再增一万亿
  14. Android 解析新浪RSS新闻源 问题汇总和解决
  15. 端口汇聚和端口聚合的区别
  16. C语言经典算法100例-结束语
  17. 【人工智能】AI究竟能为你的生意做什么(以及不能做什么)
  18. ViewPager2和Fragment的组合使用
  19. Hadoop权威指南——关于Sqoop
  20. java 记牌_java的Collection工具类编写简单的扑克牌比大小

热门文章

  1. 历年计算机二级Java考试试题及答案(完整版)
  2. sqlloader 导入数据
  3. hadoop开发步骤
  4. matlab 画的点连成线,matlab怎么把点连成线
  5. matlab怎么画矩形世界地图,matlab绘制世界地图
  6. Qi v1.2.4 -- WPC官方文档资源下载
  7. c语言迷你计算器程序,C语言版 模拟计算器的程序
  8. Myeclipse10安装反编译软件笔记
  9. c51语言跑马灯键盘程序,单片机按键控制跑马灯程序
  10. 1.封包(二)(雷电模拟器+ProxyDroid+CCProxy+WPE) 的使用