目录:

  • 什么是Linux运维
  • 运维的分类
  • 基础运维的常见工作
  • Linux运维工作发展过程
  • Linux运维日常使用软件和技能
  • 运维工程师要掌握的技能

什么是Linux运维

  • 运维是指大型组织已经建立好的网络软硬件的维护,就是要保证业务上的上线与运作的正常
  • 在运转的过程中,对他进行维护,集合了网络、系统、数据库、开发、安全、监控于一身的技术
  • 运维又包括DBA运维,网站运维,虚拟化运维,监控运维,游戏运维等等

运维的分类


系统运维(SYS):

1. 负责IDC、网络、CDN和基础服务的建设(LVS、NTP、DNS);

2. 负责资产管理,服务器选型、交付和维修,网络建设、LVS负载均衡和SNAT建设

系统运维的工作职责

'''1.IDC数据中心建设'''
# 收集业务需求,预估未来数据中心的发展规模
# 骨干网的分布,数据中心建筑,以及Internet接入
# 网络攻击防御能力、扩容能力、空间预留、外接专线能力、现场服务支撑能力等方面评估选型数据中心'''2.网络建设 '''
# 设计及规划生产网络架构
# 包括:数据中心网络架构、传输网架构、CDN网络架构等,以及网络调优等日常运维工作。'''3.LVS 负载均衡 '''
# LVS 是整个站点架构中的流量入口,根据网络规模和业务需求,构建负载均衡集群。
# 完成网络与业务服务器的衔接,提供高性能、高可用的负载调度能力,以及统一的网络层防攻击能力。'''4.CDN 规划和建设 '''
# CDN 工作划分为第三方和自建两部分
# 根据业务发展趋势,规划CDN新节点建设布局
# 完善CDN业务及监控,保障CDN 系统稳定、高效运行
# 分析业务加速频道的文件特性和数量,制定最优的加速策略和资源匹配
# 负责用户劫持等CDN日常故障排查工作'''5.服务器选型、交付和维护 '''
# 负责服务器的测试选型,包含服务器整机、部件的基础性测试和业务测试,降低整机功率,提升机架部署密度等'''6.OS、内核选型和 OS 相关维护工作 '''
# 负责整体平台的 OS 选型、定制和内核优化,以及 Patch 的更新和内部版本发布
# 建立基础的YUM包管理和分发中心,提供常用包版本库
# 跟进日常各类 OS 相关故障
# 针对不同的业务类型,提供定向的优化支持'''7.资产管理 CMDB '''
# 记录和管理运维相关的基础物理信息,包括: 数据中心、网络、机柜、服务器、ACL、IP等各种资源信息
# 制定有效的流程,确保信息的准确性;
# 开放API接口,为自动化运维提供数据支持'''8.基础服务建设 '''
# 业务对 DNS、NTP、SYSLOG 等基础服务的依赖非常高,需要设计高可用架构避免单点,提供稳定的基础服务

应用运维(SRE):

  1. 应用运维负责线上服务的变更、服务状态监控、服务容灾和数据备份等工作,对服务进行例行排查、故障应急处理等工作

  2. 工作职责如下:设计评审、服务管理、资源管理、例行检查、预案管理、数据备份。

  3. 业务运维工作细则
    1)监控线上的服务质量
    2)响应异常/处理突发故障
    3)在线发布/升级产品
    4)和相应产品线的研发和测试协调处理产品问题

应用运维的工作职责

'''1.设计评审 '''
# 在产品研发阶段,参与产品设计评审,从运维的角度提出评审意见,使服务满足运维准入的高可用要求。'''2.服务管理 '''
# 负责制定线上业务升级变更及回滚方案,并进行变更实施
# 能够发现服务上的缺陷,及时通报并推进解决
# 完善监控内容,提高报警准确度
# 在线上服务出现故障时,第一时间响应'''3.资源管理 '''
# 对各服务的服务器资产进行管理,梳理服务器资源状况、数据中心分布情况、网络专线及带宽情况
# 能够合理使用服务器资源,根据不同服务的需求,分配不同配置的服务器,确保服务器资源的充分利用'''4.例行检查 '''
# 根据制定的服务排查点,对服务进行定期检查
# 对排查过程中发现的问题,及时进行追查,排除可能存在的隐患'''5.预案管理 '''
确定服务所需的各项监控、系统指标的阈值或临界点,以及出现该情况后的处理预案。
建立和更新服务预案文档,并根据日常故障情况不断补充完善,提高预案完备性。'''6.数据备份 '''
# 制定数据备份策略,按规范进行数据备份工作。
# 保证数据备份的可用性和完整性,定期开展数据恢复性测试。

运维开发

1. 是给应用运维开发运维工具和运维平台的

2. 主要包含的平台:工单系统、CMDB、监控系统、ELK日志系统、CI/CD、LDAP、FAQ、培训系统、OpenStack平台

数据库运维(DBA):

1. 数据库运维负责数据存储方案设计、数据库表设计、索引设计和SQL优化,

2. 对数据库进行变更、监控、备份、高可用设计等工作,详细的工作内容如下

3. 设计评审、容量规划、数据备份与灾备、数据库监控、数据库安全、数据库高可用和性能优化

4. 自动化系统建设、运维研发、运维平台、监控系统、自动化部署系统

运维安全(SEC):

1. 运维安全负责网络、系统和业务等方面的安全加固工作

2. 进行常规的安全扫描、渗透测试,进行安全工具和系统研发以及安全事件应急处理

3. 工作内容如下:安全制度建立、安全培训、风险评估、安全建设、安全合规、应急响应。

基础运维的常见工作

  1. 服务监控技术:
    包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障

  2. 服务故障管理:
    包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性

  3. 服务容量管理:
    测量服务的容量,规划服务的机房建设,扩容、迁移等工作

  4. 服务性能优化:
    从各个方向,包括网络优化、操作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验

  5. 服务全局流量调度:
    接入服务的流量,根据容量和服务状态在各个机房间分配流量

  6. 服务安全保障:
    包括服务的访问安全、防攻击、权限控制等

  7. 服务自动发布部署:
    部署平台/工具的研发,及平台/工具的使用,做到安全、高效的发布服务

  8. 服务集群管理:
    包括服务的服务器管理、大规模集群管理等

  9. 服务成本优化:
    尽可能降低服务运行使用的资源,降低服务运行成本

  10. 数据库管理(DBA):
    通过设计、开发和管理高性能数据库集群,使数据库服务更稳定、更高效、更易于管理。

  11. 平台化的开发:
    类docker等平台的开发管理,及服务接入技术

Linux运维工作发展过程

运维的发展

  1. 手工管理阶段
  2. 工具批量操作阶段
  3. 平台管理阶段
  4. 系统自调度阶段

Linux运维日常使用软件和技能

运维工程师使用的运维平台和工具

  • Web服务器:apache、tomcat、nginx
  • 监控:prometheus、zabbix、openfalcon、nagios、cacti
  • 自动部署:ansible、saltstack、puttet
  • 负载均衡:keepalive、lvs、haproxy、nginx
  • 备份工具:rsync、wget
  • 问题追查:netstat、top、tcpdump、last
  • 容器:docker、k8s、docker-compose、swarm
  • 安全:kerberos、selinux、acl、iptables
  • 虚拟化:openstack、xen、kvm

运维工程师要掌握的技能

  1. 扎实的计算机基础知识,包括计算机系统架构,操作系统,网络技术等;
  2. 通用应用方面需要了解操作系统、网络、安全,存储,CDN,DB等,知道其相关原理;
  3. 编程能力,小到运维工具的开发大到大型运维系统/平台的开发都需要有良好的编程能力;
  4. 数据分析能力:能够整理、分析系统运行的各项数据,从中发现问题及找到解决方向;
  5. 丰富的系统知识,包括系统工具、典型系统架构、常见的平台选型等;

运维的基本知识点及分类工作相关推荐

  1. Linux运维工程师面试知识点汇总(一)

    Linux运维工程师面试知识点汇总(一) 一.Linux命令知识点 1.查看/var/log/下的文件数 2.shell下随机密码生成(32位) 3.随机生成8位密码(大小写和数字混合) 4.随机生成 ...

  2. 服务器运维是什么意思?日常工作包含哪些?

    [导读]越来越多的人开始从事服务器运维工作了,但很多人不清楚服务器运维到底是什么意思?日常工作包含哪些?服务器运维用什么软件好?因此我们小编针对着三家问题进行了详细解答,希望可以帮到大家. 服务器运维 ...

  3. 腾讯游戏运营总监酒后吹批:运维工程师这些知识点都不会?赶紧找个地埋了吧!

    前言: 运维是从 IT 诞生之初就一直存在的重要角色,在 IT 类企业中,尤其是互联网企业,运维.开发和测试被称为是驱动技术进步的三驾马车. 但最近几年,随着云计算的到来,以及DevOps理念的普及, ...

  4. 运维,数据库 知识点文章集锦

    一些课程 http://edu.51cto.com/center/course/lesson/index?id=347617 [Oracle数据库启动过程及状态详解(nomount.mount和ope ...

  5. 云服务器运维兼职,云服务器的维护工作主要有哪些?

    云服务器因为响应速度更快.更方便使用.升级更方便.具有较高的性价比等优势是很多用户建站的首选方案.我们在购买云服务器后,要想保证长期稳定的使用,除了依靠云服务商的技术支持,自身必要的安全维护手段也是不 ...

  6. Python运维常用的脚本,提高工作效率就靠它了

    前言 用Python做运维的小伙伴肯定会进行重复的工作,这个时候脚本的重要性就体现出来了 一个好的脚本工具可以帮你省去很多重复的工作,创造更大的价值 下面小编就带你们看看Python运维最常用的脚本吧 ...

  7. MySQL数据库性能优化及自动化运维实践教程!DBA日常工作

    MySQL数据库性能优化及自动化运维实践教程!本文作者将站在更加全面的角度分享他在这一年多 DBA 工作中的经验,希望可以给大家带来启发和帮助. DBA 的日常工作 我觉得 DBA 真的很忙,我们来看 ...

  8. 系统运维的一些知识点

    系统运维是类似于电子聚焦更注重于保护系统和执行,操作和维护,系统维护,操作和维护,操作和维护具有两个含义.在系统的情况下,有时会犯错误,我们无法预测,更复杂的系统,保持降低,以避免对我们的各种可能的紧 ...

  9. 证券运维外包第3个月工作总结

    1.用python实现了令牌桶算法,用于微信机器人发送每分钟次数限制场景 2.学习了下react的基本知识,没学完,被需求打断了,年后继续,学这个东西一个是明年要维护的项目用到,其次是vue实在封装不 ...

最新文章

  1. SQL Server 一些重要视图3
  2. luogu P1199 【三国游戏】
  3. 「2019冬令营提高组」全连
  4. (2)FPGA面试题竞争与冒险
  5. 百度春晚红包分享链接遭微信屏蔽 已有超700人集齐好运卡
  6. Java3种错误_3种常见的Class级别的错误
  7. jQuery读取和设定KindEditor值的方法
  8. php for循环建数据
  9. vue中的@click.native.prevent,点击事件加上native.prevent究竟有什么用呢?
  10. 【Python程序设计】实验4:字符串与正则表达式
  11. LINUX安装KDC服务
  12. 用PYTHON做一个动态钟表
  13. BilSTM 实体识别_肿瘤新抗原(neoantigen)专题八:新抗原识别策略使难治性实体瘤的个体化免疫治疗成为可能...
  14. C++如何获取虚函数表(vtbl)的内容及虚成员函数指针存放原理
  15. Python 输入一个整数,将他转换为数字金字塔和 * 金字塔
  16. 做好企业站优化需从5个方面共同考虑
  17. Java枚举类与注解
  18. vulnhub靶场——Hacker-Kid-v1-0-1
  19. 一行代码教你撩妹手到擒来html+css+js烟花告白3D相册(含音乐+可自定义文字)520表白/七夕情人节/求婚...
  20. 大数据Spark电影评分数据分析

热门文章

  1. 叶明哲 | 数据中心空调那点事
  2. python 升级setuptools_linux 安装/升级 python3+setuptools+pip
  3. DL中版本配置问题:TensorFlow、Keras、Python版本完美搭配推荐
  4. 成功解决AttributeError: Unknown property axisbg
  5. 成功解决attrs = config.__dict__['__flags'] KeyError: '__flags
  6. TF之CNN:Tensorflow构建卷积神经网络CNN的简介、使用方法、应用之详细攻略
  7. MAT之GA:GA优化BP神经网络的初始权值、阈值,从而增强BP神经网络的鲁棒性
  8. TF之LSTM:利用基于顺序的LSTM回归算法对DIY数据集sin曲线(蓝虚)预测cos(红实)(TensorBoard可视化)
  9. 三个数从小到大排序—南阳acm
  10. HDU Senior's Gun (水题)