需求

运维是事件驱动,还是自驱动可能是我们在运维工作中不太关注的问题。事件驱动让运维止步于故障,而自驱动让运维不止于建设。持续性的运维建设就需要一套自动化的运维体系,那么我们应该从何入手?

其实前期《运维思考》一系列文章已经给我们答案了,就是从运维框架入手分层建设、打好基础,记住“万丈高楼平地起,勿在浮沙筑高台”。

运维框架

通常讲到运维建设,我们脑海中首先浮现的是“一团麻”,因为这不是一个人、一个岗位的工作,而是一整个团队的工作;所以我们将“这团麻”进行由底层向上可划分为:

  • IT基础设施层

    IT基础设施层,主要由基础运维团队负责,主要包括存储、网络、服务器、安全设备等硬件设施;

  • 数据层

    数据层,主要由DBA团队、大数据团队负责,主要包括数据库、缓存、数仓等;

  • 应用层

    应用层,主要由应用运维团队负责,主要包括基础服务、业务应用、中间件等;

  • 管理层

    管理层,主要由配置管理团队、安全团队、应用运维团队负责,主要包括各种自动化操作、安全管理、监控管理等;

  • 展示层

    展示层,主要由各团队综合管理,主要包括各种管理工具、监控工具等;

通过对运维框架的分解,对各种资源的逻辑隔离,让各个团队明确当前运维建设中的现状与不足。 如果我们能做到对运维框架的持续性关注,通过图片就可以明晰的知道哪个团队的不足,以及日后各团队的重点发力方向。

运维依据

如果你觉得运维框架还不够细致,那么针对框架中各个层次的工作拆解就来了,我们在此将其称之为运维依据

针对这些个运维依据,我们可以展开一些列的针对性措施,如制定规范、自动化流程,如此就能够不断丰富各个团队的制度、规范、流程,何乐而不为?

1.基础设施层

在基础的硬件设施管理之上,比较重点的工作是

  • 网络分区与隔离

    网络分区应考虑互联网接入区、普通生产区、数据区、外联区等各个区域,保证各区域的合理接入。

    网络隔离对测试、准生产、生产环境各环境进行隔离,避免访问权限混乱。

  • CMDB资产纳管

    CMDB用于管理基础设施层的各项资产,为上层应用提供数据支撑。使用CMDB一定要和业务应用紧密结合,一旦脱离于业务使用,那么CMDB将成为花瓶。

    相关场景可参考《运维思索:接地气的运维自动化建设》。

  • 内部dns

    通过内部dns可以将应用与IP解耦,一旦ip变更则不需要变更代码,生产环境应该尽量少做此种类型变更操作。

  • 服务器快速上架

    为满足业务日益增长的需求,应该具备服务器快速上架、资产实时记录至CMDB等一系列自动化流程。

  • 网络权限变更

    根据应用需求,快速登记并开通网络权限。

等等。

2.数据库

数据库除了特有的集群外,可以考虑数据库工单、sql审核优化等流程。

3.系统应用

  • 容量规划

容量规划是指根据业务用户流量增长、现有容量等一定的基础数据之上进行周期性的评估,如果有条件的话可结合压测实际情况,这样数据会更准确。通过容量规划可有效控制服务器规范,避免资源溢出。

  • 环境维护与部署

为避免因环境差异导致的问题,各环境应用部署需要遵循统一的目录规范,统一的自动化部署方式,分离的应用配置文件。

等等

4.配置管理

  • 统一账号管理

    所有和用户登录相关的平台、管理工具,尽量接入ldap统一账号管理,这样一个账号可以实现所有系统的统一登录。

  • 自动化配置中心

    在此秉承基础设施即代码的思想,通过ansible作为配置中心,在操作系统层面实现系统初始化、环境初始化、组件初始化、自动化备份等中心化管理,各环境交付统一规格的服务器。

  • 流程管理

    结合jira等工作流工具实现操作的流程化管理。

等等

5.CI/CD

基于统一的运维规范前提下,CI/CD可以真正的做到将以上各个层面的想法、解决方案进行落地。因此CI/CD能力很大程度上决定了我们自动化运维的高度。

  • 持续集成

    代码质量测试、单元测试、打包测试、自动化测试等。

  • 操作系统交付

    遵循统一的运维规范,交付统一规格的操作系统,完成对运维平台各个管理节点的资源注册。

  • 版本发布

支持版本平滑发布、回滚、重启等。

  • 自动打包

    Android/IOS 自动打包并上传至应用商店。

6.监控系统

  • 系统建设

    多维度收集、分析监控数据,实现不同层面的告警;

    对于多维度的数据能够进行分析,实现故障自愈;

  • 监控管理

    监控并不是只要做到告警进行了,而是要做到告警的准确性,因此对告警级别、告警收敛、故障自愈策略等的管理需要我们进行重点关注。

7.安全防护

通过必要的WAF、IDS、防火墙等安全设备进行安全防护、流量分析外,还要结合安全渗透去主动发现问题。

8.数据分析

通过对应用数据、业务数据、运营数据进行集中分析、展示,帮助我们更好的了解系统运行状况。

总结

通过以上各个层面的运维框架和运维依据,希望大家能够结合实际情况进行头脑风暴,做到不止于此。

当然自动化运维建设不是一蹴而就的,需要结合规范、制度、流程去逐步实现。

记住运维建设是过程,不仅仅是目标,我们需要跟随技术潮流趋势,持续的优化与丰富这个过程。

运维思索:自动化运维体系如何入手相关推荐

  1. 智能运维 | 百度自动化运维是怎么做的(上)——概念以及标准从何而来?

    百度是中国互联网规模最大的公司之一.业内很多人都会好奇,百度是怎么做运维的?接下来让我们一起重溯百度运维之路. 百度运维诞生于2008年,截至目前共打造了三代运维平台,百度的运维技术也经历了web化. ...

  2. 企业运维实战--自动化运维Saltstack(上)之saltstack的安装部署、远程执行、grains和pillar详解以及Jinja模板的使用

    企业运维实战--自动化运维Saltstack(上) 前言 一.Saltstack安装部署 二.sls文件远程执行 saltstack安装httpd并启动 saltstack源码编译安装nginx 启动 ...

  3. IT运维之自动化运维

    所谓自动化运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证业务系统7*24小时高效稳定运行.这应该是所有业务系统运维终极目标. 按照运维的发展成熟度来看,运维大致可分为三个阶段: 依靠纯手工 ...

  4. 运维与自动化运维发展概括

    1.运维自动化发展 运维学习和发展的一个线路: 1.搭建服务(部署并运行起来) 2.用好服务(监控.管理.优化) 3.自动化(服务直接的关联和协同工作) 4.产品设计(如何设计一个运维系统) ---- ...

  5. 什么是自动化运维?自动化运维必备技能有哪些?

    万丈高楼平地起,高楼稳不稳取决于地基是否扎实.基础数据便是运维管理这座高楼的地基. 首先介绍一下我们在运维管理中所涉及到的基础数据有哪一些.请看下图: 基础数据大致分为CMDB.日志.生产DB.知识库 ...

  6. 如何做好自动化运维?自动化运维必备技能有哪些?

    万丈高楼平地起,高楼稳不稳取决于地基是否扎实.基础数据便是运维管理这座高楼的地基. 首先介绍一下我们在运维管理中所涉及到的基础数据有哪一些.请看下图: 基础数据大致分为CMDB.日志.生产DB.知识库 ...

  7. 运维思索:运维管理与运维自动化

    简述 各位小伙伴,近期技术文感觉发的有点多,不知是否给大家在工作中解决实际问题带来了一些灵感.为什么这么说呢?因为正是文章中涉及的细小知识点积少成多,让我从零碎繁忙的运维工作中得到了一定程度的解放.相 ...

  8. 网络运维(Python自动化运维)考点

    考试题型 选择题 30 分 简答题 包含进程同步编程题 20 分 综合题 ansible 20 分 复习大纲 第 2 章 基础运维技能 (1)列举 3 种常用字符编码,简述怎样在 str 和 byte ...

  9. mysql 安装 运维_MySQL自动化运维之安装篇

    MySQL安装一般使用RPM或者源码安装的方式. RPM安装的优点是快速,方便.缺点是不能自定义安装目录.如果需要调整数据文件和日志文件的存放位置,还需要进行一些手动调整 源码安装的优点是可以自定义安 ...

  10. 自动化部署、自动化运维、自动化配置

    自动化部署 基于LInux平台的自动化运维Devops--自动化系统部署 DevOps简介 DevOps(Development和Operations)是一种重视"软件开发人员(Dev)&q ...

最新文章

  1. java 比较对象内容是否相同的_Java 比较对象中的内容是否一致
  2. 南邮计算机科学与技术PK杭电,被985录取,却后悔没去杭电南邮,双非热门专业真的这么吃香吗?...
  3. Java 实现基于 UDP 的简单 socket 通信
  4. 【转】setsocketopt getsocketopt比较全的参数说明
  5. 5月25号GE一面经历
  6. Ubuntu 18.04 美化
  7. log4j输出多个自定义日志文件
  8. android手机无法开机自动启动,安卓手机无法开机的6种解决方法
  9. 黑群晖vmm专业版_教你群晖用自带的VMM虚拟机安装精简版win10系统教程
  10. android viewpager实现画廊效果,ViewPager实现2D、3D画廊效果
  11. 适配器模式的三种形式
  12. hr标签html样式,hr标签样式修改及美化(css的hr标签实现精美线条)
  13. Hexo Icarus配置和美化升级
  14. cocos2d_x之AnySDK接入流程
  15. c 语言len函数,巧妙利用LEN、SUBSTITUTE函数,计算EXCEL单元格内某重复字符个数
  16. 传奇服务器怎么设置状态是开区还是合区,传奇私服开区合区教程全解
  17. 行业寒冬下,简历发了几千次已读不回,功能测试的出路在哪里?
  18. [XCode] XCode 6 中修改模拟器版本
  19. textarea去除红色波浪线
  20. python HEIC 转jpg

热门文章

  1. 项目管理工具——SMART原则法
  2. 电力现货市场的业务流程
  3. 兴业证券:资产注入 资本市场的“盛宴”
  4. 《信号与系统》解读 第1章 信号与系统概述-4:时域指数信号与高斯信号
  5. 精华笔记 112314
  6. 静磨机无级调速调压液压系统比例阀放大器
  7. 电机学2——变压器(上)
  8. matlab机器人自动分拣_YOLOv3 + Matlab Robotics ToolBox 实战 -- 软包装药品的机器人分拣系统设计与仿真...
  9. 最新校招京东、百度、头条算法面试真题分享
  10. Python游戏项目:69行代码编写记忆数独游戏